O ciclo de vida do Processo de Ciência de Dados de EquipeThe Team Data Science Process lifecycle

O TDSP (Processo de Ciência de Dados da Equipe) fornece um ciclo de vida recomendado que você pode usar para estruturar seus projetos de ciência de dados.The Team Data Science Process (TDSP) provides a recommended lifecycle that you can use to structure your data-science projects. O ciclo de vida descreve as etapas, do início ao fim, que os projetos normalmente seguem quando são executados.The lifecycle outlines the steps, from start to finish, that projects usually follow when they are executed. Se usar outro ciclo de vida de ciência de dados, como CRISP-DM (Processo Padrão para Data Mining), KDD (Descoberta de Conhecimento em Banco de Dados) ou o próprio processo personalizado da sua organização, você ainda poderá usar o TDSP baseado em tarefas.If you use another data-science lifecycle, such as the Cross Industry Standard Process for Data Mining (CRISP-DM), Knowledge Discovery in Databases (KDD), or your organization's own custom process, you can still use the task-based TDSP.

Esse ciclo de vida foi projetado para projetos de ciência de dados que devem ser fornecidos como parte de aplicativos inteligentes.This lifecycle is designed for data-science projects that are intended to ship as part of intelligent applications. Esses aplicativos implantam modelos de machine learning ou de inteligência artificial para análise preditiva.These applications deploy machine learning or artificial intelligence models for predictive analytics. Os projetos de ciência de dados exploratórios e os projetos de análise ad hoc também podem se beneficiar do uso desse processo.Exploratory data-science projects and ad hoc analytics projects can also benefit from the use of this process. Mas, para esses projetos, algumas das etapas descritas aqui podem não ser necessárias.But for those projects, some of the steps described here might not be needed.

Cinco estágios do ciclo de vidaFive lifecycle stages

O ciclo de vida do TDSP é composto por cinco estágios principais executados de forma iterativa.The TDSP lifecycle is composed of five major stages that are executed iteratively. Esses estágios incluem:These stages include:

  1. Noções básicas sobre negóciosBusiness understanding
  2. Aquisição de dados e entendimentoData acquisition and understanding
  3. ModelagemModeling
  4. ImplantaçãoDeployment
  5. Aceitação do clienteCustomer acceptance

Aqui está uma representação visual do ciclo de vida do TDSP:Here is a visual representation of the TDSP lifecycle:

Ciclo de vida do TDSP

O ciclo de vida do TDSP é modelado como uma sequência de etapas iteradas que fornecem diretrizes sobre as tarefas necessárias para usar os modelos preditivos.The TDSP lifecycle is modeled as a sequence of iterated steps that provide guidance on the tasks needed to use predictive models. Implante os modelos preditivos no ambiente de produção que você planeja usar para criar aplicativos inteligentes.You deploy the predictive models in the production environment that you plan to use to build the intelligent applications. A meta deste ciclo de vida do processo é dar continuidade a um projeto de ciência de dados em direção a um ponto final claro de engajamento.The goal of this process lifecycle is to continue to move a data-science project toward a clear engagement end point. A ciência de dados é um exercício de pesquisa e descoberta.Data science is an exercise in research and discovery. A capacidade de comunicar tarefas para sua equipe e seus clientes usando um conjunto bem definido de artefatos que empregam modelos padronizados ajuda a evitar confusão.The ability to communicate tasks to your team and your customers by using a well-defined set of artifacts that employ standardized templates helps to avoid misunderstandings. Usar esses modelos também aumenta a chance da concluir um projeto de ciência de dados complexo com êxito.Using these templates also increases the chance of the successful completion of a complex data-science project.

Para cada estágio, fornecemos as seguintes informações:For each stage, we provide the following information:

  • Metas: Os objetivos específicos.Goals: The specific objectives.
  • Como fazer isso: Uma estrutura de tópicos de tarefas específicas e diretrizes sobre como conclui-las.How to do it: An outline of the specific tasks and guidance on how to complete them.
  • Artefatos: As entregas e o suporte para produzi-las.Artifacts: The deliverables and the support to produce them.

Próximas etapasNext steps

Fornecemos passo a passo completos que demonstram todas as etapas do processo para cenários específicos.We provide full end-to-end walkthroughs that demonstrate all the steps in the process for specific scenarios. O artigo Passo a passos de exemplo fornece uma lista dos cenários com descrições de links e miniaturas.The Example walkthroughs article provides a list of the scenarios with links and thumbnail descriptions. Os passo a passo ilustram como combinar ferramentas e serviços de nuvem e locais em um fluxo de trabalho ou pipeline para criar um aplicativo inteligente.The walkthroughs illustrate how to combine cloud, on-premises tools, and services into a workflow or pipeline to create an intelligent application.

Para obter exemplos de como executar etapas nos TDSPs que usam o Azure Microsoft Azure Machine Learning Studio, consulte Use the TDSP with Azure Machine Learning (Usar o TDSP com o Azure Machine Learning).For examples of how to execute steps in TDSPs that use Azure Machine Learning Studio, see Use the TDSP with Azure Machine Learning.