O ciclo de vida do Processo de Ciência de Dados de Equipe

O TDSP (Processo de Ciência de Dados da Equipe) fornece um ciclo de vida que a sua equipe pode usar para estruturar seus projetos de ciência de dados. O ciclo de vida descreve as etapas que você pode executar para concluir um projeto com êxito.

Você deve usar esse ciclo de vida se tiver um projeto de ciência de dados que faça parte de um aplicativo inteligente. Aplicativos inteligentes implantam modelos de aprendizado de máquina ou IA para análise preditiva. Você também pode usar esse processo para projetos exploratórios de ciência de dados e projetos de análise improvisados, mas talvez não seja necessário implementar todas as etapas do ciclo de vida.

Sua equipe pode combinar o TDSP baseado em tarefas com outros ciclos de vida da ciência de dados, como o processo padrão para mineração de dados (CRISP-DM) intersetorial, o processo de descoberta de conhecimento em bancos de dados, (KDD) ou o próprio processo personalizado da sua organização.

Propósito e credibilidade

O objetivo do TDSP é simplificar e padronizar sua abordagem para projetos de ciência de dados e IA. A Microsoft aplicou essa metodologia estruturada em centenas de projetos. Os pesquisadores estudaram o TDSP e publicaram suas conclusões na literatura revisada por pares. A estrutura arquitetônica do TDSP é exaustivamente testada e comprovadamente eficaz em muitas áreas.

Cinco estágios do ciclo de vida

O ciclo de vida do TDSP é composto por cinco estágios principais que sua equipe executa de forma iterativa. Esses estágios incluem:

Esta é uma representação visual do ciclo de vida do TDSP:

Diagram that shows the stages of the TDSP lifecycle.

O ciclo de vida do TDSP é uma sequência de etapas que fornece orientação para a criação de modelos preditivos. Sua equipe implanta os modelos preditivos no ambiente de produção que você planeja usar para criar aplicativos inteligentes. A meta deste ciclo de vida do processo é navegar por um projeto de ciência de dados em direção a um ponto de extremidade claro de engajamento. A ciência de dados é um exercício de pesquisa e descoberta. Quando você usa um processo bem definido para comunicar tarefas à sua equipe, você aumenta a chance de realizar com sucesso um projeto de ciência de dados.

Cada etapa tem seu próprio artigo que descreve:

  • Metas: os objetivos da etapa.
  • Como fazer: um esboço das tarefas que você executa na etapa e orientação sobre como concluí-las.
  • Artefatos: os produtos que você precisa produzir durante a etapa e os recursos que você pode usar para criá-los.

Citações revisadas por pares

Os pesquisadores publicam literatura revisada por pares sobre o TDSP. Analise o material a seguir para investigar os recursos e aplicativos do TDSP.

Colaboradores

Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.

Autor principal:

Para ver perfis não públicos do LinkedIn, entre no LinkedIn.