Ciclo di vita del processo di data science per i team

Il processo di data science per i team (TDSP) fornisce un ciclo di vita che il team può usare per strutturare i progetti di data science. Il ciclo di vita descrive i passaggi che è possibile eseguire per completare correttamente un progetto.

È consigliabile usare questo ciclo di vita se si dispone di un progetto di data science che fa parte di un'applicazione intelligente. Le applicazioni intelligenti distribuiscono modelli di Machine Learning o intelligenza artificiale per l'analisi predittiva. È anche possibile usare questo processo per progetti esplorativi di data science e progetti di analisi improvvisati, ma potrebbe non essere necessario implementare ogni passaggio del ciclo di vita.

Il team può combinare il TDSP basato su attività con altri cicli di vita di data science, ad esempio il processo standard cross-industry per il data mining (CRISP-DM), il processo di individuazione delle informazioni nei database (KDD) o il processo personalizzato dell'organizzazione.

Scopo e credibilità

Lo scopo di TDSP è semplificare e standardizzare l'approccio ai progetti di data science e intelligenza artificiale. Microsoft ha applicato questa metodologia strutturata in centinaia di progetti. I ricercatori hanno studiato TDSP e pubblicato i loro risultati nella letteratura peer-reviewed. Il framework architettonico del TDSP è testato e dimostrato accuratamente efficace in molte aree.

Cinque fasi del ciclo di vita

Il ciclo di vita del TDSP è costituito da cinque fasi principali eseguite dal team in modo iterativo. Queste fasi includono:

Ecco una rappresentazione visiva del ciclo di vita di TDSP:

Diagram that shows the stages of the TDSP lifecycle.

Il ciclo di vita di TDSP è una sequenza di passaggi che forniscono indicazioni per la creazione di modelli predittivi. Il team distribuisce i modelli predittivi in un ambiente di produzione che si prevede di usare per creare applicazioni intelligenti. L'obiettivo di questo ciclo di vita del processo è spostarsi in un progetto di data science verso un endpoint di engagement chiaro. Con data science si intente un esercizio nell'ambito della ricerca e dell'individuazione. Quando si usa un processo ben definito per comunicare le attività al team, si aumenta la possibilità di eseguire correttamente un progetto di data science.

Ogni fase ha un proprio articolo che descrive:

  • Obiettivi: obiettivi della fase.
  • Procedura: una descrizione delle attività eseguite nella fase e indicazioni su come completarle.
  • Artefatti: risultati finali che è necessario produrre durante la fase e le risorse che è possibile usare per crearli.

Citazioni con peer reviewing

I ricercatori pubblicano letteratura peer-reviewed sul TDSP. Esaminare il materiale seguente per esaminare le funzionalità e le applicazioni TDSP.

Collaboratori

Questo articolo viene gestito da Microsoft. Originariamente è stato scritto dai seguenti contributori.

Autore principale:

Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.