Fase di distribuzione del ciclo di vita del processo di data science per i team

Questo articolo descrive gli obiettivi, le attività e i risultati finali associati alla distribuzione del processo di data science per i team. Questo processo fornisce un ciclo di vita consigliato che il team può usare per strutturare i progetti di data science. Il ciclo di vita descrive le fasi principali eseguite dal team, spesso iterativamente:

  • Comprensione del business
  • Acquisizione e comprensione dei dati
  • Modellazione
  • Distribuzione
  • Accettazione del cliente

Ecco una rappresentazione visiva del ciclo di vita di TDSP:

Diagram that shows the stages of the TDSP lifecycle.

Goal

L'obiettivo della fase di distribuzione è distribuire modelli con una pipeline di dati in un ambiente di produzione o di produzione per l'accettazione finale del cliente.

Come completare l'attività

L'attività principale per questa fase consiste nell'rendere operativo il modello. distribuire il modello e la pipeline in un ambiente di produzione o di simil-produzione per l'utilizzo da parte dell'applicazione.

Rendere operativo un modello

Dopo aver creato un set di modelli che funzionano correttamente, il team può renderli operativi per consentire ad altre applicazioni di utilizzarli. In base ai requisiti aziendali, le previsioni vengono eseguite in tempo reale o in batch. Per distribuire i modelli, è possibile esporli con un'interfaccia API. Con un'interfaccia, gli utenti possono usare facilmente il modello da varie applicazioni, ad esempio:

  • Siti Web
  • Fogli di calcolo
  • Dashboard
  • Applicazioni line-of-business
  • Applicazioni back-end

Per alcuni esempi di operazionalizzazione de modello con Azure Machine Learning, vedere Distribuire modelli di apprendimento automatico in Azure. È consigliabile compilare il monitoraggio nel modello di produzione e nella pipeline di dati distribuita. Questa procedura consente allo stato del sistema successivo di segnalare eventuali problemi e risolverli.

Integrazione con MLflow

Per supportare questa fase, è possibile incorporare le funzionalità di Azure Machine Learning seguenti:

  • Gestione dei modelli: per preparare una distribuzione, inserire un modello in un ambiente di produzione o operativo. MLflow gestisce i modelli pronti per la distribuzione e le versioni, che consentono di migliorare l'operazionalizzazione.

  • Gestione e distribuzione dei modelli: le funzionalità di gestione del modello di MLflow facilitano il processo di distribuzione, in modo da poter gestire facilmente i modelli in vari ambienti.

Artifacts

In questa fase il team offre:

  • Dashboard di stato che visualizza le metriche relative all'integrità del sistema e alle metriche chiave. È consigliabile usare Power BI per creare un dashboard.

  • Report di modellazione finale con i dettagli della distribuzione.

  • Documento finale dell'architettura della soluzione.

Letteratura con revisione peer

I ricercatori pubblicano studi sul TDSP nella letteratura con revisione peer. Le citazioni offrono l'opportunità di analizzare altre applicazioni o idee simili al TDSP, inclusa la fase del ciclo di vita della distribuzione.

Collaboratori

Questo articolo viene gestito da Microsoft. Originariamente è stato scritto dai seguenti contributori.

Autore principale:

Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.

Questi articoli descrivono le altre fasi del ciclo di vita di TDSP: