Procedure dettagliate del Processo di analisi scientifica dei dati per i team

Le procedure dettagliate end-to-end esposte illustrano i passaggi del processo di data science per i team in scenari specifici. Viene spiegato come combinare strumenti cloud, strumenti locali e servizi in un flusso di lavoro o in una pipeline per creare un'applicazione intelligente. Le procedure dettagliate sono raggruppate in base alla piattaforma in uso:

  • Spark con PySpark e Scala
  • HDInsight (Hadoop)
  • Azure Data Lake
  • SQL Server
  • SQL Data Warehouse

HDInsight Spark con PySpark e Scala

  • La procedura dettagliata relativa all'uso di Spark in Azure HDInsight usa il processo di analisi scientifica dei dati per i team in uno scenario con un cluster Azure HDInsight Spark per archiviare ed esplorare i dati e progettarne le funzionalità in base al set di dati disponibile pubblicamente relativo a corse e tariffe dei taxi nella città di New York.

  • La procedura dettagliata relativa all'uso di Scala con Spark in Azure illustra come usare Scala per attività di Machine Learning con supervisione con la libreria di Machine Learning (MLlib) per Spark e pacchetti SparkML in un cluster Azure HDInsight Spark. Vengono illustrate le attività che costituiscono il processo di analisi scientifica dei dati, ovvero l'inserimento e l'esplorazione dei dati, la visualizzazione, la progettazione, la modellazione e l'utilizzo dei modelli. I modelli creati includono la regressione logistica e quella lineare, foreste casuali e alberi con boosting a gradienti.

Hadoop HDInsight

Azure Data Lake

  • La procedura dettagliata relativa all'uso di Azure Data Lake per l'analisi scientifica dei dati illustra come usare Azure Data Lake per eseguire attività di esplorazione dei dati e di classificazione binaria su un campione del set di dati relativo ai taxi nella città di New York, per prevedere se un cliente lascerà o meno una mancia.

SQL Server e SQL Data Warehouse

  • La procedura dettagliata relativa all'uso di SQL Data Warehouse illustra come compilare e distribuire modelli di classificazione e regressione di Machine Learning usando SQL Data Warehouse (SQL DW) per un set di dati disponibile pubblicamente relativo a corse e tariffe dei taxi nella città di New York.

  • La procedura dettagliata relativa all'uso di SQL Server illustra come compilare e distribuire modelli di classificazione e regressione di Machine Learning usando SQL Server per un set di dati disponibile pubblicamente relativo a corse e tariffe dei taxi nella città di New York.

  • La procedura dettagliata relativa all'uso di servizi R per SQL Server offre ai data scientist una combinazione di codice R, dati SQL Server e funzioni SQL personalizzate per compilare e distribuire un modello R in SQL Server.

  • La procedura dettagliata relativa all'uso di T-SQL con i servizi R per SQL Server offre ai programmatori SQL indicazioni per la compilazione di una soluzione di analisi avanzata con Transact-SQL usando i servizi R per SQL Server per rendere operativa una soluzione R.

  • La procedura dettagliata relativa all'uso di T-SQL con i servizi Python per SQL Server offre ai programmatori SQL indicazioni per la compilazione di una soluzione di apprendimento automatico in SQL Server. Illustra come incorporare Python in un'applicazione aggiungendo il codice Python alle stored procedure.

Passaggi successivi

Per una panoramica degli argomenti che forniscono informazioni dettagliate sulle attività che costituiscono il processo di analisi scientifica dei dati in Azure, vedere Processo di analisi scientifica dei dati per i team.