Eseguire operazioni di ingegneria dei dati con pool di Apache Spark di Azure Synapse

Intermedio
Data engineer
Synapse Analytics

Informazioni su come eseguire operazioni di ingegneria dei dati con i pool di Apache Spark di Azure Synapse, che consentono di migliorare le prestazioni delle applicazioni per l'analisi di Big Data tramite il cluster computing in memoria.

Prerequisiti

  • Si consiglia agli studenti di completare i Concetti fondamentali sui dati prima di iniziare questo percorso di apprendimento.

Moduli in questo percorso di apprendimento

Informazioni su come distinguere i pool di Apache Spark, Azure Databricks, HDInsight e SQL e sui casi d'uso di ingegneria dei dati con Apache Spark in Azure Synapse Analytics.

Informazioni su come inserire dati usando Apache Spark notebook in Azure Synapse Analytics.

Di seguito viene descritto come trasformare i dati usando dataframe in pool di Apache Spark in Azure Synapse Analytics.

Informazioni su come integrare pool SQL e di Apache Spark in Azure Synapse Analytics.

Informazioni su come monitorare e gestire i carichi di lavoro di ingegneria dei dati con Apache Spark in Azure Synapse Analytics.