Monitorare e gestire i carichi di lavoro di ingegneria dei dati con Apache Spark in Azure Synapse Analytics

Intermedio
Data engineer
Azure Synapse Analytics

Informazioni su come monitorare e gestire i carichi di lavoro di ingegneria dei dati con Apache Spark in Azure Synapse Analytics.

Obiettivi di apprendimento

Dopo avere completato questo modulo, si sarà in grado di:

  • Monitorare i pool di Spark in Azure Synapse Analytics
  • Comprendere l'utilizzo delle risorse dei pool di Spark in Azure Synapse Analytics
  • Monitorare l'attività di query dei pool di Spark in Azure Synapse Analytics
  • Impostare la baseline delle prestazioni di Apache Spark con il server cronologia Apache Spark in Azure Synapse Analytics
  • Ottimizzare i processi di Apache Spark in Azure Synapse Analytics
  • Automatizzare il ridimensionamento dei pool di Apache Spark in Azure Synapse Analytics

Prerequisiti

Prima di iniziare questo modulo, è consigliabile completare i moduli seguenti:

  • Concetti fondamentali sui dati
  • Introduzione al servizio Azure Data Factory
  • Introduzione ad Azure Synapse Analytics