Använda Apache Spark i Azure Databricks

Medel
Data Engineer
Azure Databricks

Azure Databricks bygger på Apache Spark och gör det möjligt för datatekniker och analytiker att köra Spark-jobb för att transformera, analysera och visualisera data i stor skala.

Utbildningsmål

I den här modulen kommer du att:

  • Beskriv viktiga element i Apache Spark-arkitekturen.
  • Skapa och konfigurera ett Spark-kluster.
  • Beskriv användningsfall för Spark.
  • Använd Spark för att bearbeta och analysera data som lagras i filer.
  • Använd Spark för att visualisera data.

Förutsättningar

Innan du startar den här modulen bör du ha grundläggande kunskaper om Azure Databricks. Överväg att slutföra modulen Utforska Azure Databricks före den här.