Korzystanie z platformy Apache Spark w usłudze Azure Databricks

Średni
Data Engineer
Azure Databricks

Usługa Azure Databricks jest oparta na platformie Apache Spark i umożliwia inżynierom danych i analitykom uruchamianie zadań platformy Spark w celu przekształcania, analizowania i wizualizowania danych na dużą skalę.

Cele szkolenia

Ten moduł obejmuje następujące zagadnienia:

  • Opisz kluczowe elementy architektury platformy Apache Spark.
  • Tworzenie i konfigurowanie klastra Spark.
  • Opis przypadków użycia platformy Spark.
  • Platforma Spark umożliwia przetwarzanie i analizowanie danych przechowywanych w plikach.
  • Wizualizowanie danych przy użyciu platformy Spark.

Wymagania wstępne

Przed rozpoczęciem tego modułu musisz mieć podstawową wiedzę na temat usługi Azure Databricks. Przed tym rozważ ukończenie modułu Eksploruj usługę Azure Databricks .