在 Azure Databricks 中使用 Apache Spark

中級
資料工程師
Azure Databricks

Azure Databricks 是以 Apache Spark 為基礎所建置,可讓資料工程師和分析師執行 Spark 作業,以大規模轉換、分析和視覺化資料。

學習目標

在本課程模組中,您將了解如何:

  • 描述 Apache Spark 結構的重要元素。
  • 建立和設定 Spark 叢集。
  • 描述 Spark 的使用案例。
  • 使用 Spark 來處理和分析儲存在檔案中的資料。
  • 使用 Spark 將資料視覺化。

必要條件

開始此課程模組之前,您應該具備 Azure Databricks 的基本知識。 請考慮在此課程模組之前完成探索 Azure Databricks 課程模組。