Azure Databricks で Apache Spark を使用する

中級
データ エンジニア
Azure Databricks

Azure Databricks は Apache Spark 上に構築されており、データ エンジニアやアナリストは Spark ジョブを実行して、大規模なデータの変換、分析、視覚化を行うことができます。

学習の目的

このモジュールでは、次の方法を学習します。

  • Apache Spark アーキテクチャの重要な要素について説明します。
  • Spark クラスターを作成して構成します。
  • Spark のユース ケースについて説明します。
  • Spark を使用して、ファイルに格納されているデータを処理および分析します。
  • Spark を使用してデータを視覚化します。

前提条件

このモジュールを開始する前に、Azure Databricks に関する基本的な知識が必要です。 このモジュールの前に、「Azure Databricks を探索する」のモジュールを完了することをご検討ください。