Azure Synapse Apache Spark プールで Data Engineering を実行する

中級
データ エンジニア
Azure Synapse Analytics

Apache Spark は、ビッグ データの分析と変換のための拡張性の高い分散処理ソリューションです。 Spark プールを使用して、Azure Synapse Analytics でその機能を活用できます。

前提条件

このラーニング パスを開始する前に、Azure Synapse Analytics についてよく理解しておく必要があります。 まず、「Azure Synapse Analytics の概要」モジュールを完了することを検討してください。

このラーニング パス内のモジュール

Apache Spark は、大規模なデータ分析のためのコア テクノロジです。 Azure Synapse Analytics で Spark を使用して、データ レイク内のデータを分析および視覚化する方法について説明します。

データ エンジニアは、通常、大量のデータを変換する必要があります。 Azure Synapse Analytics の Apache Spark プールは、この目標を達成するために使用できる分散処理プラットフォームを備えています。

Delta Lake は、Azure Synapse Analytics でデータ レイクハウス アーキテクチャを実装するために使用できる Spark 用のオープンソース リレーショナル ストレージ領域です。