Azure Databricks を使用してデータからナレッジと分析情報を抽出する

中級
データ サイエンティスト
Azure
Databricks

Azure Databricks を使用して、探索的データ分析、モデルのトレーニング、テキスト分析、ディープ ラーニングなどの予測と分析データ サイエンス手法を実行する方法について説明します。

前提条件

Azure サブスクリプション。

このラーニング パス内のモジュール

Azure Databricks と Apache Spark のノートブックについて学習します。

Azure Databricks を使用して複数のデータ ソースを操作し、Azure SQL Database などのファイルおよびデータ ストアからの入力を結合し、そのデータを高度な分析向けに変換して格納します。

Azure Databricks ノートブックを使用して基本的および高度な探索的データ分析を行う方法の基礎について説明します。

データ サイエンティストであれば、機械学習モデルをトレーニングして予測精度を高くすることが重要です。 このモジュールでは、機械学習モデルをトレーニングするための基本的および高度な手法と、それらの手法が Azure Databricks でどのようにサポートされているかについて説明します。

このモジュールでは、ニューラル ネットワークに基づく機械学習モデルを開発するための手法を調べます。 このモジュールの主な目的は、ディープ ラーニングについての理解を深めることです。

このモジュールでは、テキスト分析で使用される機械学習モデルを開発するための手法を調べます。 これは、その最も重要ないくつかの側面を示す 2 つの異なるテキスト分析シナリオ (ムービーの分類や要求の分類) を適用して行います。