Azure Databricks で Apache Spark MLlib を使用する

[アーティクル]
03/01/2024

このページでは、Azure Databricks 上で MLlib を使用する方法を示すノートブックの例を提示します。

Apache Spark MLlib は、分類、回帰、クラスタリング、協調フィルタリング、次元縮小、基になっている最適化プリミティブなど、一般的な学習アルゴリズムとユーティリティで構成された Apache Spark 機械学習ライブラリです。 MLlib 機能に関するリファレンス情報について、Azure Databricks では次の Apache Spark API リファレンスが勧められています。

R からの Apache Spark MLlib の使用法についての情報は、R 機械学習のドキュメントをご参照ください。

二項分類の例のノートブック

このノートブックでは、Apache Spark MLlib Pipelines API を使用して二項分類アプリケーションを構築する方法を示します。

二項分類ノートブック

ノートブックを入手

デシジョンツリーの例のノートブック

これらの例は、Apache Spark MLlib Pipelines API を使用したデシジョンツリーのさまざまなアプリケーションを示しています。

デシジョンツリー

これらのノートブックは、デシジョンツリーで分類を実行する方法を示しています。

数字認識ノートブックのデシジョンツリー

ノートブックを入手

SFO アンケートノートブックのデシジョンツリー

ノートブックを入手

MLlib パイプラインを使用した GBT 回帰

このノートブックでは、MLlib パイプラインを使用して、曜日、天気、季節などの情報から自転車のレンタル数 (1 時間あたり) を予測する、勾配ブースティング回帰を実行する方法について説明します。

ノートブックを入手

Apache Spark MLlib パイプラインと構造化ストリーミングの例

このノートブックでは、履歴データで Apache Spark MLlib パイプラインをトレーニングし、ストリーミングデータに適用する方法を示します。

MLlib パイプライン構造化ストリーミングノートブック

ノートブックを入手

高度な Apache Spark MLlib ノートブックの例

このノートブックは、カスタムトランスフォーマーを作成する方法を示しています。

カスタムトランスフォーマーノートブック

ノートブックを入手

Azure Databricks で Apache Spark MLlib を使用する

二項分類の例のノートブック

二項分類ノートブック

デシジョン ツリーの例のノートブック

デシジョン ツリー

数字認識ノートブックのデシジョン ツリー

SFO アンケート ノートブックのデシジョンツリー

MLlib パイプラインを使用した GBT 回帰

自転車シェアリング回帰ノートブック

Apache Spark MLlib パイプラインと構造化ストリーミングの例

MLlib パイプライン構造化ストリーミング ノートブック

高度な Apache Spark MLlib ノートブックの例

カスタム トランスフォーマー ノートブック

その他のリソース

デシジョンツリーの例のノートブック

デシジョンツリー

数字認識ノートブックのデシジョンツリー

SFO アンケートノートブックのデシジョンツリー

MLlib パイプライン構造化ストリーミングノートブック

カスタムトランスフォーマーノートブック