Azure Databricks での機械学習の概要

このノートブックでは、Azure Databricks の機械学習モデルのトレーニングの概要を簡単に説明します。 モデルをトレーニングするには、Databricks Runtime ML にプレインストールされている scikit-learn などのライブラリを使用できます。 さらに、MLflow を使用してトレーニング済みのモデルを追跡し、Hyperopt を SparkTrials と併用してハイパーパラメーターのチューニングをスケーリングできます。

このチュートリアルでは、MLflow を使用してモデルの開発を追跡し、Hyperopt を使用してモデルのパフォーマンスを向上させる、単純な分類モデルをトレーニングします。 モデルのライフサイクル管理やモデル推論など、Databricks での機械学習の実運用の詳細については、機械学習のエンドツーエンドの例に関する記事を参照してください。

Azure Databricks をすばやく開始するためのその他のノートブック例については、「10 分間チュートリアル: Azure Databricks での機械学習の概要」を参照してください。

要件

Databricks Runtime 7.5 ML 以降。

Note

Databricks Runtime 7.5 ML 以降にアクセスできない場合は、「Azure Databricks での Scikit-learn の概要」(Databricks Runtime 7.0 ML 以上) または「Azure Databricks で機械学習モデルを構築するためのエンドツーエンドの例」(Databricks Runtime 6.5 ML 以上) を参照してください。

ノートブックの例

機械学習のクイックスタート ノートブック

ノートブックを入手