モデルトレーニングの例

[アーティクル]
03/01/2024

このセクションには、多くの一般的なオープンソースライブラリを使用して、Azure Databricks で機械学習モデルをトレーニングする方法を示す例があります。

さらに、AutoML を使用すれば、モデルトレーニング用のデータセットを自動的に準備し、scikit-learn や XGBoost などのオープンソースライブラリを使用して一連のトライアルを実行し、トライアルの実行ごとにソースコードを含む Python ノートブックを作成して、コードを確認、再現、変更できます。

Unity Catalog のデータを使用する機械学習モデルをトレーニングし、予測を Unity Catalog に書き戻す方法を示すノートブックの例については、「Unity Catalog で機械学習モデルをトレーニングして登録する」を参照してください。

機械学習の例

Package	ノートブック	機能
scikit-learn	機械学習のチュートリアル	分類モデル、MLflow、Hyperopt および MLｆlow を使用したハイパーパラメーターの自動チューニング
scikit-learn	エンドツーエンドの例	分類モデル、MLflow、 Hyperopt および MLflow を使用したハイパーパラメーターの自動チューニング、モデルレジストリ、モデルの提供
MLlib	MLlib の例	二項分類、デシジョンツリー、GBT 回帰、構造化ストリーミング、カスタムトランスフォーマー
xgboost	XGBoost の例	Python、PySpark、Scala、単一ノードワークロード、分散トレーニング

ハイパーパラメーターチューニングの例

Azure Databricks でのハイパーパラメーターのチューニングに関する一般的な情報については、「ハイパーパラメーターの調整」を参照してください。

Package	ノートブック	機能
Hyperopt	分散 hyperopt	分散 hyperopt、scikit-learn、MLflow
Hyperopt	モデルの比較	分散 hyperopt を使用して、ハイパーパラメーター空間でさまざまなモデルの種類を同時に検索します
Hyperopt	分散トレーニングのアルゴリズムと hyperopt	Hyperopt、MLlib
Hyperopt	Hyperopt のベストプラクティス	さまざまなサイズのデータセットでのベストプラクティス

モデル トレーニングの例

機械学習の例

ハイパーパラメーター チューニングの例

その他のリソース

モデルトレーニングの例

ハイパーパラメーターチューニングの例