MLflow 実験の概要

このノートブックのコレクションでは、MLflow 実験の実行を開始して実行する方法を示します。

MLflow コンポーネント

MLflow は、エンド ツー エンドの機械学習ライフサイクルを管理するためのオープンソース プラットフォームです。 MLflow には 3 つの主要なコンポーネントがあります。

  • 追跡
  • モデル
  • プロジェクト

MLflow の追跡コンポーネントを使用すると、次の API を使用して、マシン モデルのトレーニング セッション ("実行") をログに記録し、クエリを実行できます。

MLflow "実行" は、機械学習モデルのトレーニング プロセスに関連するパラメーター、メトリック、タグ、アーティファクトのコレクションです。

MLflow の実験とは

"実験" は、MLflow の組織の主要単位です。すべての MLflow 実行は、実験に属します。 各実験により、実行を視覚化、検索、比較できるだけでなく、他のツールで分析するために実行成果物またはメタデータをダウンロードできます。 実験は、Azure Databricks でホストされている MLflow 追跡サーバーで保持されます。

実験は、ワークスペース ファイル ツリーにあります。 実験の管理は、フォルダー、ノートブック、ライブラリなど、他のワークスペース オブジェクトの管理と同じツールを使用して行います。

MLflow ノートブックの例

次のノートブックでは、MLflow 追跡 API を使用して MLflow 実行を作成してログに記録する方法と、実験 UI を使用して実行を表示する方法について説明します。 これらのノートブックは、Python、Scala、R で利用できます。

Python および R のノートブックでは、ノートブックの実験を使用します。 Scala ノートブックでは、Shared フォルダーに実験が作成されます。

Note

Databricks Runtime 10.4 LTS ML 以降では、Python ノートブックで Databricks Autologging が既定で有効になっています。