MLflow 実験の概要

[アーティクル]
03/01/2024

このノートブックのコレクションでは、MLflow 実験の実行を開始して実行する方法を示します。

MLflow コンポーネント

MLflow は、エンドツーエンドの機械学習ライフサイクルを管理するためのオープンソースプラットフォームです。 MLflow には 3 つの主要なコンポーネントがあります。

追跡
モデル
プロジェクト

MLflow の追跡コンポーネントを使用すると、次の API を使用して、マシンモデルのトレーニングセッション ("実行") をログに記録し、クエリを実行できます。

MLflow "実行" は、機械学習モデルのトレーニングプロセスに関連するパラメーター、メトリック、タグ、アーティファクトのコレクションです。

MLflow の実験とは

"実験" は、MLflow の組織の主要単位です。すべての MLflow 実行は、実験に属します。各実験により、実行を視覚化、検索、比較できるだけでなく、他のツールで分析するために実行成果物またはメタデータをダウンロードできます。実験は、Azure Databricks でホストされている MLflow 追跡サーバーで保持されます。

実験は、ワークスペースファイルツリーにあります。実験の管理は、フォルダー、ノートブック、ライブラリなど、他のワークスペースオブジェクトの管理と同じツールを使用して行います。

MLflow ノートブックの例

次のノートブックでは、MLflow 追跡 API を使用して MLflow 実行を作成してログに記録する方法と、実験 UI を使用して実行を表示する方法について説明します。これらのノートブックは、Python、Scala、R で利用できます。

Python および R のノートブックでは、ノートブックの実験を使用します。 Scala ノートブックでは、Shared フォルダーに実験が作成されます。

Note

Databricks Runtime 10.4 LTS ML 以降では、Python ノートブックで Databricks Autologging が既定で有効になっています。

MLflow 実験の概要

MLflow コンポーネント

MLflow の実験とは

MLflow ノートブックの例

その他のリソース