Azure Machine Learning デザイナー (v2) とは何か?
Azure Machine Learning デザイナーは、Azure Machine Learning ワークスペースで機械学習パイプラインを構築するためのドラッグ アンド ドロップ UI インターフェイスです。
以下の GIF に示すように、構成要素をドラッグ アンド ドロップして接続することで、パイプラインを視覚的に構築できます。
注意
デザイナーは、従来の事前構築済みコンポーネント (v1) とカスタム コンポーネント (v2) の 2 種類のコンポーネントをサポートしています。 これら 2 種類のコンポーネントには互換性がありません。
従来の事前構築済みコンポーネントは典型的なデータ処理および回帰と分類を含む機械学習のタスクをサポートしています。 従来の事前構築済みコンポーネントは引き続きサポートされますが、新しいコンポーネントは追加されません。
カスタム コンポーネントを使用すると、ワークスペース間での共有と、Azure Machine Learning スタジオ、CLI v2、SDK v2 インターフェイスにわたるシームレスな作成を可能にするコンポーネントとして独自のコードをラップすることができます。
カスタム コンポーネントは AzureML V2 と互換性があり、新しく更新され続けるので、新しいプロジェクトではカスタム コンポーネントを使用することを強くお勧めします。
この記事は、カスタム コンポーネントを対象とします。
アセット
パイプラインの構成要素は、Azure Machine Learning 内ではアセットと呼ばれ、次のものが含まれます。
デザイナーでは、左側にアセット ライブラリがあり、パイプラインの作成に必要なすべてのアセットにアクセスできます。 ここにはワークスペースで作成したアセットと、アクセス許可を持つレジストリで共有されているアセットの両方が表示されます。
特定のレジストリのアセットを表示するには、アセット ライブラリの上にある [レジストリ名 フィルター] を選択します。 現在のワークスペースで作成したアセットは、レジストリ = ワークスペースにあります。 Azure Machine Learning によって提供されるアセットは、レジストリ = azureml にあります。
デザイナーには、ワークスペースで作成して名前を付けたアセットのみが表示されます。 アセット ライブラリに名前のないアセットは表示されません。 データ アセットとコンポーネント アセットを作成する方法について確認するには、次の記事を参照してください。
パイプライン
デザイナーは、アセットを使用してパイプラインを視覚的な方法で作成できるツールです。 デザイナーを使用すると、パイプライン ドラフトとパイプライン ジョブというパイプラインに関連する 2 つの概念が出てきます。
パイプラインのドラフト
デザイナーでパイプラインを編集している間、進捗はパイプラインのドラフトとして保存されます。 コンポーネントの追加または削除、コンピューティング先の構成、パラメーターの作成などを行って、パイプラインのドラフトをいつでも編集することができます。
有効なパイプライン ドラフトには、次のような特性があります。
- データ資産は、コンポーネントにのみ接続できる。
- コンポーネントは、データ アセットか別のコンポーネントのどちらかにのみ接続できます。
- コンポーネント用に要求するすべての入力ポートには、データ フローへの何らかの接続がある必要があります。
- 各コンポーネントの必須パラメーターがすべて設定されている必要がある。
パイプラインのドラフトを実行する準備ができたら、パイプライン ジョブを送信します。
パイプライン ジョブ
パイプラインを実行するたびに、パイプラインの構成とその結果が、パイプライン ジョブとしてワークスペースに格納されます。 任意のパイプライン ジョブに戻り、トラブルシューティングや監査のために検査することができます。 パイプライン ジョブのクローンによって、続けて編集できる新しいパイプライン ドラフトが作成されます。
デザイナーでパイプラインを構築する方法
新しいパイプラインを最初から作成する
新しいパイプラインを最初から作成し、ビルドできます。 デザイナーでパイプラインを作成するときは、必ず [カスタム コンポーネント] オプションを選択してください。
既存のパイプライン ジョブをクローンする
ワークスペースの既存のパイプライン ジョブに基づいて作業したい場合は、それを新しいパイプライン ドラフトに簡単に複製して、編集を続けることができます。
複製した後は、[系列の表示] を選んで、複製元のパイプライン ジョブを確認することもできます。
パイプラインを編集してから、もう一度送信できます。 送信した後は、ジョブの詳細ページで [系列の表示] を選んで、送信したジョブと元のジョブの間で系列を確認できます。