クラスタリングモデルのトレーニング

[アーティクル]
06/01/2023

この記事では Azure Machine Learning デザイナーのコンポーネントについて説明します。

このコンポーネントを使用して、クラスタリングモデルをトレーニングします。

このコンポーネントは、K-Means Clustering (K-Means クラスタリング) コンポーネントを使用して既に構成済みのトレーニングされていないクラスタリングモデルを取得し、ラベル付きまたはラベルなしデータセットを使用してそのモデルをトレーニングします。このコンポーネントは、予測に使用できるトレーニング済みモデルと、トレーニングデータの各ケースに対するクラスター割り当てセットの両方を作成します。

注意

機械学習モデルをトレーニングするための汎用コンポーネントであるモデルのトレーニングコンポーネントを使用して、クラスタリングモデルをトレーニングすることはできません。これは、Train Model (モデルのトレーニング) が教師あり学習アルゴリズムでのみ動作するためです。 K 平均法と他のクラスタリングアルゴリズムは教師なし学習を可能にします。これは、アルゴリズムがラベルなしデータから学習できることを意味します。

クラスタリングモデルのトレーニングの使用方法

Train Clustering Model (クラスタリングモデルのトレーニング) コンポーネントをデザイナーの自分のパイプラインに追加します。このコンポーネントは、Machine Learning コンポーネントの [トレーニング] カテゴリにあります。
K-Means Clustering (K-Means クラスタリング) コンポーネント、または互換性のあるクラスタリングモデルを作成する別のカスタムコンポーネントを追加し、クラスタリングモデルのパラメーターを設定します。
[Train Clustering Model]\(クラスタリングモデルのトレーニング\) の右側の入力にトレーニングデータセットをアタッチします。
[Column Set]\(列セット\) で、クラスターの構築に使用するデータセットの列を選択します。適切な特徴となる列を必ず選択してください。たとえば、一意の値を持つ ID やその他の列、またはすべて同じ値を持つ列は使用しないようにします。

ラベルが使用可能な場合は、特徴として使用することも、除外することもできます。
トレーニングデータを新しいクラスターラベルとともに出力する場合は、[Check for append or uncheck for result only]\(追加をチェックまたは結果のみをチェック解除\) オプションを選択します。

このオプションの選択を解除すると、クラスターの割り当てだけが出力されます。
パイプラインを送信するか、Train Clustering Model (クラスタリングモデルのトレーニング) コンポーネントをクリックして [選択した項目を実行] を選択します。

結果

トレーニングの完了後、次の作業を行います。

トレーニングされたモデルのスナップショットを保存するには、 [モデルのトレーニング] コンポーネントの右側のパネルにある [出力] タブを選択します。 [データセットの登録] アイコンを選んで、再利用可能なコンポーネントとしてモデルを保存します。
モデルからスコアを生成するには、「クラスターへのデータの割り当て」を使用します。

注意

トレーニング済みのモデルをデザイナーに配置する必要がある場合は、Score Model (モデルのスコア付け) ではなく、Assign Data to Clusters (クラスターへのデータの割り当て) が、推論パイプラインの Web Service Output (Web サービスの出力) コンポーネントの入力に接続されていることを確認してください。

次の手順

Azure Machine Learning で使用できる一連のコンポーネントを参照してください。

クラスタリング モデルのトレーニング

クラスタリング モデルのトレーニングの使用方法

結果

次の手順

その他のリソース

クラスタリングモデルのトレーニング

クラスタリングモデルのトレーニングの使用方法