クラスタリング モデルのトレーニング

この記事では Azure Machine Learning デザイナーのコンポーネントについて説明します。

このコンポーネントを使用して、クラスタリング モデルをトレーニングします。

このコンポーネントは、K-Means Clustering (K-Means クラスタリング) コンポーネントを使用して既に構成済みのトレーニングされていないクラスタリング モデルを取得し、ラベル付きまたはラベルなしデータセットを使用してそのモデルをトレーニングします。 このコンポーネントは、予測に使用できるトレーニング済みモデルと、トレーニング データの各ケースに対するクラスター割り当てセットの両方を作成します。

注意

機械学習モデルをトレーニングするための汎用コンポーネントである モデルのトレーニング コンポーネントを使用して、クラスタリング モデルをトレーニングすることはできません。 これは、Train Model (モデルのトレーニング) が教師あり学習アルゴリズムでのみ動作するためです。 K 平均法と他のクラスタリング アルゴリズムは教師なし学習を可能にします。これは、アルゴリズムがラベルなしデータから学習できることを意味します。

クラスタリング モデルのトレーニングの使用方法

  1. Train Clustering Model (クラスタリング モデルのトレーニング) コンポーネントをデザイナーの自分のパイプラインに追加します。 このコンポーネントは、Machine Learning コンポーネント[トレーニング] カテゴリにあります。

  2. K-Means Clustering (K-Means クラスタリング) コンポーネント、または互換性のあるクラスタリング モデルを作成する別のカスタム コンポーネントを追加し、クラスタリング モデルのパラメーターを設定します。

  3. [Train Clustering Model]\(クラスタリング モデルのトレーニング\) の右側の入力にトレーニング データセットをアタッチします。

  4. [Column Set]\(列セット\) で、クラスターの構築に使用するデータセットの列を選択します。 適切な特徴となる列を必ず選択してください。たとえば、一意の値を持つ ID やその他の列、またはすべて同じ値を持つ列は使用しないようにします。

    ラベルが使用可能な場合は、特徴として使用することも、除外することもできます。

  5. トレーニング データを新しいクラスター ラベルとともに出力する場合は、[Check for append or uncheck for result only]\(追加をチェックまたは結果のみをチェック解除\) オプションを選択します。

    このオプションの選択を解除すると、クラスターの割り当てだけが出力されます。

  6. パイプラインを送信するか、Train Clustering Model (クラスタリング モデルのトレーニング) コンポーネントをクリックして [選択した項目を実行] を選択します。

結果

トレーニングの完了後、次の作業を行います。

  • トレーニングされたモデルのスナップショットを保存するには、 [モデルのトレーニング] コンポーネントの右側のパネルにある [出力] タブを選択します。 [データセットの登録] アイコンを選んで、再利用可能なコンポーネントとしてモデルを保存します。

  • モデルからスコアを生成するには、「クラスターへのデータの割り当て」を使用します。

注意

トレーニング済みのモデルをデザイナーに配置する必要がある場合は、Score Model (モデルのスコア付け) ではなく、Assign Data to Clusters (クラスターへのデータの割り当て) が、推論パイプラインの Web Service Output (Web サービスの出力) コンポーネントの入力に接続されていることを確認してください。

次の手順

Azure Machine Learning で使用できる一連のコンポーネントを参照してください。