クラスタリング モデルのトレーニング

クラスタリング モデルをトレーニングし、トレーニング セットのデータをクラスターに割り当てます

カテゴリ: Machine Learning/トレーニング

注意

適用対象: Machine Learning Studio (クラシック)

このコンテンツは、Studio (クラシック) のみに関連しています。 Azure Machine Learning デザイナーに同様のドラッグアンドドロップモジュールが追加されました。 この記事では、2つのバージョンの比較について詳しく説明します。

モジュールの概要

この記事では、Azure Machine Learning Studio (クラシック) の [ クラスタリングモデルのトレーニング ] モジュールを使用して、クラスターモデルをトレーニングする方法について説明します。

このモジュールは、K-Means Clustering (K-Means クラスタリング) モジュールを使用して既に構成済みのトレーニングされていないクラスタリング モデルを取得し、ラベル付きまたはラベルなしデータセットを使用してそのモデルをトレーニングします。 このモジュールは、予測に使用できるトレーニング済みモデルと、トレーニング データの各ケースに対するクラスター割り当てセットの両方を作成します。

注意

モデルのトレーニングモジュールを使用してクラスターモデルをトレーニングすることはできません。これは、機械学習モデルを作成するための汎用モジュールです。 これは、Train Model (モデルのトレーニング) が教師あり学習アルゴリズムでのみ動作するためです。 K 平均法と他のクラスタリング アルゴリズムは教師なし学習を可能にします。これは、アルゴリズムがラベルなしデータから学習できることを意味します。

クラスタリング モデルのトレーニングの使用方法

  1. Studio (クラシック) で、実験に " クラスターモデルのトレーニング " モジュールを追加します。 このモジュールは、Machine Learning モジュール[トレーニング] カテゴリにあります。

  2. K-Means Clustering (K-Means クラスタリング) モジュール、または互換性のあるクラスタリング モデルを作成する別のカスタム モジュールを追加し、クラスタリング モデルのパラメーターを設定します。

  3. [Train Clustering Model](クラスタリング モデルのトレーニング) の右側の入力にトレーニング データセットをアタッチします。

  4. [Column Set](列セット) で、クラスターの構築に使用するデータセットの列を選択します。 適切な特徴となる列を必ず選択してください。たとえば、一意の値を持つ ID やその他の列、またはすべて同じ値を持つ列は使用しないようにします。

    ラベルが使用可能な場合は、特徴として使用することも、除外することもできます。

  5. トレーニングデータを新しいクラスターラベルと共に出力する場合は、オプションを選択し、[ 追加] チェック ボックスをオンにします。

    このオプションの選択を解除すると、クラスターの割り当てだけが出力されます。

  6. 実験を実行するか、Train Clustering Model (クラスタリング モデルのトレーニング) モジュールをクリックして [選択した項目を実行] を選択します。

結果

トレーニングの完了後、次の作業を行います。

  • クラスターとその分離をグラフで表示するには、 結果データセット 出力を右クリックし、[ 視覚化] を選択します。

    グラフは、実際の値ではなく、クラスターの主要なコンポーネントを表します。 詳細については、「 主要コンポーネントの分析 」を参照してください。

  • データセット内の値を表示するには、データセット への変換 モジュールのインスタンスを追加し、 結果のデータセット の出力に接続します。 データ セットへの変換 モジュールを実行して、表示またはダウンロードできるデータのコピーを取得します。

  • トレーニング済みのモデルを保存して後で再利用できるようにするには、モジュールを右クリックし、[Trained model](トレーニング済みのモデル) を選択して [Save As Trained Model](トレーニング済みのモデルとして保存する) をクリックします。

  • モデルからスコアを生成するには、「クラスターへのデータの割り当て」を使用します。

機械学習でクラスタリングを使用する方法の例については、 Azure AI Galleryを参照してください。

想定される入力

名前 Type 説明
未トレーニング モデル ICluster インターフェイス 未トレーニング クラスタリング モデル
データセット データ テーブル 入力データ ソース

モジュールのパラメーター

名前 Range Type Default 説明
列セット any ColumnSelection 列選択パターン
オンで追加またはオフで結果のみ any Boolean true 出力データセットに割り当て列により追加された入力データセットを含めるか (チェック)、割り当て列のみを含めるか (チェック解除)

出力

名前 Type 説明
トレーニングされたモデル ICluster インターフェイス トレーニング済みクラスタリング モデル
結果のデータセット データ テーブル 割り当てのデータ列により追加された入力データセットまたは割り当て列のみ

例外

例外 説明
エラー 0003 1 つまたは複数の入力が null または空の場合、例外が発生します。

Studio (クラシック) モジュール固有のエラーの一覧については、「 Machine Learning エラーコード」を参照してください。

API 例外の一覧については、「 Machine Learning REST API のエラーコード」を参照してください。

関連項目

A-z モジュールリスト
指導
クラスターにデータを割り当てる
K-Means クラスタリング