Vowpal Wabbit バージョン 7-4 モデルのスコアリング

重要

Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。

2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。

ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。

コマンド ライン インターフェイスから Vowpal Wabbit 機械学習システムを使用してデータのスコアを付けます

カテゴリ: Text Analytics

注意

適用対象: Machine Learning Studio (クラシック)のみ

類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。

モジュールの概要

この記事では、既存のトレーニング済み Vowpal wabbit モデルを使用して、Machine Learning Studio (クラシック) のScore Vowpal wabbit バージョン7-4 モデルモジュールを使用して、一連の入力データのスコアを生成する方法について説明します。

このモジュールは、Vowpal Wabbit フレームワークのバージョン7-4 との互換性のために用意されています。 このモジュールは、7-4 形式で保存されたトレーニング済みのモデルを使用してデータをスコア付けする必要がある場合にのみ使用してください。

新しい VW モデルを作成するには、最新バージョンを使用することをお勧めします。

スコア Vowpal Wabbit バージョン7-4 モデルを構成する方法

  1. Score Vowpal Wabbit バージョン7-4 モデルモジュールを実験に追加します。

  2. トレーニング済みの Vowpal Wabbit モデルを追加し、左側の入力ポートに接続します。 同じ実験で作成されたトレーニング済みのモデルを使用することも、Studio (クラシック) の左側のナビゲーションウィンドウにある [ トレーニング 済みのモデル] グループで保存済みのモデルを見つけることもできます。

    制限事項

    モデルは Machine Learning Studio (クラシック) で使用できる必要があります。 Azure storage からモデルを直接読み込むことはできません。

    Vowpal Wabbit 7-4 モデルのみがサポートされています。他のアルゴリズムを使用してトレーニングした保存済みのモデルを接続することはできません。また、新しいバージョンを使用してトレーニングされたモデルを使用することもできません。

  3. [VW 引数] テキスト ボックスに、Vowpal Wabbit 実行可能ファイルに有効なコマンドライン引数のセットを入力します。

    Machine Learning でサポートされている Vowpal wabbit 引数の詳細については、「テクニカルノート」を参照してください。

  4. [ データ型の指定] をクリックし、一覧からサポートされているデータ型のいずれかを選択します。

    スコアリングには、VW と互換性のあるデータの1つの列が必要です。

    svmlight 形式または VW 形式で作成された既存のファイルがある場合は、次のいずれかの形式で新しいデータセットとして Azure ML ワークスペースに読み込むことができます: ヘッダーなしの汎用 CSV、TSV ヘッダーなし。

    VWオプションではラベルが存在している必要がありますが、比較の場合を除き、スコア付けでは使用されません。

  5. データの インポート モジュールを追加し、 スコア Vowpal Wabbit バージョン 7-4の右側の入力ポートに接続します。 入力データにアクセスするように データのインポート モジュールを構成します。

    スコアリングの入力データは、サポートされているいずれかの形式で事前に準備され、Azure blob storage に格納されている必要があります。

  6. スコアと一緒にラベルを出力する場合は、 [ラベルを含む余分な列を含める] オプションを選択します。

    通常、テキスト データを処理する場合は、Vowpal Wabbit はラベルを必要とせず、データの各行のスコアのみを返します。

  7. 以前の実行の結果を再利用する場合は、次の条件が満たされていると仮定して、[キャッシュされた 結果を使用する] オプションを選択します。

    • 前回の実行で有効なキャッシュが存在します。

    • モジュールの入力データとパラメーターの設定は、前回の実行以降は変更されていません。

    そうしないと、実験を実行するたびにインポートプロセスが繰り返されます。

  8. 実験を実行します。

結果

トレーニングの完了後:

出力には、0 ~ 1 の正規化された予測スコアが示されます。

機械学習で Vowpal Wabbit を使用する方法の例については、 Azure AI Galleryを参照してください。

  • Vowpal Wabbit サンプル

    この実験では、VW モデルのデータ準備、トレーニング、運用化について説明します。

次のビデオでは、Vowpal Wabbit のトレーニングとスコア付けのプロセスのチュートリアルを提供しています。

テクニカル ノート

このセクションには、実装の詳細、ヒント、よく寄せられる質問への回答が含まれています。

サポートされているパラメーターとサポートされていないパラメーター

Vowpal Wabbit には、アルゴリズムを選択およびチューニングするためのコマンドライン オプションが多数あります。 これらのオプションについて、ここで詳細に説明することはできません。Vowpal Wabbit wiki ページを参照することをお勧めします。

次のパラメーターは Machine Learning Studio (クラシック) ではサポートされていません。

  • https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments で指定されている入力および出力オプション

    これらのプロパティは、モジュールによってあらかじめ自動的に構成されます。

  • また、複数の出力を生成したり、複数の入力を受け取ったりするオプションは許可されていません。 これらには、 --cbt--lda 、および --wap が含まれます。

  • 教師あり学習アルゴリズムのみがサポートされています。 これにより、–active--rank--search などのオプションが禁止されます。

上記以外のすべての引数は許可されます。

想定される入力

名前 説明
トレーニングされたモデル ILearner インターフェイス トレーニング済みの学習器
データセット データ テーブル スコア付けするデータセット

モジュールのパラメーター

名前 Range Type Default 説明
VW の引数 Any String Vowpal Wabbit の引数を入力します。

以下の引数はサポートされません。

- -i
- -p または
- -t
ラベルを含む余分な列を含める Any Boolean false ZIP ファイルに予測によるラベルを含めるかどうかを指定する
データ型を指定する VW

SVMLight
DataType VW ファイル形式が SVMLight または Vowpal Wabbit かどうかを示す

出力

名前 説明
結果のデータセット データ テーブル 予測結果を含むデータセット

例外

例外 説明
エラー 0001 データ セットで指定した列のうち 1 つまたは複数が見つからない場合、例外が発生します。
エラー 0003 1 つまたは複数の入力が null または空の場合、例外が発生します。
エラー 0004 パラメーターが特定の値以下の場合、例外が発生します。
エラー 0017 指定した 1 つ以上の列の型が現在のモジュールでサポートされていない場合に、例外が発生します。

Studio (クラシック) モジュール固有のエラーの一覧については、「 Machine Learning エラーコード」を参照してください。

API 例外の一覧については、「 Machine Learning REST API のエラーコード」を参照してください。

こちらもご覧ください

Text Analytics
特徴ハッシュ
名前付きエンティティの認識
Vowpal Wabbit スコア
Vowpal Wabbit 7-4 モデルのトレーニング
Vowpal Wabbit 7-10 モデルのトレーニング
モジュールの一覧 (アルファベット順)