Vowpal Wabbit バージョン 8 モデルのスコアリング

重要

Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。

2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。

ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。

コマンド ライン インターフェイスから Vowpal Wabbit 機械学習システムを使用してデータのスコアを付けます

カテゴリ: Text Analytics

注意

適用対象: Machine Learning Studio (クラシック) のみ

類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。

モジュールの概要

この記事では、Machine Learning Studio (クラシック) で Vowpal Wabbit バージョン 8 モデルのスコア付けモジュールを使用して、既存のトレーニング済みの Vowpal Wabbit モデルを使用して、一連の入力データのスコアを生成する方法について説明します。

このモジュールは、Vowpal Wabbit フレームワークバージョン 8 の最新バージョンを提供します。 このモジュールを使用して、VW バージョン 8 形式で保存されたトレーニング済みのモデルを使用してデータをスコア付けします。

以前のバージョンを使用して作成された既存のモデルがある場合は、次のモジュールを使用します。

Score Vowpal Wabbit Model 8 を構成する方法

  1. 実験に Vowpal Wabbit バージョン 8 モデルのスコア 付けモジュールを追加します。

  2. トレーニング済みの Vowpal Wabbit モデルを追加し、左側の入力ポートに接続します。 同じ実験で作成されたトレーニング済みのモデルを使用するか、Studio (クラシック) の左側のナビゲーション ウィンドウの [トレーニング済みモデル] グループで保存されたモデルを見つけるか、そのモデルを検索できます。 ただし、モデルは Machine Learning Studio (クラシック) で使用できる必要があります。Azure Storage からモデルを直接読み込むすることはできません。

    注意

    Vowpal Wabbit 8 モデルだけがサポートされています。他のアルゴリズムを使用してトレーニングされた保存済みモデルを接続することはできません。また、以前のバージョンを使用してトレーニングされたモデルを使用することはできません。

  3. [VW 引数] テキスト ボックスに、Vowpal Wabbit 実行可能ファイルに有効なコマンドライン引数のセットを入力します。

    Machine Learning でサポートおよびサポートされていない Vowpal Wabbit 引数の詳細については、「テクニカル ノート」セクションを参照してください。

  4. [ データ型の指定] をクリックし、サポートされているデータ型の 1 つを一覧から選択します。

    スコアリングには、VW と互換性のあるデータの 1 つの列が必要です。

    SVMLight または VW 形式で作成された既存のファイルがある場合は、次のいずれかの形式の新しいデータセットとして Azure ML ワークスペースに読み込むことができます。ヘッダーなしの汎用 CSV、ヘッダーなしの TSV。

    VW オプションではラベルが存在する必要がありますが、比較以外はスコアリングでは使用されません。

  5. データの インポート モジュールを 追加し、それを Score Vowpal Wabbit Version 8 の右側の入力ポートに接続します。 入力データ にアクセスする データのインポートを構成します。

    スコアリング用の入力データは、サポートされている形式の 1 つで前もって準備し、Azure BLOB ストレージに格納されている必要があります。

  6. スコアと一緒にラベルを出力する場合は、 [ラベルを含む余分な列を含める] オプションを選択します。

    通常、テキスト データを処理する場合は、Vowpal Wabbit はラベルを必要とせず、データの各行のスコアのみを返します。

  7. 結果と一緒に生のスコアを出力する場合は、[Include an extra column containing raw scores] (生のスコアを含む余分な列を含める) オプションを選択します。

    ヒント

    このオプションは、Vowpal Wabbit バージョン 8 の新機能です。

  8. 次の条件を満 した場合に、前の実行の結果を再使用する場合は、 [キャッシュされた結果を使用する] オプションを選択します。

    • 以前の実行から有効なキャッシュが存在します。

    • モジュールの入力データとパラメーターの設定は、前の実行以降は変更されません。

    それ以外の場合は、実験が実行されるごとにインポート プロセスが繰り返されます。

  9. 実験を実行します。

結果

トレーニングの完了後:

出力には、0 ~ 1 の正規化された予測スコアが示されます。

機械学習で Vowpal Wabbit を使用する方法の例については、次のページを Azure AI Gallery

  • Vowpal Wabbit サンプル

    この実験では、VW モデルのデータ準備、トレーニング、運用化を示します。

次のビデオでは、Vowpal Wabbit のトレーニングおよびスコアリング プロセスのチュートリアルを示します。

https://azure.microsoft.com/documentation/videos/text-analytics-and-vowpal-wabbit-in-azure-ml-studio/

テクニカル ノート

このセクションには、実装の詳細、ヒント、よく寄せられる質問への回答が含まれています。

パラメーター

Vowpal Wabbit には、アルゴリズムを選択およびチューニングするためのコマンドライン オプションが多数あります。 これらのオプションについて、ここで詳細に説明することはできません。Vowpal Wabbit wiki ページを参照することをお勧めします。

次のパラメーターは、Machine Learning Studio (クラシック) ではサポートされていません。

  • https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments で指定されている入力および出力オプション

    これらのプロパティは、モジュールによってあらかじめ自動的に構成されます。

  • また、複数の出力を生成したり、複数の入力を受け取ったりするオプションは許可されていません。 これらには、 --cbt--lda 、および --wap が含まれます。

  • 教師あり学習アルゴリズムのみがサポートされています。 これにより、–active--rank--search などのオプションが禁止されます。

上記以外のすべての引数は許可されます。

想定される入力

名前 説明
トレーニングされたモデル ILearner インターフェイス トレーニング済みの学習器
データセット データ テーブル スコア付けするデータセット

モジュール パラメーター

名前 Range Type Default 説明
データ型を指定する VW

SVMLight
DataType VW ファイルの種類が SVMLight または Vowpal Wabbit かどうかを示します
VW の引数 any String なし Vowpal Wabbit の引数を入力します。 -i または -p、または -t を含めない
ラベルを含む余分な列を含める True/False Boolean false ZIP ファイルに予測によるラベルを含めるかどうかを指定する
生のスコアを含む追加の列を含める True/False Boolean false (--raw_predictions に対応する) 生のスコアを含む追加の列を結果に含めるかどうかを指定します

出力

名前 説明
結果のデータセット データ テーブル 予測結果を含むデータセット

例外

例外 説明
エラー 0001 データ セットで指定した列のうち 1 つまたは複数が見つからない場合、例外が発生します。
エラー 0003 1 つまたは複数の入力が null または空の場合、例外が発生します。
エラー 0004 パラメーターが特定の値以下の場合、例外が発生します。
エラー 0017 指定した 1 つ以上の列の型が現在のモジュールでサポートされていない場合に、例外が発生します。

Studio (クラシック) モジュールに固有のエラーの一覧については、「エラー コードMachine Learning参照してください

API の例外の一覧については、「エラー コードMachine Learning REST API参照してください

こちらもご覧ください

Text Analytics
特徴ハッシュ
名前付きエンティティの認識
Vowpal Wabbit 7-4 モデルのスコアリング
Vowpal Wabbit 7-4 モデルのトレーニング
Vowpal Wabbit 8 モデルのトレーニング
モジュールの一覧 (アルファベット順)