計分 Vowpal Wabbit 7-4 版模型

從命令列介面使用 Vowpal Wabbit 機器學習系統來評分資料

類別: 文字分析

注意

適用于 : Machine Learning Studio (傳統)

此內容僅適用于 Studio (傳統) 。 Azure Machine Learning 設計工具中已新增類似的拖放模組。 若要深入瞭解 這兩個版本,請參閱這篇文章

模組概觀

本文說明如何使用 Azure Machine Learning Studio (傳統) 中的 計分 Vowpal Wabbit 7-4 版模型 模組,以使用現有已定型的 Vowpal Wabbit 模型來產生一組輸入資料的分數。

此模組是為了與 Vowpal Wabbit framework 7-4 版相容。 只有當您需要使用以7-4 格式儲存的定型模型來評分資料時,才使用此模組。

若要建立新的 VW 模型,建議使用最新版本::

如何設定計分 Vowpal Wabbit 7-4 版模型

  1. 計分 Vowpal Wabbit 7-4 版模型 模組新增至您的實驗。

  2. 新增已定型的 Vowpal Wabbit 模型,並將它連接到左側輸入埠。 您可以使用在相同實驗中建立的定型模型,或在 Studio 的 定型模型 群組中找出已儲存的模型 (傳統) 的左側流覽窗格。

    限制

    模型必須可在 Azure Machine Learning Studio (傳統) 中使用;您無法直接從 Azure 儲存體載入模型。

    只支援 Vowpal Wabbit 7-4 模型;您無法連接使用其他演算法定型的已儲存模型,也無法使用以較新版本定型的模型。

  3. 在 [ VW 引數 ] 文字方塊中,輸入一組有效的命令列引數給 Vowpal Wabbit 可執行檔。

    如需 Azure Machine Learning 中支援哪些 Vowpal Wabbit 引數的相關資訊,請參閱 技術 提示一節。

  4. 按一下 [ 指定資料類型],然後從清單中選取其中一個支援的資料類型。

    計分需要 VW 相容資料的單一資料行。

    如果您有以 SVMLight 或 VW 格式建立的現有檔案,您可以使用下列其中一種格式,將它以新的資料集形式載入 Azure ML 工作區:不含標頭的一般 CSV、TSV 沒有標頭。

    VW 選項需要有標籤,但不會用於計分,除非比較。

  5. 新增 [匯 入資料 ] 模組,並將其連接至 [ 計分 Vowpal Wabbit 7-4 版 的右手邊輸入埠。 設定匯 入資料 模組以存取輸入資料。

    評分的輸入資料必須事先以其中一種支援的格式預先準備,並儲存在 Azure blob 儲存體中。

  6. 如果您想要將標籤與分數一起輸出,請選取 [ 包含標籤的額外資料行] 選項。

    一般來說,在處理文字資料時,Vowpal Wabbit 不需要標籤,而且只會傳回每個資料列的分數。

  7. 如果您想要重複使用先前執行的結果,請選取 [使用快取的 結果] 選項,假設符合下列條件:

    • 先前的執行中有有效的快取。

    • 自上一次執行之後,模組的輸入資料和參數設定未變更。

    否則,每次執行實驗時都會重複匯入程式。

  8. 執行實驗。

結果

定型完成後:

輸出表示預測分數從0正規化為1。

範例

如需如何在機器學習中使用 Vowpal Wabbit 的範例,請參閱 AZURE AI 資源庫

下列影片提供 Vowpal Wabbit 的訓練和評分程式逐步解說:

技術提示

本節包含對常見問題的執行詳細資料、秘訣和解答。

支援和不支援的參數

Vowpal Wabbit 有許多命令列選項可用於選擇和調整演算法。 您無法在這裡完整討論這些選項;我們建議您查看 Vowpal Wabbit wiki 頁面

Azure Machine Learning Studio (傳統) 不支援下列參數。

  • 中指定的輸入/輸出選項 https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments

    模組已自動設定這些屬性。

  • 此外,也不允許產生多個輸出或接受多個輸入的任何選項。 其中包括 --cbt--lda--wap

  • 僅支援受監督的學習演算法。 這不允許下列選項: –active--rank 等等 --search

除了以上所述以外的所有引數都是允許的。

預期的輸入

名稱 類型 Description
定型的模型 ILearner 介面 定型的學習模組
資料集 資料表 要評分的資料集

模組參數

Name 範圍 類型 預設 描述
VW 引數 任意 String 輸入 Vowpal Wabbit 引數。

不支援下列引數:

- -i
- -p
- -t
加入包含標籤的額外資料行 任意 Boolean false 指定壓縮檔是否應該包含標籤與預測
指定資料類型 VW

SVMLight
DataType VW 指出檔案格式是 SVMLight 或 Vowpal Wabbit

輸出

名稱 類型 Description
結果資料集 資料表 含預測結果的資料集

例外狀況

例外狀況 描述
錯誤 0001 如果找不到資料集的一或多個指定的資料行,就會發生例外狀況。
錯誤 0003 如果一或多個輸入為 Null 或空白,就會發生例外狀況。
錯誤 0004 如果參數小於或等於特定值,就會發生例外狀況。
錯誤 0017 如果一或多個指定的資料行具有目前模組不支援的類型,就會發生例外狀況。

如需 Studio (傳統) 模組特定的錯誤清單,請參閱 機器學習錯誤碼

如需 API 例外狀況的清單,請參閱 機器學習 REST API 錯誤碼

另請參閱

文字分析
特徵雜湊
命名實體辨識
Vowpal Wabbit 分數
定型 Vowpal Wabbit 7-4 模型
定型 Vowpal Wabbit 7-10 模型
A-Z 模組清單