計分 Vowpal Wabbit 7-4 版模型

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

從命令列介面使用 Vowpal Wabbit 機器學習系統來評分資料

Category:文字分析

注意

適用于僅限機器學習 Studio (傳統)

Azure Machine Learning 設計工具中提供類似的拖放模組。

模組概觀

本文說明如何使用機器學習 Studio (傳統) 中的計分 Vowpal Wabbit 7-4 版模型模組,以使用現有定型的 Vowpal Wabbit 模型來產生一組輸入資料的分數。

此模組是為了與 Vowpal Wabbit framework 7-4 版相容。 只有當您需要使用以7-4 格式儲存的定型模型來評分資料時,才使用此模組。

若要建立新的 VW 模型,建議使用最新版本::

如何設定計分 Vowpal Wabbit 7-4 版模型

  1. 計分 Vowpal Wabbit 7-4 版模型 模組新增至您的實驗。

  2. 新增已定型的 Vowpal Wabbit 模型,並將其連線到左側的輸入埠。 您可以使用在相同實驗中建立的定型模型,或在 Studio 的 定型模型 群組中找出已儲存的模型 (傳統) 的左側流覽窗格。

    限制

    模型必須可在機器學習 Studio (傳統) 中使用; 您無法直接從 Azure 儲存體載入模型。

    只支援 Vowpal Wabbit 7-4 模型;您無法連接使用其他演算法定型的已儲存模型,也無法使用以較新版本定型的模型。

  3. 在 [VW 引數] 文字方塊中,輸入一組對 Vowpal Wabbit 可執行檔有效的命令列引數。

    如需機器學習中支援哪些 Vowpal Wabbit 引數的相關資訊,請參閱技術提示一節。

  4. 按一下 [ 指定資料類型],然後從清單中選取其中一個支援的資料類型。

    計分需要 VW 相容資料的單一資料行。

    如果您有以 SVMLight 或 VW 格式建立的現有檔案,您可以使用下列其中一種格式,將它以新的資料集形式載入 Azure ML 工作區:不含標頭的一般 CSV、TSV 沒有標頭。

    VW選項需要有標籤,但不會用於計分,除非比較。

  5. 新增 [匯 入資料 ] 模組,並將其連接至 [ 計分 Vowpal Wabbit 7-4 版的右手邊輸入埠。 設定匯 入資料 模組以存取輸入資料。

    評分的輸入資料必須事先以其中一種支援的格式預先準備,並儲存在 Azure blob 儲存體中。

  6. 如果您想要一起輸出標籤與分數,請選取 [加入包含標籤的額外資料行] 選項。

    一般來說,在處理文字資料時,Vowpal Wabbit 不需要標籤,而且只會傳回每個資料列的分數。

  7. 如果您想要重複使用先前執行的結果,請選取 [使用快取的 結果] 選項,假設符合下列條件:

    • 先前的執行中有有效的快取。

    • 自上一次執行之後,模組的輸入資料和參數設定未變更。

    否則,每次執行實驗時都會重複匯入程式。

  8. 執行實驗。

結果

定型完成後:

該輸出會指出已正規化為 0 到 1 的預測分數。

範例

如需如何在機器學習中使用 Vowpal Wabbit 的範例,請參閱 Azure AI 資源庫

下列影片提供 Vowpal Wabbit 的訓練和評分程式逐步解說:

技術說明

本節包含實作詳細資料、提示和常見問題集的解答。

支援和不支援的參數

Vowpal Wabbit 有許多命令列選項可用於選擇和微調演算法。 這裡無法提供這些選項的完整討論;建議您檢視 Vowpal Wabbit wiki 頁面

機器學習 Studio (傳統) 中不支援下列參數。

  • https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments 中指定的輸入/輸出選項

    模組已自動設定這些屬性。

  • 此外,也不允許產生多個輸出或接受多個輸入的任何選項。 其中包括 --cbt--lda--wap

  • 僅支援受監督的學習演算法。 這不允許下列選項:–active--rank--search 等等。

上述引數以外的所有引數則允許使用。

預期的輸入

名稱 類型 Description
定型的模型 ILearner 介面 定型的學習模組
資料集 資料表 要評分的資料集

模組參數

名稱 範圍 類型 預設 描述
VW 引數 任意 String 輸入 Vowpal Wabbit 引數。

不支援下列引數:

- -i
- -p
- -t
加入包含標籤的額外資料行 任意 布林值 false 指定壓縮檔是否應該包含標籤與預測
指定資料類型 VW

SVMLight
DataType VW 指出檔案格式是 SVMLight 或 Vowpal Wabbit

輸出

名稱 類型 說明
結果資料集 資料表 含預測結果的資料集

例外狀況

例外狀況 描述
錯誤 0001 如果找不到資料集的一或多個指定的資料行,就會發生例外狀況。
錯誤 0003 如果一或多個輸入為 Null 或空白,就會發生例外狀況。
錯誤 0004 如果參數小於或等於特定值,就會發生例外狀況。
錯誤 0017 如果一或多個指定的資料行具有目前模組不支援的類型,就會發生例外狀況。

如需 Studio (傳統) 模組特定的錯誤清單,請參閱機器學習錯誤碼

如需 API 例外狀況的清單,請參閱機器學習 REST API 錯誤碼

另請參閱

文字分析
特性雜湊
具名實體辨識
Vowpal Wabbit 分數
定型 Vowpal Wabbit 7-4 模型
定型 Vowpal Wabbit 7-10 模型
A-Z 模組清單