定型模型

以監督方式為分類或迴歸模型定型

類別: 機器學習/定型

注意

適用于 : Machine Learning Studio (傳統)

此內容僅適用于 Studio (傳統) 。 Azure Machine Learning 設計工具中已新增類似的拖放模組。 若要深入瞭解 這兩個版本,請參閱這篇文章

模組概觀

本文說明如何在 Azure Machine Learning Studio 中使用「 定型模型 」模組 (傳統) 來定型分類或回歸模型。 定型會在您定義模型並設定其參數之後進行,且需要標記的資料。 您也可以使用 定型模型 ,以新的資料重新定型現有的模型。

定型流程的運作方式

在 Azure Machine Learning 中,建立和使用機器學習模型通常是三個步驟的程式。

  1. 您可以藉由選擇特定類型的演算法,並定義其參數或超參數,來設定模型。 選擇下列其中一種模型類型:

    • 以類神經網路、決策樹、決策樹系和其他演算法為基礎的分類模型
    • 回歸模型,其中可能包括標準線性回歸,或使用其他演算法(包括類神經網路和 Baysian 回歸)的回歸模型。
  2. 提供標示的資料集,且資料集與演算法相容。 將資料和模型連接到 定型模型

    定型產生的是特定的二進位格式 .ilearner,它會封裝從資料學習到的統計模式。 您無法直接修改或讀取此格式;不過,Studio (傳統) 中的其他模組可以使用此定型模型。

    您也可以查看模型的屬性。 如需詳細資訊,請參閱 結果 一節。

  3. 定型完成之後,請使用定型的模型搭配其中一個 評分模組,以對新資料進行預測。

注意

其他特製化的機器學習工作需要不同的定型方法,而 Studio (傳統) 為它們提供個別的定型模組。 例如,「影像偵測」、「叢集」和「異常 detction 全都使用自訂定型方法。 定型模型 僅適用于回歸和分類模型。

受監督和非監督式訓練

您可能聽說過受 監督非監督式 學習的條款。 使用 定型模型 定型分類或回歸模型是受 監督機器學習 的典型範例。 這表示您必須提供一個資料集,其中包含要從中學習模式的歷程記錄資料。 資料應該同時包含 (標籤) 您嘗試預測的結果,以及) (變數的相關因素。 機器學習模型需要結果,以判斷最能預測結果的功能。

在定型過程中,資料會依結果排序,而演算法會將統計模式解壓縮以建立模型。

非監督式 learning 表示結果不明,或您選擇不使用已知標籤。 例如,叢集演算法通常會採用非監督式學習方法,但可使用標籤(如果有的話)。 另一個範例是使用 LDA的主題模型。 您無法搭配這些演算法使用 定型模型

提示

機器學習服務的新手嗎? 本教學課程會逐步引導您取得資料、設定演算法、定型,然後使用模型的 程式:建立您的第一個機器學習實驗

如何使用 定型模型

  1. 在 Azure Machine Learning Studio (傳統) 中,設定 分類模型回歸模型 模型。

    您也可以定型使用 Create R model建立的自訂模型。

  2. 將「 定型模型 」模組加入實驗中。 您可以在 Machine Learning 類別下找到此模組。 展開 [ 定型],然後將 [ 定型模型 ] 模組拖曳到您的實驗中。

  3. 在左側輸入中,附加未定型模式。 將訓練資料集附加至 定型模型 的右手邊輸入。

    訓練資料集必須包含標籤資料行。 任何不含標籤的資料列都會被忽略。

  4. 針對 [ 標籤] 資料行,按一下 [ 啟動資料行選取器],然後選擇包含模型可用於定型之結果的單一資料行。

    • 如果是分類問題,標籤資料行必須包含 類別 值或 離散 值。 某些範例可能是 [是]/[否]、[疾病分類程式代碼] 或 [收入] 群組。 如果您挑選非類別資料行,此模組將會在定型期間傳回錯誤。

    • 針對回歸問題,標籤資料行必須包含代表回應變數的 數值 資料。 在理想的情況下,數值資料代表連續的小數位數。

    範例可能是點數風險分數、硬碟的預計失敗時間,或是在指定日期或時間對來電中心預測的呼叫次數。 如果您沒有選擇數值資料行,可能會收到錯誤訊息。

    • 如果未指定要使用哪一個標籤資料行,Azure Machine Learning 會使用資料集的中繼資料,嘗試推斷適當的標籤資料行。 如果它挑選錯誤的資料行,請使用資料行選取器來修正它。

    提示

    If you have trouble using the Column Selector, see the article Select Columns in Dataset for tips. 它描述使用 WITH 規則依名稱 選項的一些常見案例和秘訣。

  5. 執行實驗。 如果您有大量資料,這可能需要一些時間。

結果

定型模型之後:

  • 若要查看模型參數和功能加權,請以滑鼠右鍵按一下輸出,然後選取 [ 視覺化]。

  • 若要在其他實驗中使用模型,請以滑鼠右鍵按一下模型,然後選取 [ 儲存模型]。 輸入模型的名稱。

    這會將模型儲存為快照,而不會透過重複執行實驗來更新。

  • 若要使用模型來預測新的值,請將它連接到「 評分模型 」模組,以及新的輸入資料。

如果您需要訓練 定型模型 不支援的模型類型,有幾個選項可供選擇:

範例

如需如何在機器學習實驗中使用「 定型模型 」模組的範例,請參閱 Azure AI 資源庫中的這些實驗:

預期的輸入

名稱 類型 Description
未定型的模型 ILearner 介面 未定型的學習模組
資料集 資料表 訓練資料

模組參數

Name 範圍 類型 預設 描述
標籤資料行 任意 ColumnSelection 選取包含標籤或結果資料行的資料行

輸出

名稱 類型 Description
定型的模型 ILearner 介面 定型的學習模組

例外狀況

如需所有模組錯誤的清單,請參閱 模組錯誤碼

例外狀況 描述
錯誤 0032 如果引數不是數字,就會發生例外狀況。
錯誤 0033 如果引數無限制,就會發生例外狀況。
錯誤 0083 如果用於定型的資料集不適用於具體類型的學習模組,就會發生例外狀況。
錯誤 0035 若未提供指定使用者或項目的特徵,就會發生例外狀況。
錯誤 0003 如果一或多個輸入為 Null 或空白,就會發生例外狀況。
錯誤 0020 如果傳至模組的某些資料集中的資料行數目太少,就會發生例外狀況。
錯誤 0021 如果傳至模組的某些資料集中的資料列數目太少,就會發生例外狀況。
錯誤 0013 如果傳遞給學習模組的類型無效,就會發生例外狀況。

另請參閱

評估模型
A-Z 模組清單