定型模型

發行項
05/06/2019

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。建議您在該日期之前轉換成 Azure Machine Learning。

自 2021 年 12 月 1 日起，您將無法建立新的 Machine Learning 工作室 (傳統) 資源。在 2024 年 8 月 31 日之前，您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

請參閱將機器學習專案從 ML 工作室 (傳統) 移至 Azure Machine Learning 的相關資訊。
深入瞭解Azure Machine Learning。

ML 工作室 (傳統) 文件即將淘汰，未來將不再更新。

以監督方式為分類或迴歸模型定型

類別：機器學習/定型

注意

適用于：僅限機器學習 Studio (傳統)

Azure Machine Learning 設計工具中提供類似的拖放模組。

模組概觀

本文描述如何使用機器學習 Studio (傳統) 中的「定型模型」模組來定型分類或回歸模型。定型是在您定義模型並設定其參數之後進行，需要已標記的資料。您也可以使用定型模型，以新的資料重新定型現有的模型。

定型流程的運作方式

在機器學習中，建立和使用機器學習模型通常是三個步驟的程式。

您可以選擇特定類型的演算法並定義其參數或超參數，以設定模型。選擇下列任何模型類型：
- 以類神經網路、決策樹、決策樹系和其他演算法為基礎的分類模型。
- 回歸模型，其中可能包括標準線性回歸，或使用其他演算法（包括類神經網路和 Baysian 回歸）的回歸模型。
提供已標記且資料與演算法相容的資料集。將資料和模型都連線至定型模型。

定型產生的是特定的二進位格式 .ilearner，它會封裝從資料學習到的統計模式。您無法直接修改或讀取此格式;不過，Studio (傳統) 中的其他模組可以使用此定型模型。

您也可以檢視模型的屬性。如需詳細資訊，請參閱結果一節。
定型完成之後，請使用定型的模型搭配其中一個評分模組，以對新資料進行預測。

注意

其他特製化的機器學習工作需要不同的定型方法，而 Studio (傳統) 為它們提供個別的定型模組。例如，「影像偵測」、「叢集」和「異常 detction 全都使用自訂定型方法。 定型模型 僅適用于回歸和分類模型。

受監督和非監督式訓練

您可能聽說過受監督或 非監督式 學習的條款。使用 定型模型 定型分類或回歸模型是受 監督機器學習的典型範例。這表示您必須提供一個資料集，其中包含要從中學習模式的歷程記錄資料。資料應該同時包含 (標籤) 您嘗試預測的結果，以及) (變數的相關因素。機器學習模型需要結果，以判斷最能預測結果的功能。

在定型過程中，資料會依結果排序，而演算法會將統計模式解壓縮以建立模型。

非監督式 learning 表示結果不明，或您選擇不使用已知標籤。例如，叢集演算法通常會採用非監督式學習方法，但可使用標籤（如果有的話）。另一個範例是使用 LDA的主題模型。您無法搭配這些演算法使用 定型模型 。

提示

機器學習服務的新手嗎？本教學課程會逐步引導您取得資料、設定演算法、定型，然後使用模型的程式：建立您的第一個機器學習實驗

如何使用定型模型

在機器學習 Studio (傳統) 中，設定分類模型或回歸模型模型。

您也可以定型使用 Create R model建立的自訂模型。
將「 定型模型 」模組加入實驗中。您可以在 [機器學習] 類別下找到此模組。展開 [ 定型]，然後將 [ 定型模型 ] 模組拖曳到您的實驗中。
在左側輸入中，附加未定型的模型。將定型資料集附加至定型模型的右側輸入。

定型資料集必須包含標籤資料行。任何不含標籤的資料列會被忽略。
針對 [ 標籤] 資料行，按一下 [ 啟動資料行選取器]，然後選擇包含模型可用於定型之結果的單一資料行。
- 若為分類問題，標籤資料行必須包含分類值或離散值。例子，是/否評等、疾病分類碼或名稱，或收入組別。如果您挑選非類別資料行，此模組將會在定型期間傳回錯誤。
- 若為迴歸問題，標籤資料行必須包含數值資料，代表反應變數。在觀念上，數值資料代表連續量表。
例如，信用風險分數、硬碟的故障預測時間，或預測客服中心在特定一天或時間的來電數。如果不選擇數值資料行，可能會發生錯誤。
- 如果您未指定要使用哪個標籤資料行，機器學習將會使用資料集的中繼資料，嘗試推斷哪個是適當的標籤資料行。如果挑選錯誤的資料行，請使用資料行選取器來修正。
提示

如果您使用資料行選取器時有困難，請參閱選取資料集的資料行一文中的秘訣。其中描述一些常見的情節和 WITH RULES 和 BY NAME 選項的使用秘訣。
執行實驗。如果您有大量資料，這可能需要一些時間。

結果

定型模型之後：

若要查看模型參數和功能加權，請以滑鼠右鍵按一下輸出，然後選取 [ 視覺化]。
若要在其他實驗中使用模型，請以滑鼠右鍵按一下模型，然後選取 [ 儲存模型]。輸入模型的名稱。

這會將模型儲存為快照，而不會透過重複執行實驗來更新。
若要使用模型來預測新的值，請將它連接到「評分模型」模組，以及新的輸入資料。

如果您需要訓練 定型模型不支援的模型類型，有幾個選項可供選擇：

使用 R 腳本建立自訂計分方法，或使用許多可用的 R 計分套件之一。
- 建立 R 模型
- 執行 R 指令碼
撰寫您自己的 Python 腳本來訓練和評分模型，或使用現有的 Python 程式庫：
- 執行 Python 指令碼
異常偵測模型
- 定型異常偵測模型可支援 Studio (傳統) 中的異常偵測模組。
建議模型
- 如果您的模型使用機器學習中提供的 Matchbox 建議，請使用 [定型 Matchbox 推薦] 模組。
- 如果您針對購物籃分析或建議使用不同的演算法，請在 R 腳本或 Python 腳本中使用其訓練方法。
叢集模型
- 針對包含的 K 表示演算法使用定型群集模型。
- 針對其他叢集模型，請使用 R 腳本或 Python 腳本模組來設定和定型模型。

範例

如需如何在機器學習實驗中使用「 定型模型 」模組的範例，請參閱 Azure AI 資源庫中的這些實驗：

零售預測：示範如何建立、定型和比較多個模型。
航班延誤預測：示範如何訓練多個相關的分類模型。

預期的輸入

名稱	類型	描述
未定型的模型	ILearner 介面	未定型的學習模組
資料集	資料表	訓練資料

模組參數

名稱	範圍	類型	預設	描述
標籤資料行	任意	ColumnSelection		選取包含標籤或結果資料行的資料行

輸出

名稱	類型	Description
定型的模型	ILearner 介面	定型的學習模組

例外狀況

如需所有模組錯誤的清單，請參閱模組錯誤碼。

例外狀況	描述
錯誤 0032	如果引數不是數字，就會發生例外狀況。
錯誤 0033	如果引數無限制，就會發生例外狀況。
錯誤 0083	如果用於定型的資料集不適用於具體類型的學習模組，就會發生例外狀況。
錯誤 0035	若未提供指定使用者或項目的特徵，就會發生例外狀況。
錯誤 0003	如果一或多個輸入為 Null 或空白，就會發生例外狀況。
錯誤 0020	如果傳至模組的某些資料集中的資料行數目太少，就會發生例外狀況。
錯誤 0021	如果傳至模組的某些資料集中的資料列數目太少，就會發生例外狀況。
錯誤 0013	如果傳遞給學習模組的類型無效，就會發生例外狀況。

另請參閱

評估模型
 A-Z 模組清單