AutoML 分類
本文描述 Azure Machine Learning 設計工具中的一個元件。
使用此元件來建立以 AutoML 分類為基礎的機器學習模型。
如何設定
此元件會在表格式資料上建立分類模型。
此模型需要訓練資料集。 驗證和測試資料集是選擇性的。
AutoML 會平行建立一些管線,以嘗試模型的不同演算法和參數。 服務會逐一查看與特徵選取項目配對的 ML 演算法,其中每個反覆項目都會產生具有定型分數的模型。 您可以選擇要讓模型優化的計量。 所選計量的分數越好,模型就會被視為「符合」您的資料。 您可以定義實驗的結束準則。 結束準則將會是模型,其中包含您想要 AutoML 尋找的特定定型分數。 一旦達到定義的結束準則,它就會停止。 此元件接著會輸出在資料集執行結束時產生的最佳模型。
將 AutoML 分類 元件新增至管線。
指定您想要模型輸出的目標資料行
針對 [分類],您也可以啟用深度學習。
如果啟用了深度學習,則驗證會限制為 train_validation 分割。
(選擇性) 檢視其他組態設定:可用來更進一步控制訓練作業的其他設定。 否則會根據實驗選取範圍和資料來套用預設值。
其他組態 描述 主要計量 用來評分模型的主要計量。 深入了解模型計量。 透過負責任 AI 儀表板偵錯模型 產生負責任 AI 儀表板,以針對建議的最佳模型進行整體評定和偵錯。 這包括模型說明、公平性和效能總管、資料總管和模型錯誤分析等深入解析。 深入瞭解如何產生負責任 AI 儀表板。 封鎖的演算法 選取要從訓練作業中排除的演算法。
允許演算法僅用於 SDK 實驗。
請參閱每個工作類型支援的模型。結束準則 當符合其中任何一項準則時,訓練作業即會停止。
訓練作業時間 (小時):允許訓練作業執行的時間長度。
計量分數閾值:所有管線的最低計量分數。 這可確保若擁有想要達到的已定義目標計量,則不會在訓練作業上花費超過必要程度的時間。並行 並行反覆項目上限:要在訓練作業中測試的管線 (反覆項目) 數量上限。 作業不會執行超過指定數量的反覆項目。 深入瞭解自動化 ML 如何執行叢集上的多個子作業。 [選擇性] 驗證和測試表單可讓您執行下列作業。
指定要用於訓練作業的驗證類型。
提供測試資料集 (預覽) 來評估自動化 ML 在實驗結束時為您產生的建議模型。 您提供測試資料時,測試作業會在實驗結束時進行自動觸發。 此測試作業只會在自動化 ML 所建議的最佳模型上作業。
重要
提供測試資料集來評估產生的模型是預覽功能。 此功能是實驗性預覽功能,而且可能隨時變更。
- 測試資料會被視為與訓練和驗證不同,因此不會使得建議模型的測試作業結果產生偏差。 深入了解模型驗證期間的偏差。
- 您可以提供自己的測試資料集,或選擇使用訓練資料集的百分比。 測試資料的格式必須是 Azure Machine Learning TabularDataset。
- 測試資料集的結構描述應該符合訓練資料集。 目標資料行是選擇性的,但如果沒有指定目標資料行,則不會計算任何測試單位。
- 測試資料集不應與訓練資料集或驗證資料集相同。
後續步驟
請參閱 Azure Machine Learning 可用的元件集。