automl 套件

參考

包含 Azure Machine Learning SDKv2 的自動化機器學習類別。

主要區域包括管理 AutoML 工作。

類別

ClassificationJob	AutoML 分類作業的設定。初始化新的 AutoML 分類工作。
ColumnTransformer	資料行轉換程式設定。
ForecastingJob	AutoML 預測工作的設定。初始化新的 AutoML 預測工作。
ForecastingSettings	AutoML 作業的預測設定。
ImageClassificationJob	AutoML 多類別影像分類作業的設定。初始化新的 AutoML 多類別影像分類作業。
ImageClassificationMultilabelJob	AutoML 多標籤影像分類作業的設定。初始化新的 AutoML 多標籤影像分類作業。
ImageClassificationSearchSpace	AutoML 影像分類和影像分類多標籤工作的搜尋空間。
ImageInstanceSegmentationJob	AutoML 映射實例分割作業的設定。初始化新的 AutoML 映射實例分割作業。
ImageLimitSettings	限制 AutoML 影像垂直設定。 ImageLimitSettings 是包含下列參數的類別：max_concurrent_trials、max_trials和timeout_minutes。這是選擇性的組態方法，可用來設定限制參數，例如逾時等。注意同時執行之數目會受限於指定計算目標中的可用資源。請確保計算目標有資源可用於所需的並行作業。提示最好讓max_concurrent_trials計數與叢集中的節點數目相符。例如，如果您有具有 4 個節點的叢集，請將 max_concurrent_trials 設定為 4。使用方式範例 ImageLimitSettings 的設定 from azure.ai.ml import automl # Create the AutoML job with the related factory-function. image_instance_segmentation_job = automl.image_instance_segmentation( compute=compute_name, experiment_name=exp_name, training_data=my_training_data_input, validation_data=my_validation_data_input, target_column_name="label", primary_metric="MeanAveragePrecision", tags={"my_custom_tag": "custom value"}, ) # Set the limits for the AutoML job. image_instance_segmentation_job.set_limits( max_trials=10, max_concurrent_trials=2, ) # Submit the AutoML job. image_instance_segmentation_job.submit() 初始化 ImageLimitSettings 物件。 AutoML 影像垂直的 ImageLimitSettings 建構函式。
ImageModelSettingsClassification	AutoML 影像分類工作的模型設定。
ImageModelSettingsObjectDetection	AutoML 影像物件偵測工作的模型設定。
ImageObjectDetectionJob	AutoML 影像物件偵測作業的組態。初始化新的 AutoML 影像物件偵測作業。
ImageObjectDetectionSearchSpace	AutoML 影像物件偵測和影像實例分割工作的搜尋空間。
ImageSweepSettings	所有 AutoML 影像垂直的掃掠設定。
NlpFeaturizationSettings	所有 AutoML NLP Verticals 的特徵化設定。
NlpFixedParameters	物件，可存放 NLP 作業的固定參數。
NlpLimitSettings	限制所有 AutoML NLP Verticals 的設定。
NlpSearchSpace	AutoML NLP 工作的搜尋空間。
NlpSweepSettings	所有 AutoML NLP 工作的掃掠設定。
RegressionJob	AutoML 回歸作業的組態。初始化新的 AutoML 回歸工作。
SearchSpace	AutoML 垂直的 SearchSpace 類別。
StackEnsembleSettings	預先設定以自訂 StackEnsemble 執行。
TabularFeaturizationSettings	AutoML 作業的特徵化設定。
TabularLimitSettings	限制 AutoML 資料表垂直設定。
TextClassificationJob	AutoML 文字分類作業的設定。初始化新的 AutoML 文字分類工作。
TextClassificationMultilabelJob	AutoML 文字分類多標籤作業的設定。初始化新的 AutoML 文字分類多標籤工作。
TextNerJob	AutoML 文字 NER 作業的設定。初始化新的 AutoML 文字 NER 工作。
TrainingSettings	Azure Machine Learning 的 TrainingSettings 類別。 Azure Machine Learning 的 TrainingSettings 類別。

列舉

BlockedTransformers	AutoML 支援的所有分類模型列舉。
ClassificationModels	AutoML 支援的所有分類模型列舉。
ClassificationMultilabelPrimaryMetrics	分類多標籤工作的主要計量。
ClassificationPrimaryMetrics	分類工作的主要計量。
FeaturizationMode	特徵化模式 - 決定資料特徵化模式。
ForecastHorizonMode	列舉，以判斷預測範圍選取模式。
ForecastingModels	AutoML 支援的所有預測模型列舉。
ForecastingPrimaryMetrics	預測工作的主要計量。
InstanceSegmentationPrimaryMetrics	InstanceSegmentation 工作的主要計量。
LearningRateScheduler	學習速率排程器列舉。
LogTrainingMetrics	包含 Azure Machine Learning SDKv2 的自動化機器學習類別。主要區域包括管理 AutoML 工作。
LogValidationLoss	包含 Azure Machine Learning SDKv2 的自動化機器學習類別。主要區域包括管理 AutoML 工作。
NCrossValidationsMode	決定如何判斷 N-Cross 驗證值。
ObjectDetectionPrimaryMetrics	Image ObjectDetection 工作的主要計量。
RegressionModels	AutoML 支援的所有回歸模型列舉。
RegressionPrimaryMetrics	回歸工作的主要計量。
SamplingAlgorithmType	包含 Azure Machine Learning SDKv2 的自動化機器學習類別。主要區域包括管理 AutoML 工作。
ShortSeriesHandlingConfiguration	參數，定義 AutoML 是否應該處理簡短的時間序列。
StochasticOptimizer	影像模型的隨機優化器。
TargetAggregationFunction	目標彙總函式。
TargetLagsMode	目標延隔選取模式。
TargetRollingWindowSizeMode	目標滾動視窗大小模式。
UseStl	設定時間序列目標資料行的 STL 分解。
ValidationMetricType	用於映射工作中驗證計量的計量計算方法。

函數

classification

用來建立 ClassificationJob 的函式。

分類作業可用來定型最適合預測資料樣本類別的模型。各種模型都是使用定型資料來定型。根據主要計量，在驗證資料上具有最佳效能的模型會選取為最終模型。

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

參數

training_data: Input

實驗中使用的定型資料。它應該同時包含訓練功能和標籤資料行 (範例加權資料行) 。

target_column_name: str

標籤資料行的名稱。此參數適用于 training_data 、 validation_data 和 test_data 參數

primary_metric

自動化 Machine Learning 將針對模型選取進行優化的計量。自動化機器學習會收集比優化更多的計量。如需如何計算計量的詳細資訊，請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric 。

可接受的值：精確度、AUC_weighted、norm_macro_recall、average_precision_score_weighted和precision_score_weighted精確度預設值

enable_model_explainability: bool

是否要在所有 AutoML 定型反復專案結束時啟用說明最佳 AutoML 模型。預設值為 None。如需詳細資訊，請參閱自動化機器學習中的解譯性：模型說明。

weight_column_name: str

範例加權資料行的名稱。自動化 ML 支援加權資料行做為輸入，導致資料中的資料列向上或向下加權。如果輸入資料來自 pandas。沒有資料行名稱的資料框架，可以改用資料行索引，以整數表示。

此參數適用于 training_data 和 validation_data 參數

validation_data: Input

實驗中使用的驗證資料。它應該同時包含訓練功能和標籤資料行， (選擇性地包含範例加權資料行) 。

預設值為 None

validation_data_size: float

未指定使用者驗證資料時，要保留的資料分數以進行驗證。這應該介於 0.0 到 1.0 之間，非包含。

指定 validation_data 以提供驗證資料，否則請設定 n_cross_validations 或 validation_data_size 從指定的定型資料擷取驗證資料。針對自訂交叉驗證折迭，請使用 cv_split_column_names 。

如需詳細資訊，請參閱在自動化機器學習中設定資料分割和交叉驗證。

預設值為 None

n_cross_validations: Union[str, int]

未指定使用者驗證資料時要執行的交叉驗證數目。

指定 validation_data 以提供驗證資料，否則請設定 n_cross_validations 或 validation_data_size ，以從指定的定型資料中擷取驗證資料。針對自訂交叉驗證折迭，請使用 cv_split_column_names 。

如需詳細資訊，請參閱在自動化機器學習中設定資料分割和交叉驗證。

預設值為 None

cv_split_column_names: List[str]

包含自訂交叉驗證分割之資料行的名稱清單。每個 CV 分割資料行都代表一個 CV 分割，其中每個資料列都標示為 1 以進行定型或 0 進行驗證。

預設值為 None

test_data: Input

使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能，隨時可能會變更。要用於測試回合的測試資料，將在模型定型完成後自動啟動。測試回合會使用最佳模型取得預測，而且會計算這些預測的計量。

如果未指定此參數或參數， test_data_size 則模型定型完成後，將不會自動執行任何測試回合。測試資料應該同時包含功能和標籤資料行。如果 test_data 已指定， target_column_name 則必須指定參數。

預設值為 None

test_data_size: float

使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能，隨時可能會變更。要保留測試回合之測試資料的定型資料分數，這些測試回合會在模型定型完成後自動啟動。測試回合會使用最佳模型取得預測，而且會計算這些預測的計量。

這應該介於 0.0 到 1.0 之間。如果 test_data_size 同時指定為 validation_data_size ，則在分割驗證資料之前，會先 training_data 分割測試資料。例如，如果 validation_data_size=0.1 和 test_data_size=0.1 原始定型資料有 1000 個數據列，則測試資料會有 100 個數據列，驗證資料將包含 90 個數據列，而定型資料會有 810 個數據列。

針對回歸型工作，會使用隨機取樣。針對分類工作，會使用分層取樣。預測目前不支援使用定型/測試分割來指定測試資料集。

如果未指定此參數或參數， test_data 則模型定型完成後，將不會自動執行任何測試回合。

預設值為 None

傳回

可提交至 Azure ML 計算以執行的工作物件。

傳回類型

ClassificationJob

forecasting

用來建立預測工作的函式。

預測工作是用來根據歷史資料預測未來時段的目標值。各種模型都是使用定型資料來定型。根據主要計量，在驗證資料上具有最佳效能的模型會選取為最終模型。

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

參數

training_data: Input

實驗中使用的定型資料。它應該同時包含訓練功能和標籤資料行， (選擇性地包含範例加權資料行) 。

target_column_name: str

標籤資料行的名稱。此參數適用于 training_data 、 validation_data 和 test_data 參數

primary_metric

自動化機器學習會針對模型選取進行優化計量。自動化機器學習會收集比優化更多的計量。如需如何計算計量的詳細資訊，請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric 。

可接受的值：r2_score、normalized_mean_absolute_error、normalized_root_mean_squared_error預設值為 normalized_root_mean_squared_error

enable_model_explainability: bool

是否要在所有 AutoML 定型反復專案結束時啟用說明最佳 AutoML 模型。預設值為 None。如需詳細資訊，請參閱可解譯性：自動化機器學習中的模型說明。

weight_column_name: str

此參數適用于 training_data 和 validation_data 參數

validation_data: Input

實驗中使用的驗證資料。它應該同時包含訓練功能和標籤資料行， (選擇性地包含範例加權資料行) 。

預設值為 None

validation_data_size: float

未指定使用者驗證資料時要保留的資料分數以進行驗證。這應該介於 0.0 到 1.0 之間。

如需詳細資訊，請參閱在自動化機器學習中設定資料分割和交叉驗證。

預設值為 None

n_cross_validations: Union[str, int]

未指定使用者驗證資料時要執行的交叉驗證數目。

如需詳細資訊，請參閱在自動化機器學習中設定資料分割和交叉驗證。

預設值為 None

cv_split_column_names: List[str]

包含自訂交叉驗證分割之資料行的名稱清單。每個 CV 分割資料行都代表一個 CV 分割，其中每個資料列都標示為 1 以進行定型或 0 進行驗證。

預設值為 None

test_data: Input

預設值為 None

test_data_size: float

針對回歸型工作，會使用隨機取樣。針對分類工作，會使用分層取樣。預測目前不支援使用定型/測試分割來指定測試資料集。

如果未指定此參數或參數， test_data 則模型定型完成後，將不會自動執行任何測試回合。

預設值為 None

forecasting_settings: ForecastingSettings

預測工作的設定

傳回

可提交至 Azure ML 計算以執行的工作物件。

傳回類型

ForecastingJob

image_classification

建立 AutoML 影像多類別分類作業的物件。

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

參數

training_data: Input

實驗中使用的定型資料。

target_column_name: str

標籤資料行的名稱。此參數適用于 training_data 和 validation_data 參數。

primary_metric

可接受的值：精確度、AUC_weighted、norm_macro_recall、average_precision_score_weighted和precision_score_weighted預設值。

validation_data: Input

實驗中使用的驗證資料。

validation_data_size: float

未指定使用者驗證資料時要保留的資料分數以進行驗證。這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料，否則設定 validation_data_size 為從指定的定型資料擷取驗證資料。

預設值為 .2

kwargs: dict

其他組態參數的字典。

傳回

可以提交至 Azure ML 計算以進行執行的影像分類工作物件。

傳回類型

ImageClassificationJob

image_classification_multilabel

建立 AutoML 影像多重標籤分類作業的物件。

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

參數

training_data: Input

實驗中使用的定型資料。

target_column_name: str

標籤資料行的名稱。此參數適用于 training_data 和 validation_data 參數。

primary_metric

可接受的值：精確度、AUC_weighted、norm_macro_recall、average_precision_score_weighted、precision_score_weighted和 Iou 預設值為 Iou。

validation_data: Input

實驗中使用的驗證資料。

validation_data_size: float

未指定使用者驗證資料時要保留的資料分數以進行驗證。這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料，否則設定 validation_data_size 為從指定的定型資料擷取驗證資料。

預設值為 .2

kwargs: dict

其他組態參數的字典。

傳回

影像多標籤分類工作物件，可提交至 Azure ML 計算以供執行。

傳回類型

ImageClassificationMultilabelJob

image_instance_segmentation

建立 AutoML 影像實例分割作業的物件。

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

參數

training_data: Input

實驗中使用的定型資料。

target_column_name: str

標籤資料行的名稱。此參數適用于 training_data 和 validation_data 參數。

primary_metric

可接受的值：MeanAveragePrecision 預設值為 MeanAveragePrecision。

validation_data: Input

實驗中使用的驗證資料。

validation_data_size: float

未指定使用者驗證資料時要保留的資料分數以進行驗證。這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料，否則設定 validation_data_size 為從指定的定型資料擷取驗證資料。

預設值為 .2

kwargs: dict

其他組態參數的字典。

傳回

影像實例分割作業

傳回類型

ImageInstanceSegmentationJob

image_object_detection

建立 AutoML 影像物件偵測作業的物件。

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

參數

training_data: Input

實驗中使用的定型資料。

target_column_name: str

標籤資料行的名稱。此參數適用于 training_data 和 validation_data 參數。

primary_metric

可接受的值：MeanAveragePrecision 預設值為 MeanAveragePrecision。

validation_data: Input

實驗中使用的驗證資料。

validation_data_size: float

未指定使用者驗證資料時要保留的資料分數以進行驗證。這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料，否則設定 validation_data_size 為從指定的定型資料擷取驗證資料。

預設值為 .2

kwargs: dict

其他組態參數的字典。

傳回

可以提交至 Azure ML 計算以執行之影像物件偵測工作物件。

傳回類型

ImageObjectDetectionJob

regression

用來建立回歸作業的函式。

回歸作業可用來定型模型，以從資料集預測目標變數的連續值。各種模型都是使用定型資料來定型。根據主要計量，在驗證資料上具有最佳效能的模型會選取為最終模型。

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

參數

training_data: Input

實驗中使用的定型資料。它應該同時包含訓練功能和標籤資料行， (選擇性地包含範例加權資料行) 。

target_column_name: str

標籤資料行的名稱。此參數適用于 training_data 、 validation_data 和 test_data 參數

primary_metric

可接受的值：spearman_correlation、r2_score、normalized_mean_absolute_error normalized_root_mean_squared_error。預設為 normalized_root_mean_squared_error

enable_model_explainability: bool

是否要在所有 AutoML 定型反復專案結束時啟用說明最佳 AutoML 模型。預設值為 None。如需詳細資訊，請參閱可解譯性：自動化機器學習中的模型說明。

weight_column_name: str

此參數適用于 training_data 和 validation_data 參數

validation_data: Input

實驗中使用的驗證資料。它應該同時包含訓練功能和標籤資料行， (選擇性地包含範例加權資料行) 。

預設值為 None

validation_data_size: float

未指定使用者驗證資料時要保留的資料分數以進行驗證。這應該介於 0.0 到 1.0 之間。

如需詳細資訊，請參閱在自動化機器學習中設定資料分割和交叉驗證。

預設值為 None

n_cross_validations: Union[str, int]

未指定使用者驗證資料時要執行的交叉驗證數目。

如需詳細資訊，請參閱在自動化機器學習中設定資料分割和交叉驗證。

預設值為 None

cv_split_column_names: List[str]

包含自訂交叉驗證分割之資料行的名稱清單。每個 CV 分割資料行都代表一個 CV 分割，其中每個資料列都標示為 1 以進行定型或 0 進行驗證。

預設值為 None

test_data: Input

預設值為 None

test_data_size: float

針對回歸型工作，會使用隨機取樣。針對分類工作，會使用分層取樣。預測目前不支援使用定型/測試分割來指定測試資料集。

如果未指定此參數或參數， test_data 則模型定型完成後，將不會自動執行任何測試回合。

預設值為 None

傳回

可提交至 Azure ML 計算以執行的工作物件。

傳回類型

RegressionJob

text_classification

用來建立 TextClassificationJob 的函式。

文字分類作業可用來定型可預測文字資料類別/類別的模型。輸入定型資料應該包含目標資料行，可將文字分類成一個類別。

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

參數

training_data: Input

實驗中使用的定型資料。它應該同時包含訓練功能和目標資料行。

target_column_name: str

目標資料行的名稱。

validation_data: Input

實驗中使用的驗證資料。它應該同時包含訓練功能和目標資料行。

primary_metric: Union[str, ClassificationPrimaryMetrics]

工作的主要計量。可接受的值：精確度、AUC_weighted、precision_score_weighted

log_verbosity: str

記錄詳細資訊層級。

kwargs: dict

其他組態參數的字典。

傳回

TextClassificationJob 物件。

傳回類型

TextClassificationJob

text_classification_multilabel

用來建立 TextClassificationMultilabelJob 的函式。

文字分類多標籤作業可用來定型模型，以預測文字資料的類別/類別。輸入訓練資料應包含目標資料行，可將文字分類為類別 (es) 。如需多標籤資料格式的詳細資訊，請參閱： https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

參數

training_data: Input

實驗中使用的定型資料。它應該同時包含訓練功能和目標資料行。

target_column_name: str

目標資料行的名稱。

validation_data: Input

實驗中使用的驗證資料。它應該同時包含訓練功能和目標資料行。

primary_metric: str

工作的主要計量。可接受的值：精確度

log_verbosity: str

記錄詳細資訊層級。

kwargs: dict

其他組態參數的字典。

傳回

TextClassificationMultilabelJob 物件。

傳回類型

TextClassificationMultilabelJob

text_ner

用來建立 TextNerJob 的函式。

具名實體辨識作業的文字可用來定型模型，以預測文字中的具名實體。輸入定型資料應該是 CoNLL 格式的文字檔。如需文字 NER 資料格式的詳細資訊，請參閱： https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

參數

training_data: Input

實驗中使用的定型資料。它應該同時包含訓練功能和目標資料行。

validation_data: Input

實驗中使用的驗證資料。它應該同時包含訓練功能和目標資料行。

primary_metric: str

工作的主要計量。可接受的值：精確度

log_verbosity: str

記錄詳細資訊層級。

kwargs: dict

其他組態參數的字典。

傳回

TextNerJob 物件。

傳回類型

TextNerJob

automl 套件

類別

列舉

函數

classification

參數

傳回

傳回類型

forecasting

參數

傳回

傳回類型

image_classification

參數

傳回

傳回類型

image_classification_multilabel

參數

傳回

傳回類型

image_instance_segmentation

參數

傳回

傳回類型

image_object_detection

參數

傳回

傳回類型

regression

參數

傳回

傳回類型

text_classification

參數

傳回

傳回類型

text_classification_multilabel

參數

傳回

傳回類型

text_ner

參數

傳回

傳回類型

意見反應

其他資源