automl 套件

包含 Azure Machine Learning SDKv2 的自動化機器學習類別。

主要區域包括管理 AutoML 工作。

類別

ClassificationJob

AutoML 分類作業的設定。

初始化新的 AutoML 分類工作。

ColumnTransformer

資料行轉換程式設定。

ForecastingJob

AutoML 預測工作的設定。

初始化新的 AutoML 預測工作。

ForecastingSettings

AutoML 作業的預測設定。

ImageClassificationJob

AutoML 多類別影像分類作業的設定。

初始化新的 AutoML 多類別影像分類作業。

ImageClassificationMultilabelJob

AutoML 多標籤影像分類作業的設定。

初始化新的 AutoML 多標籤影像分類作業。

ImageClassificationSearchSpace

AutoML 影像分類和影像分類多標籤工作的搜尋空間。

ImageInstanceSegmentationJob

AutoML 映射實例分割作業的設定。

初始化新的 AutoML 映射實例分割作業。

ImageLimitSettings

限制 AutoML 影像垂直設定。

ImageLimitSettings 是包含下列參數的類別:max_concurrent_trials、max_trials和timeout_minutes。

這是選擇性的組態方法,可用來設定限制參數,例如逾時等。

注意

同時執行之數目會受限於指定計算目標中的可用資源。

請確保計算目標有資源可用於所需的並行作業。

提示

最好讓max_concurrent_trials計數與叢集中的節點數目相符。

例如,如果您有具有 4 個節點的叢集,請將 max_concurrent_trials 設定為 4。

使用方式範例

ImageLimitSettings 的設定


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

初始化 ImageLimitSettings 物件。

AutoML 影像垂直的 ImageLimitSettings 建構函式。

ImageModelSettingsClassification

AutoML 影像分類工作的模型設定。

ImageModelSettingsObjectDetection

AutoML 影像物件偵測工作的模型設定。

ImageObjectDetectionJob

AutoML 影像物件偵測作業的組態。

初始化新的 AutoML 影像物件偵測作業。

ImageObjectDetectionSearchSpace

AutoML 影像物件偵測和影像實例分割工作的搜尋空間。

ImageSweepSettings

所有 AutoML 影像垂直的掃掠設定。

NlpFeaturizationSettings

所有 AutoML NLP Verticals 的特徵化設定。

NlpFixedParameters

物件,可存放 NLP 作業的固定參數。

NlpLimitSettings

限制所有 AutoML NLP Verticals 的設定。

NlpSearchSpace

AutoML NLP 工作的搜尋空間。

NlpSweepSettings

所有 AutoML NLP 工作的掃掠設定。

RegressionJob

AutoML 回歸作業的組態。

初始化新的 AutoML 回歸工作。

SearchSpace

AutoML 垂直的 SearchSpace 類別。

StackEnsembleSettings

預先設定以自訂 StackEnsemble 執行。

TabularFeaturizationSettings

AutoML 作業的特徵化設定。

TabularLimitSettings

限制 AutoML 資料表垂直設定。

TextClassificationJob

AutoML 文字分類作業的設定。

初始化新的 AutoML 文字分類工作。

TextClassificationMultilabelJob

AutoML 文字分類多標籤作業的設定。

初始化新的 AutoML 文字分類多標籤工作。

TextNerJob

AutoML 文字 NER 作業的設定。

初始化新的 AutoML 文字 NER 工作。

TrainingSettings

Azure Machine Learning 的 TrainingSettings 類別。

Azure Machine Learning 的 TrainingSettings 類別。

列舉

BlockedTransformers

AutoML 支援的所有分類模型列舉。

ClassificationModels

AutoML 支援的所有分類模型列舉。

ClassificationMultilabelPrimaryMetrics

分類多標籤工作的主要計量。

ClassificationPrimaryMetrics

分類工作的主要計量。

FeaturizationMode

特徵化模式 - 決定資料特徵化模式。

ForecastHorizonMode

列舉,以判斷預測範圍選取模式。

ForecastingModels

AutoML 支援的所有預測模型列舉。

ForecastingPrimaryMetrics

預測工作的主要計量。

InstanceSegmentationPrimaryMetrics

InstanceSegmentation 工作的主要計量。

LearningRateScheduler

學習速率排程器列舉。

LogTrainingMetrics

包含 Azure Machine Learning SDKv2 的自動化機器學習類別。

主要區域包括管理 AutoML 工作。

LogValidationLoss

包含 Azure Machine Learning SDKv2 的自動化機器學習類別。

主要區域包括管理 AutoML 工作。

NCrossValidationsMode

決定如何判斷 N-Cross 驗證值。

ObjectDetectionPrimaryMetrics

Image ObjectDetection 工作的主要計量。

RegressionModels

AutoML 支援的所有回歸模型列舉。

RegressionPrimaryMetrics

回歸工作的主要計量。

SamplingAlgorithmType

包含 Azure Machine Learning SDKv2 的自動化機器學習類別。

主要區域包括管理 AutoML 工作。

ShortSeriesHandlingConfiguration

參數,定義 AutoML 是否應該處理簡短的時間序列。

StochasticOptimizer

影像模型的隨機優化器。

TargetAggregationFunction

目標彙總函式。

TargetLagsMode

目標延隔選取模式。

TargetRollingWindowSizeMode

目標滾動視窗大小模式。

UseStl

設定時間序列目標資料行的 STL 分解。

ValidationMetricType

用於映射工作中驗證計量的計量計算方法。

函數

classification

用來建立 ClassificationJob 的函式。

分類作業可用來定型最適合預測資料樣本類別的模型。 各種模型都是使用定型資料來定型。 根據主要計量,在驗證資料上具有最佳效能的模型會選取為最終模型。

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

參數

training_data
Input

實驗中使用的定型資料。 它應該同時包含訓練功能和標籤資料行 (範例加權資料行) 。

target_column_name
str

標籤資料行的名稱。 此參數適用于 training_datavalidation_datatest_data 參數

primary_metric

自動化 Machine Learning 將針對模型選取進行優化的計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric

可接受的值:精確度、AUC_weighted、norm_macro_recall、average_precision_score_weighted和precision_score_weighted精確度預設值

enable_model_explainability
bool

是否要在所有 AutoML 定型反復專案結束時啟用說明最佳 AutoML 模型。 預設值為 None。 如需詳細資訊,請參閱 自動化機器學習中的解譯性:模型說明

weight_column_name
str

範例加權資料行的名稱。 自動化 ML 支援加權資料行做為輸入,導致資料中的資料列向上或向下加權。 如果輸入資料來自 pandas。沒有資料行名稱的資料框架,可以改用資料行索引,以整數表示。

此參數適用于 training_datavalidation_data 參數

validation_data
Input

實驗中使用的驗證資料。 它應該同時包含訓練功能和標籤資料行, (選擇性地包含範例加權資料行) 。

預設值為 None

validation_data_size
float

未指定使用者驗證資料時,要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間,非包含。

指定 validation_data 以提供驗證資料,否則請設定 n_cross_validationsvalidation_data_size 從指定的定型資料擷取驗證資料。 針對自訂交叉驗證折迭,請使用 cv_split_column_names

如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證

預設值為 None

n_cross_validations
Union[str, int]

未指定使用者驗證資料時要執行的交叉驗證數目。

指定 validation_data 以提供驗證資料,否則請設定 n_cross_validationsvalidation_data_size ,以從指定的定型資料中擷取驗證資料。 針對自訂交叉驗證折迭,請使用 cv_split_column_names

如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證

預設值為 None

cv_split_column_names
List[str]

包含自訂交叉驗證分割之資料行的名稱清單。 每個 CV 分割資料行都代表一個 CV 分割,其中每個資料列都標示為 1 以進行定型或 0 進行驗證。

預設值為 None

test_data
Input

使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要用於測試回合的測試資料,將在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。

如果未指定此參數或 參數, test_data_size 則模型定型完成後,將不會自動執行任何測試回合。 測試資料應該同時包含功能和標籤資料行。 如果 test_data 已指定 , target_column_name 則必須指定 參數。

預設值為 None

test_data_size
float

使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要保留測試回合之測試資料的定型資料分數,這些測試回合會在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。

這應該介於 0.0 到 1.0 之間。 如果 test_data_size 同時指定 為 validation_data_size ,則在分割驗證資料之前,會先 training_data 分割測試資料。 例如,如果 validation_data_size=0.1test_data_size=0.1 原始定型資料有 1000 個數據列,則測試資料會有 100 個數據列,驗證資料將包含 90 個數據列,而定型資料會有 810 個數據列。

針對回歸型工作,會使用隨機取樣。 針對分類工作,會使用分層取樣。 預測目前不支援使用定型/測試分割來指定測試資料集。

如果未指定此參數或 參數, test_data 則模型定型完成後,將不會自動執行任何測試回合。

預設值為 None

傳回

可提交至 Azure ML 計算以執行的工作物件。

傳回類型

forecasting

用來建立預測工作的函式。

預測工作是用來根據歷史資料預測未來時段的目標值。 各種模型都是使用定型資料來定型。 根據主要計量,在驗證資料上具有最佳效能的模型會選取為最終模型。

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

參數

training_data
Input

實驗中使用的定型資料。 它應該同時包含訓練功能和標籤資料行, (選擇性地包含範例加權資料行) 。

target_column_name
str

標籤資料行的名稱。 此參數適用于 training_datavalidation_datatest_data 參數

primary_metric

自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric

可接受的值:r2_score、normalized_mean_absolute_error、normalized_root_mean_squared_error預設值為 normalized_root_mean_squared_error

enable_model_explainability
bool

是否要在所有 AutoML 定型反復專案結束時啟用說明最佳 AutoML 模型。 預設值為 None。 如需詳細資訊,請參閱 可解譯性:自動化機器學習中的模型說明

weight_column_name
str

範例加權資料行的名稱。 自動化 ML 支援加權資料行做為輸入,導致資料中的資料列向上或向下加權。 如果輸入資料來自 pandas。沒有資料行名稱的資料框架,可以改用資料行索引,以整數表示。

此參數適用于 training_datavalidation_data 參數

validation_data
Input

實驗中使用的驗證資料。 它應該同時包含訓練功能和標籤資料行, (選擇性地包含範例加權資料行) 。

預設值為 None

validation_data_size
float

未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料,否則請設定 n_cross_validationsvalidation_data_size ,以從指定的定型資料中擷取驗證資料。 針對自訂交叉驗證折迭,請使用 cv_split_column_names

如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證

預設值為 None

n_cross_validations
Union[str, int]

未指定使用者驗證資料時要執行的交叉驗證數目。

指定 validation_data 以提供驗證資料,否則請設定 n_cross_validationsvalidation_data_size ,以從指定的定型資料中擷取驗證資料。 針對自訂交叉驗證折迭,請使用 cv_split_column_names

如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證

預設值為 None

cv_split_column_names
List[str]

包含自訂交叉驗證分割之資料行的名稱清單。 每個 CV 分割資料行都代表一個 CV 分割,其中每個資料列都標示為 1 以進行定型或 0 進行驗證。

預設值為 None

test_data
Input

使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要用於測試回合的測試資料,將在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。

如果未指定此參數或 參數, test_data_size 則模型定型完成後,將不會自動執行任何測試回合。 測試資料應該同時包含功能和標籤資料行。 如果 test_data 已指定 , target_column_name 則必須指定 參數。

預設值為 None

test_data_size
float

使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要保留測試回合之測試資料的定型資料分數,這些測試回合會在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。

這應該介於 0.0 到 1.0 之間。 如果 test_data_size 同時指定 為 validation_data_size ,則在分割驗證資料之前,會先 training_data 分割測試資料。 例如,如果 validation_data_size=0.1test_data_size=0.1 原始定型資料有 1000 個數據列,則測試資料會有 100 個數據列,驗證資料將包含 90 個數據列,而定型資料會有 810 個數據列。

針對回歸型工作,會使用隨機取樣。 針對分類工作,會使用分層取樣。 預測目前不支援使用定型/測試分割來指定測試資料集。

如果未指定此參數或 參數, test_data 則模型定型完成後,將不會自動執行任何測試回合。

預設值為 None

forecasting_settings
ForecastingSettings

預測工作的設定

傳回

可提交至 Azure ML 計算以執行的工作物件。

傳回類型

image_classification

建立 AutoML 影像多類別分類作業的物件。

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

參數

training_data
Input

實驗中使用的定型資料。

target_column_name
str

標籤資料行的名稱。 此參數適用于 training_datavalidation_data 參數。

primary_metric

自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric

可接受的值:精確度、AUC_weighted、norm_macro_recall、average_precision_score_weighted和precision_score_weighted預設值。

validation_data
Input

實驗中使用的驗證資料。

validation_data_size
float

未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料,否則設定 validation_data_size 為從指定的定型資料擷取驗證資料。

預設值為 .2

kwargs
dict

其他組態參數的字典。

傳回

可以提交至 Azure ML 計算以進行執行的影像分類工作物件。

傳回類型

image_classification_multilabel

建立 AutoML 影像多重標籤分類作業的物件。

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

參數

training_data
Input

實驗中使用的定型資料。

target_column_name
str

標籤資料行的名稱。 此參數適用于 training_datavalidation_data 參數。

primary_metric

自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric

可接受的值:精確度、AUC_weighted、norm_macro_recall、average_precision_score_weighted、precision_score_weighted和 Iou 預設值為 Iou。

validation_data
Input

實驗中使用的驗證資料。

validation_data_size
float

未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料,否則設定 validation_data_size 為從指定的定型資料擷取驗證資料。

預設值為 .2

kwargs
dict

其他組態參數的字典。

傳回

影像多標籤分類工作物件,可提交至 Azure ML 計算以供執行。

傳回類型

image_instance_segmentation

建立 AutoML 影像實例分割作業的物件。

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

參數

training_data
Input

實驗中使用的定型資料。

target_column_name
str

標籤資料行的名稱。 此參數適用于 training_datavalidation_data 參數。

primary_metric

自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric

可接受的值:MeanAveragePrecision 預設值為 MeanAveragePrecision。

validation_data
Input

實驗中使用的驗證資料。

validation_data_size
float

未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料,否則設定 validation_data_size 為從指定的定型資料擷取驗證資料。

預設值為 .2

kwargs
dict

其他組態參數的字典。

傳回

影像實例分割作業

傳回類型

image_object_detection

建立 AutoML 影像物件偵測作業的物件。

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

參數

training_data
Input

實驗中使用的定型資料。

target_column_name
str

標籤資料行的名稱。 此參數適用于 training_datavalidation_data 參數。

primary_metric

自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric

可接受的值:MeanAveragePrecision 預設值為 MeanAveragePrecision。

validation_data
Input

實驗中使用的驗證資料。

validation_data_size
float

未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料,否則設定 validation_data_size 為從指定的定型資料擷取驗證資料。

預設值為 .2

kwargs
dict

其他組態參數的字典。

傳回

可以提交至 Azure ML 計算以執行之影像物件偵測工作物件。

傳回類型

regression

用來建立回歸作業的函式。

回歸作業可用來定型模型,以從資料集預測目標變數的連續值。 各種模型都是使用定型資料來定型。 根據主要計量,在驗證資料上具有最佳效能的模型會選取為最終模型。

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

參數

training_data
Input

實驗中使用的定型資料。 它應該同時包含訓練功能和標籤資料行, (選擇性地包含範例加權資料行) 。

target_column_name
str

標籤資料行的名稱。 此參數適用于 training_datavalidation_datatest_data 參數

primary_metric

自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric

可接受的值:spearman_correlation、r2_score、normalized_mean_absolute_error normalized_root_mean_squared_error。 預設為 normalized_root_mean_squared_error

enable_model_explainability
bool

是否要在所有 AutoML 定型反復專案結束時啟用說明最佳 AutoML 模型。 預設值為 None。 如需詳細資訊,請參閱 可解譯性:自動化機器學習中的模型說明

weight_column_name
str

範例加權資料行的名稱。 自動化 ML 支援加權資料行做為輸入,導致資料中的資料列向上或向下加權。 如果輸入資料來自 pandas。沒有資料行名稱的資料框架,可以改用資料行索引,以整數表示。

此參數適用于 training_datavalidation_data 參數

validation_data
Input

實驗中使用的驗證資料。 它應該同時包含訓練功能和標籤資料行, (選擇性地包含範例加權資料行) 。

預設值為 None

validation_data_size
float

未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。

指定 validation_data 以提供驗證資料,否則請設定 n_cross_validationsvalidation_data_size ,以從指定的定型資料中擷取驗證資料。 針對自訂交叉驗證折迭,請使用 cv_split_column_names

如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證

預設值為 None

n_cross_validations
Union[str, int]

未指定使用者驗證資料時要執行的交叉驗證數目。

指定 validation_data 以提供驗證資料,否則請設定 n_cross_validationsvalidation_data_size ,以從指定的定型資料中擷取驗證資料。 針對自訂交叉驗證折迭,請使用 cv_split_column_names

如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證

預設值為 None

cv_split_column_names
List[str]

包含自訂交叉驗證分割之資料行的名稱清單。 每個 CV 分割資料行都代表一個 CV 分割,其中每個資料列都標示為 1 以進行定型或 0 進行驗證。

預設值為 None

test_data
Input

使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要用於測試回合的測試資料,將在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。

如果未指定此參數或 參數, test_data_size 則模型定型完成後,將不會自動執行任何測試回合。 測試資料應該同時包含功能和標籤資料行。 如果 test_data 已指定 , target_column_name 則必須指定 參數。

預設值為 None

test_data_size
float

使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要保留測試回合之測試資料的定型資料分數,這些測試回合會在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。

這應該介於 0.0 到 1.0 之間。 如果 test_data_size 同時指定 為 validation_data_size ,則在分割驗證資料之前,會先 training_data 分割測試資料。 例如,如果 validation_data_size=0.1test_data_size=0.1 原始定型資料有 1000 個數據列,則測試資料會有 100 個數據列,驗證資料將包含 90 個數據列,而定型資料會有 810 個數據列。

針對回歸型工作,會使用隨機取樣。 針對分類工作,會使用分層取樣。 預測目前不支援使用定型/測試分割來指定測試資料集。

如果未指定此參數或 參數, test_data 則模型定型完成後,將不會自動執行任何測試回合。

預設值為 None

傳回

可提交至 Azure ML 計算以執行的工作物件。

傳回類型

text_classification

用來建立 TextClassificationJob 的函式。

文字分類作業可用來定型可預測文字資料類別/類別的模型。 輸入定型資料應該包含目標資料行,可將文字分類成一個類別。

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

參數

training_data
Input

實驗中使用的定型資料。 它應該同時包含訓練功能和目標資料行。

target_column_name
str

目標資料行的名稱。

validation_data
Input

實驗中使用的驗證資料。 它應該同時包含訓練功能和目標資料行。

primary_metric
Union[str, ClassificationPrimaryMetrics]

工作的主要計量。 可接受的值:精確度、AUC_weighted、precision_score_weighted

log_verbosity
str

記錄詳細資訊層級。

kwargs
dict

其他組態參數的字典。

傳回

TextClassificationJob 物件。

傳回類型

text_classification_multilabel

用來建立 TextClassificationMultilabelJob 的函式。

文字分類多標籤作業可用來定型模型,以預測文字資料的類別/類別。 輸入訓練資料應包含目標資料行,可將文字分類為類別 (es) 。 如需多標籤資料格式的詳細資訊,請參閱: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

參數

training_data
Input

實驗中使用的定型資料。 它應該同時包含訓練功能和目標資料行。

target_column_name
str

目標資料行的名稱。

validation_data
Input

實驗中使用的驗證資料。 它應該同時包含訓練功能和目標資料行。

primary_metric
str

工作的主要計量。 可接受的值:精確度

log_verbosity
str

記錄詳細資訊層級。

kwargs
dict

其他組態參數的字典。

傳回

TextClassificationMultilabelJob 物件。

傳回類型

text_ner

用來建立 TextNerJob 的函式。

具名實體辨識作業的文字可用來定型模型,以預測文字中的具名實體。 輸入定型資料應該是 CoNLL 格式的文字檔。 如需文字 NER 資料格式的詳細資訊,請參閱: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

參數

training_data
Input

實驗中使用的定型資料。 它應該同時包含訓練功能和目標資料行。

validation_data
Input

實驗中使用的驗證資料。 它應該同時包含訓練功能和目標資料行。

primary_metric
str

工作的主要計量。 可接受的值:精確度

log_verbosity
str

記錄詳細資訊層級。

kwargs
dict

其他組態參數的字典。

傳回

TextNerJob 物件。

傳回類型