automl 패키지

Azure Machine Learning SDKv2에 대한 자동화된 기계 학습 클래스를 포함합니다.

주요 영역에는 AutoML 작업 관리가 포함됩니다.

클래스

ClassificationJob

AutoML 분류 작업에 대한 구성입니다.

새 AutoML 분류 작업을 초기화합니다.

ColumnTransformer

열 변환기 설정.

ForecastingJob

AutoML 예측 작업에 대한 구성입니다.

새 AutoML 예측 작업을 초기화합니다.

ForecastingSettings

AutoML 작업에 대한 예측 설정입니다.

ImageClassificationJob

AutoML 다중 클래스 이미지 분류 작업에 대한 구성입니다.

새 AutoML 다중 클래스 이미지 분류 작업을 초기화합니다.

ImageClassificationMultilabelJob

AutoML 다중 레이블 이미지 분류 작업에 대한 구성입니다.

새 AutoML 다중 레이블 이미지 분류 작업을 초기화합니다.

ImageClassificationSearchSpace

AutoML 이미지 분류 및 이미지 분류 다중 레이블 작업에 대한 검색 공간입니다.

ImageInstanceSegmentationJob

AutoML 이미지 인스턴스 구분 작업에 대한 구성입니다.

새 AutoML 이미지 인스턴스 구분 작업을 초기화합니다.

ImageLimitSettings

AutoML 이미지 세로에 대한 설정을 제한합니다.

ImageLimitSettings는 max_concurrent_trials, max_trials 및 timeout_minutes 매개 변수를 포함하는 클래스입니다.

제한 매개 변수(예: 시간 제한 등)를 구성하는 선택적 구성 방법입니다.

참고

동시 실행 수는 지정된 컴퓨팅 대상에서 사용할 수 있는 리소스에서 제어됩니다.

원하는 동시성에 사용할 수 있는 리소스가 컴퓨팅 대상에 있는지 확인합니다.

max_concurrent_trials 개수를 클러스터의 노드 수와 일치시킬 수 있습니다.

예를 들어 노드가 4개인 클러스터가 있는 경우 max_concurrent_trials 4로 설정합니다.

사용 예

ImageLimitSettings 구성


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

ImageLimitSettings 개체를 초기화합니다.

AutoML 이미지 세로에 대한 ImageLimitSettings 생성자입니다.

ImageModelSettingsClassification

AutoML 이미지 분류 작업에 대한 모델 설정입니다.

ImageModelSettingsObjectDetection

AutoML 이미지 개체 감지 태스크에 대한 모델 설정입니다.

ImageObjectDetectionJob

AutoML 이미지 개체 검색 작업에 대한 구성입니다.

새 AutoML 이미지 개체 검색 작업을 초기화합니다.

ImageObjectDetectionSearchSpace

AutoML 이미지 개체 감지 및 이미지 인스턴스 구분 작업을 위한 검색 공간입니다.

ImageSweepSettings

모든 AutoML 이미지 세로에 대한 스윕 설정입니다.

NlpFeaturizationSettings

모든 AutoML NLP 세로에 대한 기능화 설정입니다.

NlpFixedParameters

NLP 작업에 대한 고정 매개 변수를 수용하는 개체입니다.

NlpLimitSettings

모든 AutoML NLP 세로에 대한 설정을 제한합니다.

NlpSearchSpace

AutoML NLP 작업에 대한 검색 공간입니다.

NlpSweepSettings

모든 AutoML NLP 작업에 대한 스윕 설정입니다.

RegressionJob

AutoML 회귀 작업에 대한 구성입니다.

새 AutoML 회귀 작업을 초기화합니다.

SearchSpace

AutoML 세로에 대한 SearchSpace 클래스입니다.

StackEnsembleSettings

StackEnsemble 실행을 사용자 지정하기 위한 사전 설정입니다.

TabularFeaturizationSettings

AutoML 작업에 대한 기능화 설정입니다.

TabularLimitSettings

AutoML 테이블 세로에 대한 설정을 제한합니다.

TextClassificationJob

AutoML 텍스트 분류 작업에 대한 구성입니다.

새 AutoML 텍스트 분류 작업을 초기화합니다.

TextClassificationMultilabelJob

AutoML 텍스트 분류 다중 레이블 작업에 대한 구성입니다.

새 AutoML 텍스트 분류 다중 레이블 작업을 초기화합니다.

TextNerJob

AutoML 텍스트 NER 작업에 대한 구성입니다.

새 AutoML 텍스트 NER 작업을 초기화합니다.

TrainingSettings

Azure Machine Learning에 대한 TrainingSettings 클래스입니다.

Azure Machine Learning에 대한 TrainingSettings 클래스입니다.

열거형

BlockedTransformers

AutoML에서 지원하는 모든 분류 모델에 대한 열거형입니다.

ClassificationModels

AutoML에서 지원하는 모든 분류 모델에 대한 열거형입니다.

ClassificationMultilabelPrimaryMetrics

분류 다중 레이블 작업에 대한 기본 메트릭입니다.

ClassificationPrimaryMetrics

분류 작업에 대한 기본 메트릭입니다.

FeaturizationMode

기능화 모드 - 데이터 기능화 모드를 결정합니다.

ForecastHorizonMode

예측 수평선 선택 모드를 결정하는 열거형입니다.

ForecastingModels

AutoML에서 지원하는 모든 예측 모델에 대한 열거형입니다.

ForecastingPrimaryMetrics

예측 작업에 대한 기본 메트릭입니다.

InstanceSegmentationPrimaryMetrics

InstanceSegmentation 작업에 대한 기본 메트릭입니다.

LearningRateScheduler

학습 속도 스케줄러 열거형.

LogTrainingMetrics

Azure Machine Learning SDKv2에 대한 자동화된 기계 학습 클래스를 포함합니다.

주요 영역에는 AutoML 작업 관리가 포함됩니다.

LogValidationLoss

Azure Machine Learning SDKv2에 대한 자동화된 기계 학습 클래스를 포함합니다.

주요 영역에는 AutoML 작업 관리가 포함됩니다.

NCrossValidationsMode

N 교차 유효성 검사 값이 결정되는 방법을 결정합니다.

ObjectDetectionPrimaryMetrics

Image ObjectDetection 작업에 대한 기본 메트릭입니다.

RegressionModels

AutoML에서 지원하는 모든 회귀 모델에 대한 열거형입니다.

RegressionPrimaryMetrics

회귀 작업에 대한 기본 메트릭입니다.

SamplingAlgorithmType

Azure Machine Learning SDKv2에 대한 자동화된 기계 학습 클래스를 포함합니다.

주요 영역에는 AutoML 작업 관리가 포함됩니다.

ShortSeriesHandlingConfiguration

AutoML이 짧은 시계열을 처리해야 하는지 여부를 정의하는 매개 변수입니다.

StochasticOptimizer

이미지 모델에 대한 확률적 최적화 프로그램입니다.

TargetAggregationFunction

대상 집계 함수입니다.

TargetLagsMode

대상은 선택 모드를 지연합니다.

TargetRollingWindowSizeMode

대상 롤링 창 크기 모드입니다.

UseStl

시계열 대상 열의 STL 분해를 구성합니다.

ValidationMetricType

이미지 작업의 유효성 검사 메트릭에 사용할 메트릭 계산 방법입니다.

함수

classification

ClassificationJob을 만드는 함수입니다.

분류 작업은 데이터 샘플의 클래스를 가장 잘 예측하는 모델을 학습시키는 데 사용됩니다. 다양한 모델은 학습 데이터를 사용하여 학습됩니다. 기본 메트릭을 기반으로 하는 유효성 검사 데이터에서 최상의 성능을 가진 모델이 최종 모델로 선택됩니다.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.

target_column_name
str

레이블 열의 이름입니다. 이 매개 변수는 , validation_datatest_data 매개 변수에 적용할 training_data수 있습니다.

primary_metric

자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.

허용되는 값: 정확도, AUC_weighted, norm_macro_recall, average_precision_score_weighted 및 precision_score_weighted 정확도로 기본값

enable_model_explainability
bool

모든 AutoML 학습 반복이 끝날 때 최상의 AutoML 모델을 설명할 수 있는지 여부입니다. 기본값은 None입니다. 자세한 내용은 해석 가능성: 자동화된 Machine Learning의 모델 설명을 참조하세요.

weight_column_name
str

샘플 가중치 열의 이름입니다. 자동화된 ML은 가중치 열을 입력으로 지원하여 데이터 행의 가중치를 높이거나 낮춥니다. 입력 데이터를 열 이름이 없는 pandas.DataFrame에서 가져온 경우 정수로 표시되는 열 인덱스를 대신 사용할 수 있습니다.

이 매개 변수는 및 validation_data 매개 변수에 training_data 적용할 수 있습니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.

기본값: 없음

validation_data_size
float

사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.

유효성 검사 데이터를 제공하려면 validation_data를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations 또는 validation_data_size를 설정합니다. 사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names를 사용합니다.

자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.

기본값: 없음

n_cross_validations
Union[str, int]

사용자 유효성 검사 데이터를 지정하지 않은 경우 수행할 교차 유효성 검사의 수입니다.

유효성 검사 데이터를 제공하려면 validation_data를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations 또는 validation_data_size를 설정합니다. 사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names를 사용합니다.

자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.

기본값은 없음입니다.

cv_split_column_names
List[str]

사용자 지정 교차 유효성 검사 분할이 포함된 열의 이름 목록입니다. 각 CV 분할 열은 각 행이 학습용인 경우 1로 표시되고 유효성 검사용인 경우 0으로 표시된 하나의 CV 분할을 나타냅니다.

기본값은 없음입니다.

test_data
Input

테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 사용할 테스트 데이터입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.

이 매개 변수 또는 test_data_size 매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다. 테스트 데이터에는 기능과 레이블 열이 모두 포함되어야 합니다. test_data가 지정되면 target_column_name 매개 변수도 지정해야 합니다.

기본값은 없음입니다.

test_data_size
float

테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 대한 테스트 데이터에 대해 보류할 학습 데이터의 비율입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.

이 값은 0.0에서 1.0 사이여야 합니다. test_data_sizevalidation_data_size와 동시에 지정된 경우 유효성 검사 데이터가 분할되기 전에 테스트 데이터가 training_data에서 분할됩니다. 예를 들어 validation_data_size=0.1이고 test_data_size=0.1이며 원래 학습 데이터에 1,000개의 행이 있는 경우 테스트 데이터에는 100개의 행이 있고 유효성 검사 데이터에는 90개의 행이 포함되며 학습 데이터에는 810개의 행이 포함됩니다.

회귀 기반 작업의 경우 무작위 샘플링이 사용됩니다. 분류 작업의 경우 계층화된 샘플링이 사용됩니다. 예측은 현재 학습/테스트 분할을 사용하여 테스트 데이터 세트를 지정하는 것을 지원하지 않습니다.

이 매개 변수 또는 test_data 매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다.

기본값은 없음입니다.

반환

실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 작업 개체입니다.

반환 형식

forecasting

예측 작업을 만드는 함수입니다.

예측 작업은 기록 데이터를 기반으로 향후 기간의 대상 값을 예측하는 데 사용됩니다. 다양한 모델은 학습 데이터를 사용하여 학습됩니다. 기본 메트릭을 기반으로 하는 유효성 검사 데이터에서 최상의 성능을 가진 모델이 최종 모델로 선택됩니다.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.

target_column_name
str

레이블 열의 이름입니다. 이 매개 변수는 , validation_datatest_data 매개 변수에 training_data적용할 수 있습니다.

primary_metric

자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.

허용되는 값: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error 기본값을 normalized_root_mean_squared_error

enable_model_explainability
bool

모든 AutoML 학습 반복이 끝날 때 최상의 AutoML 모델을 설명할 수 있는지 여부입니다. 기본값은 None입니다. 자세한 내용은 해석 가능성: 자동화된 Machine Learning의 모델 설명을 참조하세요.

weight_column_name
str

샘플 가중치 열의 이름입니다. 자동화된 ML은 가중치 열을 입력으로 지원하여 데이터 행의 가중치를 높이거나 낮춥니다. 입력 데이터를 열 이름이 없는 pandas.DataFrame에서 가져온 경우 정수로 표시되는 열 인덱스를 대신 사용할 수 있습니다.

이 매개 변수는 및 validation_data 매개 변수에 training_data 적용할 수 있습니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.

기본값은 없음입니다.

validation_data_size
float

사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.

유효성 검사 데이터를 제공하려면 validation_data를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations 또는 validation_data_size를 설정합니다. 사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names를 사용합니다.

자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.

기본값은 없음입니다.

n_cross_validations
Union[str, int]

사용자 유효성 검사 데이터를 지정하지 않은 경우 수행할 교차 유효성 검사의 수입니다.

유효성 검사 데이터를 제공하려면 validation_data를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations 또는 validation_data_size를 설정합니다. 사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names를 사용합니다.

자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.

기본값은 없음입니다.

cv_split_column_names
List[str]

사용자 지정 교차 유효성 검사 분할이 포함된 열의 이름 목록입니다. 각 CV 분할 열은 각 행이 학습용인 경우 1로 표시되고 유효성 검사용인 경우 0으로 표시된 하나의 CV 분할을 나타냅니다.

기본값은 없음입니다.

test_data
Input

테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 사용할 테스트 데이터입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.

이 매개 변수 또는 test_data_size 매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다. 테스트 데이터에는 기능과 레이블 열이 모두 포함되어야 합니다. test_data가 지정되면 target_column_name 매개 변수도 지정해야 합니다.

기본값은 없음입니다.

test_data_size
float

테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 대한 테스트 데이터에 대해 보류할 학습 데이터의 비율입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.

이 값은 0.0에서 1.0 사이여야 합니다. test_data_sizevalidation_data_size와 동시에 지정된 경우 유효성 검사 데이터가 분할되기 전에 테스트 데이터가 training_data에서 분할됩니다. 예를 들어 validation_data_size=0.1이고 test_data_size=0.1이며 원래 학습 데이터에 1,000개의 행이 있는 경우 테스트 데이터에는 100개의 행이 있고 유효성 검사 데이터에는 90개의 행이 포함되며 학습 데이터에는 810개의 행이 포함됩니다.

회귀 기반 작업의 경우 무작위 샘플링이 사용됩니다. 분류 작업의 경우 계층화된 샘플링이 사용됩니다. 예측은 현재 학습/테스트 분할을 사용하여 테스트 데이터 세트를 지정하는 것을 지원하지 않습니다.

이 매개 변수 또는 test_data 매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다.

기본값은 없음입니다.

forecasting_settings
ForecastingSettings

예측 작업에 대한 설정

반환

실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 작업 개체입니다.

반환 형식

image_classification

AutoML 이미지 다중 클래스 분류 작업에 대한 개체를 만듭니다.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다.

target_column_name
str

레이블 열의 이름입니다. 이 매개 변수는 training_datavalidation_data 매개 변수에 적용할 수 있습니다.

primary_metric

자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.

허용되는 값: 정확도, AUC_weighted, norm_macro_recall, average_precision_score_weighted 및 precision_score_weighted 기본값을 정확도로 설정합니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다.

validation_data_size
float

사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.

유효성 검사 데이터를 제공하려면 를 지정 validation_data 하고, 그렇지 않으면 지정된 학습 데이터에서 유효성 검사 데이터를 추출하도록 설정합니다 validation_data_size .

기본값은 .2입니다.

kwargs
dict

추가 구성 매개 변수의 사전입니다.

반환

실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 이미지 분류 작업 개체입니다.

반환 형식

image_classification_multilabel

AutoML 이미지 다중 레이블 분류 작업에 대한 개체를 만듭니다.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다.

target_column_name
str

레이블 열의 이름입니다. 이 매개 변수는 training_datavalidation_data 매개 변수에 적용할 수 있습니다.

primary_metric

자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.

허용되는 값: 정확도, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted 및 Iou 기본값은 Iou입니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다.

validation_data_size
float

사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.

유효성 검사 데이터를 제공하려면 를 지정 validation_data 하고, 그렇지 않으면 를 설정 validation_data_size 하여 지정된 학습 데이터에서 유효성 검사 데이터를 추출합니다.

기본값은 .2입니다.

kwargs
dict

추가 구성 매개 변수의 사전입니다.

반환

실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 다중 레이블 분류 작업 개체를 이미지로 표시합니다.

반환 형식

image_instance_segmentation

AutoML 이미지 인스턴스 구분 작업에 대한 개체를 만듭니다.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다.

target_column_name
str

레이블 열의 이름입니다. 이 매개 변수는 training_datavalidation_data 매개 변수에 적용할 수 있습니다.

primary_metric

자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.

허용되는 값: MeanAveragePrecision 기본값은 MeanAveragePrecision입니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다.

validation_data_size
float

사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.

유효성 검사 데이터를 제공하려면 를 지정 validation_data 하고, 그렇지 않으면 를 설정 validation_data_size 하여 지정된 학습 데이터에서 유효성 검사 데이터를 추출합니다.

기본값은 .2입니다.

kwargs
dict

추가 구성 매개 변수의 사전입니다.

반환

이미지 instance 구분 작업

반환 형식

image_object_detection

AutoML 이미지 개체 감지 작업에 대한 개체를 만듭니다.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다.

target_column_name
str

레이블 열의 이름입니다. 이 매개 변수는 training_datavalidation_data 매개 변수에 적용할 수 있습니다.

primary_metric

자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.

허용되는 값: MeanAveragePrecision 기본값은 MeanAveragePrecision입니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다.

validation_data_size
float

사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.

유효성 검사 데이터를 제공하려면 를 지정 validation_data 하고, 그렇지 않으면 를 설정 validation_data_size 하여 지정된 학습 데이터에서 유효성 검사 데이터를 추출합니다.

기본값은 .2입니다.

kwargs
dict

추가 구성 매개 변수의 사전입니다.

반환

실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 이미지 개체 검색 작업 개체입니다.

반환 형식

regression

회귀 작업을 만드는 함수입니다.

회귀 작업은 데이터 세트에서 대상 변수의 연속 값을 예측하는 모델을 학습시키는 데 사용됩니다. 다양한 모델은 학습 데이터를 사용하여 학습됩니다. 기본 메트릭을 기반으로 유효성 검사 데이터에서 최상의 성능을 가진 모델이 최종 모델로 선택됩니다.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.

target_column_name
str

레이블 열의 이름입니다. 이 매개 변수는 , validation_datatest_data 매개 변수에 적용할 training_data수 있습니다.

primary_metric

자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.

허용되는 값: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. 기본값은 normalized_root_mean_squared_error

enable_model_explainability
bool

모든 AutoML 학습 반복이 끝날 때 최상의 AutoML 모델을 설명할 수 있는지 여부입니다. 기본값은 None입니다. 자세한 내용은 해석 가능성: 자동화된 Machine Learning의 모델 설명을 참조하세요.

weight_column_name
str

샘플 가중치 열의 이름입니다. 자동화된 ML은 가중치 열을 입력으로 지원하여 데이터 행의 가중치를 높이거나 낮춥니다. 입력 데이터를 열 이름이 없는 pandas.DataFrame에서 가져온 경우 정수로 표시되는 열 인덱스를 대신 사용할 수 있습니다.

이 매개 변수는 및 validation_data 매개 변수에 training_data 적용할 수 있습니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.

기본값: 없음

validation_data_size
float

사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.

유효성 검사 데이터를 제공하려면 validation_data를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations 또는 validation_data_size를 설정합니다. 사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names를 사용합니다.

자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.

기본값: 없음

n_cross_validations
Union[str, int]

사용자 유효성 검사 데이터를 지정하지 않은 경우 수행할 교차 유효성 검사의 수입니다.

유효성 검사 데이터를 제공하려면 validation_data를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations 또는 validation_data_size를 설정합니다. 사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names를 사용합니다.

자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.

기본값: 없음

cv_split_column_names
List[str]

사용자 지정 교차 유효성 검사 분할이 포함된 열의 이름 목록입니다. 각 CV 분할 열은 각 행이 학습용인 경우 1로 표시되고 유효성 검사용인 경우 0으로 표시된 하나의 CV 분할을 나타냅니다.

기본값: 없음

test_data
Input

테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 사용할 테스트 데이터입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.

이 매개 변수 또는 test_data_size 매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다. 테스트 데이터에는 기능과 레이블 열이 모두 포함되어야 합니다. test_data가 지정되면 target_column_name 매개 변수도 지정해야 합니다.

기본값: 없음

test_data_size
float

테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 대한 테스트 데이터에 대해 보류할 학습 데이터의 비율입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.

이 값은 0.0에서 1.0 사이여야 합니다. test_data_sizevalidation_data_size와 동시에 지정된 경우 유효성 검사 데이터가 분할되기 전에 테스트 데이터가 training_data에서 분할됩니다. 예를 들어 validation_data_size=0.1이고 test_data_size=0.1이며 원래 학습 데이터에 1,000개의 행이 있는 경우 테스트 데이터에는 100개의 행이 있고 유효성 검사 데이터에는 90개의 행이 포함되며 학습 데이터에는 810개의 행이 포함됩니다.

회귀 기반 작업의 경우 무작위 샘플링이 사용됩니다. 분류 작업의 경우 계층화된 샘플링이 사용됩니다. 예측은 현재 학습/테스트 분할을 사용하여 테스트 데이터 세트를 지정하는 것을 지원하지 않습니다.

이 매개 변수 또는 test_data 매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다.

기본값: 없음

반환

실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 작업 개체입니다.

반환 형식

text_classification

TextClassificationJob을 만드는 함수입니다.

텍스트 분류 작업은 텍스트 데이터의 클래스/범주를 예측할 수 있는 모델을 학습시키는 데 사용됩니다. 입력 학습 데이터에는 텍스트를 정확히 하나의 클래스로 분류하는 대상 열이 포함되어야 합니다.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.

target_column_name
str

대상 열의 이름입니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.

primary_metric
Union[str, ClassificationPrimaryMetrics]

작업에 대한 기본 메트릭입니다. 허용되는 값: 정확도, AUC_weighted, precision_score_weighted

log_verbosity
str

자세한 정보 표시 수준을 기록합니다.

kwargs
dict

추가 구성 매개 변수의 사전입니다.

반환

TextClassificationJob 개체입니다.

반환 형식

text_classification_multilabel

TextClassificationMultilabelJob을 만드는 함수입니다.

텍스트 분류 다중 레이블 작업은 텍스트 데이터의 클래스/범주를 예측할 수 있는 모델을 학습시키는 데 사용됩니다. 입력 학습 데이터에는 텍스트를 클래스로 분류하는 대상 열이 포함되어야 합니다. 다중 레이블 데이터 형식에 대한 자세한 내용은 다음을 참조하세요. https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.

target_column_name
str

대상 열의 이름입니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.

primary_metric
str

작업에 대한 기본 메트릭입니다. 허용되는 값: 정확도

log_verbosity
str

자세한 정보 표시 수준을 기록합니다.

kwargs
dict

추가 구성 매개 변수의 사전입니다.

반환

TextClassificationMultilabelJob 개체입니다.

반환 형식

text_ner

TextNerJob을 만드는 함수입니다.

엔터티 인식 작업이라는 텍스트는 텍스트에서 명명된 엔터티를 예측할 수 있는 모델을 학습시키는 데 사용됩니다. 입력 학습 데이터는 CoNLL 형식의 텍스트 파일이어야 합니다. 텍스트 NER 데이터 형식에 대한 자세한 내용은 다음을 참조하세요. https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

매개 변수

training_data
Input

실험 내에서 사용할 학습 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.

validation_data
Input

실험 내에서 사용할 유효성 검사 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.

primary_metric
str

작업에 대한 기본 메트릭입니다. 허용되는 값: 정확도

log_verbosity
str

자세한 정보 표시 수준을 기록합니다.

kwargs
dict

추가 구성 매개 변수의 사전입니다.

반환

TextNerJob 개체입니다.

반환 형식