ImageClassificationJob 類別
AutoML 多類別影像分類作業的設定。
初始化新的 AutoML 多類別影像分類作業。
- 繼承
-
azure.ai.ml.entities._job.automl.image.automl_image_classification_base.AutoMLImageClassificationBaseImageClassificationJob
建構函式
ImageClassificationJob(*, primary_metric: str | ClassificationPrimaryMetrics | None = None, **kwargs)
參數
- primary_metric
要用於優化的主要計量
- kwargs
作業特定引數
方法
dump |
以 YAML 格式將作業內容傾印到檔案中。 |
extend_search_space |
新增 AutoML 影像分類和影像分類多標籤工作的搜尋空間。 |
set_data | |
set_limits |
限制所有 AutoML 影像垂直的設定。 |
set_sweep |
所有 AutoML 影像垂直的掃掠設定。 |
set_training_parameters |
設定 AutoML 影像分類和影像分類多標籤工作的影像定型參數。 |
dump
以 YAML 格式將作業內容傾印到檔案中。
dump(dest: str | PathLike | IO, **kwargs) -> None
參數
要寫入 YAML 內容的本機路徑或檔案資料流程。 如果 dest 是檔案路徑,則會建立新的檔案。 如果 dest 是開啟的檔案,則會直接寫入檔案。
- kwargs
- dict
要傳遞至 YAML 序列化程式的其他引數。
例外狀況
如果 dest 是檔案路徑且檔案已經存在,則引發。
如果 dest 是開啟的檔案,而且無法寫入檔案,則引發。
extend_search_space
新增 AutoML 影像分類和影像分類多標籤工作的搜尋空間。
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
參數
指定 ImageClassificationSearchSpace 的實例或 ImageClassificationSearchSpace 清單,以搜尋參數空間
例外狀況
如果 dest 是檔案路徑且檔案已經存在,則引發。
如果 dest 是開啟的檔案,而且無法寫入檔案,則引發。
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input | None = None, validation_data_size: float | None = None) -> None
例外狀況
如果 dest 是檔案路徑且檔案已經存在,則引發。
如果 dest 是開啟的檔案,而且無法寫入檔案,則引發。
set_limits
限制所有 AutoML 影像垂直的設定。
set_limits(*, max_concurrent_trials: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None) -> None
參數
- timeout_minutes
- timedelta
AutoML 作業逾時。
例外狀況
如果 dest 是檔案路徑且檔案已經存在,則引發。
如果 dest 是開啟的檔案,而且無法寫入檔案,則引發。
set_sweep
所有 AutoML 影像垂直的掃掠設定。
set_sweep(*, sampling_algorithm: str | Random | Grid | Bayesian, early_termination: BanditPolicy | MedianStoppingPolicy | TruncationSelectionPolicy | None = None) -> None
參數
- sampling_algorithm
必要。 [必要]超參數取樣演算法的類型。 可能的值為:「Grid」、「Random」、「Bayesian」。
- early_termination
- Union[ BanditPolicy, MedianStoppingPolicy, TruncationSelectionPolicy]
早期終止原則的類型。
例外狀況
如果 dest 是檔案路徑且檔案已經存在,則引發。
如果 dest 是開啟的檔案,而且無法寫入檔案,則引發。
set_training_parameters
設定 AutoML 影像分類和影像分類多標籤工作的影像定型參數。
set_training_parameters(*, advanced_settings: str | None = None, ams_gradient: bool | None = None, beta1: float | None = None, beta2: float | None = None, checkpoint_frequency: int | None = None, checkpoint_run_id: str | None = None, distributed: bool | None = None, early_stopping: bool | None = None, early_stopping_delay: int | None = None, early_stopping_patience: int | None = None, enable_onnx_normalization: bool | None = None, evaluation_frequency: int | None = None, gradient_accumulation_step: int | None = None, layers_to_freeze: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | LearningRateScheduler | None = None, model_name: str | None = None, momentum: float | None = None, nesterov: bool | None = None, number_of_epochs: int | None = None, number_of_workers: int | None = None, optimizer: str | StochasticOptimizer | None = None, random_seed: int | None = None, step_lr_gamma: float | None = None, step_lr_step_size: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_cosine_lr_cycles: float | None = None, warmup_cosine_lr_warmup_epochs: int | None = None, weight_decay: float | None = None, training_crop_size: int | None = None, validation_crop_size: int | None = None, validation_resize_size: int | None = None, weighted_loss: int | None = None) -> None
參數
- advanced_settings
- str
進階案例的設定。
- ams_gradient
- bool
當優化器為 'adam' 或 'adamw' 時啟用 AMSGrad。
- beta1
- float
當優化器為 'adam' 或 'adamw' 時,'Beta1' 的值。 必須是範圍 [0, 1] 內的浮點數。
- beta2
- float
當優化器為 'adam' 或 'adamw' 時,'Beta2' 的值。 必須是範圍 [0, 1] 內的浮點數。
- checkpoint_frequency
- int
儲存模型檢查點的頻率。 必須是正整數。
- checkpoint_run_id
- str
先前執行之識別碼,其具有累加式定型的預先定型檢查點。
- distributed
- bool
是否要使用分散式定型。
- early_stopping
- bool
在定型期間啟用提早停止邏輯。
- early_stopping_delay
- int
在追蹤主要計量改進之前,要等候的最小 Epoch 數目或驗證評估,以便提早停止。 必須是正整數。
- early_stopping_patience
- int
停止執行之前,沒有主要計量改善的最小 Epoch 或驗證評估數目。 必須是正整數。
- enable_onnx_normalization
- bool
匯出 ONNX 模型時啟用正規化。
- evaluation_frequency
- int
評估驗證資料集以取得計量分數的頻率。 必須是正整數。
- gradient_accumulation_step
- int
漸層累積表示執行已設定數目的 「GradAccumulationStep」 步驟,而不更新模型權數,同時累積這些步驟的漸層,然後使用累積的漸層來計算權數更新。 必須是正整數。
- layers_to_freeze
要凍結模型的層數。 必須是正整數。 例如,傳遞 2 作為 'seresnext' 的值表示凍結 layer0 和 layer1。 如需所支援模型的完整清單,以及有關圖層凍結的詳細資料,請參閱: https://docs.microsoft.com/en-us/azure/machine-learning/reference-automl-images-hyperparameters#model-agnostic-hyperparameters 。 # pylint: disable=line-too-long
- learning_rate
- float
初始學習速率。 必須是範圍 [0, 1] 內的浮點數。
- learning_rate_scheduler
學習率排程器的類型。 必須是 'warmup_cosine' 或 'step'。 可能的值包括:「None」、「WarmupCosine」、「Step」。
- model_name
要用於定型的模型名稱。 如需可用模型的詳細資訊,請流覽官方檔: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models 。
- momentum
- float
優化工具為 'sgd' 時的時刻值。 必須是範圍 [0, 1] 內的浮點數。
- nesterov
- bool
當優化器為 'sgd' 時,請啟用 nesterov。
- number_of_epochs
- int
定型 Epoch 的數目。 必須是正整數。
- number_of_workers
- int
資料載入器背景工作角色的數目。 必須是非負整數。
- optimizer
最佳化工具的類型。 可能的值為:「None」、「Sgd」、「Adam」、「Adamw」。
- random_seed
- int
使用決定性定型時要使用的隨機種子。
- step_lr_gamma
- float
當學習速率排程器為 'step' 時,gamma 的值。 必須是範圍 [0, 1] 內的浮點數。
- step_lr_step_size
- int
當學習速率排程器為 'step' 時,步驟大小的值。 必須是正整數。
- training_batch_size
- int
定型批次大小。 必須是正整數。
- validation_batch_size
- int
驗證批次大小。 必須是正整數。
- warmup_cosine_lr_cycles
- float
當學習速率排程器為 'warmup_cosine' 時,余弦迴圈的值。 必須是範圍 [0, 1] 內的浮點數。
- warmup_cosine_lr_warmup_epochs
- int
當學習速率排程器為 'warmup_cosine'時,熱身 Epoch 的值。 必須是正整數。
- weight_decay
- float
優化器為 'sgd'、'adam' 或 'adamw' 時的權數衰減值。 必須是範圍[0, 1] 中的浮點數。
- training_crop_size
- int
影像裁剪大小,為訓練資料集的類神經網路輸入。 必須是正整數。
- validation_crop_size
- int
輸入至驗證資料集之類神經網路的影像裁剪大小。 必須是正整數。
- validation_resize_size
- int
在針對驗證資料集進行裁切之前,要調整大小的影像大小。 必須是正整數。
- weighted_loss
- int
加權損失。 接受的值是 0,不會遺失加權。 1 用於 sqrt. (class_weights) 加權損失。 2 表示具有 class_weights 的加權遺失。 必須是 0 或是 1 或 2。
例外狀況
如果 dest 是檔案路徑且檔案已經存在,則引發。
如果 dest 是開啟的檔案,而且無法寫入檔案,則引發。
屬性
base_path
creation_context
id
inputs
limits
log_files
log_verbosity
outputs
primary_metric
search_space
status
工作的狀態。
傳回的常見值包括 「Running」、「Completed」 和 「Failed」。 所有可能的值為:
NotStarted - 這是用戶端 Run 物件在雲端提交之前所在的暫時狀態。
啟動 - 執行已在雲端中開始處理。 呼叫端此時有執行識別碼。
布建 - 針對指定的作業提交建立隨選計算。
準備 - 正在準備執行環境,且處於兩個階段之一:
Docker 映射組建
conda 環境設定
已排入佇列 - 作業會排入計算目標上的佇列。 例如,在 BatchAI 中,作業處於佇列狀態
等候所有要求的節點準備就緒時。
執行 - 作業已開始在計算目標上執行。
完成 - 使用者程式碼執行已完成,且執行處於後續處理階段。
CancelRequested - 已要求取消作業。
已完成 - 執行已順利完成。 這包括使用者程式碼執行和執行
後續處理階段。
失敗 - 執行失敗。 執行上的 Error 屬性通常會提供原因的詳細資料。
已取消 - 遵循取消要求,並指出現在已成功取消執行。
NotResponding - 針對已啟用活動訊號的執行,最近不會傳送活動訊號。
傳回
作業的狀態。
傳回類型
studio_url
sweep
task_type
test_data
training_data
training_parameters
type
validation_data
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應