SKLearn 類別

在 Scikit-learn 實驗中建立定型的估算器。

已淘汰。 使用 ScriptRunConfig 物件搭配您自己的已定義環境或AzureML-Tutorial策劃的環境。 如需使用 ScriptRunConfig 設定 SKLearn 實驗執行的簡介,請參閱 使用 Azure Machine Learning 大規模定型 scikit-learn 模型

此估算器僅支援單一節點 CPU 定型。

支援的版本:0.20.3

初始化 Scikit-learn 估算器。

繼承
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

建構函式

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

參數

source_directory
str
必要

包含實驗設定檔的本機目錄。

compute_target
AbstractComputeTargetstr
必要

將進行定型的計算目標。 這可以是 物件或字串 「local」。

vm_size
str
必要

將針對定型建立之計算目標的 VM 大小。

支援的值:任何 Azure VM 大小

vm_priority
str
必要

將針對定型建立之計算目標的 VM 優先順序。 如果未指定,則會使用 'dedicated'。

支援的值:'dedicated' 和 'lowpriority'。

只有在輸入中指定 時 vm_size param ,才會生效。

entry_script
str
必要

字串,表示用來開始定型之檔案的相對路徑。

script_params
dict
必要

命令列引數的字典,用來傳遞至 中指定的 entry_script 定型腳本。

custom_docker_image
str
必要

要用來定型之映射的 Docker 映射名稱。 如果未設定,則會使用預設 CPU 型映射作為基底映射。

image_registry_details
ContainerRegistry
必要

Docker 映射登錄的詳細資料。

user_managed
bool
必要

指定 Azure ML 是否重複使用現有的 Python 環境。 False 表示 AzureML 會根據 conda 相依性規格建立 Python 環境。

conda_packages
list
必要

字串清單,表示要新增至實驗 Python 環境的 conda 套件。

pip_packages
list
必要

字串清單,表示要新增至實驗 Python 環境的 pip 套件。

conda_dependencies_file_path
str
必要

字串,表示 conda 相依性 yaml 檔案的相對路徑。 如果指定,Azure ML 將不會安裝任何架構相關套件。 這可與 參數搭配 conda_packages 使用。 已淘汰。 conda_dependencies_file使用 參數。

pip_requirements_file_path
str
必要

字串,表示 pip 需求文字檔的相對路徑。 這可與 參數搭配 pip_packages 使用。 已淘汰。 pip_requirements_file使用 參數。

conda_dependencies_file
str
必要

字串,表示 conda 相依性 yaml 檔案的相對路徑。 如果指定,Azure ML 將不會安裝任何架構相關套件。 這可與 參數搭配 conda_packages 使用。

pip_requirements_file
str
必要

字串,表示 pip 需求文字檔的相對路徑。 這可與 參數搭配 pip_packages 使用。

environment_variables
dict
必要

環境變數名稱和值的字典。 這些環境變數會在執行使用者指令碼的程序上設定。

environment_definition
Environment
必要

實驗的環境定義包括 PythonSection、DockerSection 和環境變數。 任何未透過其他參數直接公開至估算器建構的環境選項,都可以使用 environment_definition 參數來設定。 如果指定此參數,則會優先于其他環境相關參數,例如 use_gpucustom_docker_imageconda_packagespip_packages 。 錯誤將會回報不正確組合。

inputs
list
必要

做為輸入的 或 DatasetConsumptionConfig 物件清單 DataReference

shm_size
str
必要

Docker 容器的共用記憶體區塊大小。 如果未設定,則會使用預設azureml.core.environment._DEFAULT_SHM_SIZE。

resume_from
DataPath
必要

包含要繼續實驗之檢查點或模型檔案的資料路徑。

max_run_duration_seconds
int
必要

執行所允許的最大時間。 如果執行時間超過此值,Azure ML 會嘗試自動取消執行。

framework_version
str
必要

要用來執行定型程式碼的 Scikit-learn 版本。 SKLearn.get_supported_versions() 會傳回目前 SDK 支援的版本清單。

source_directory
str
必要

包含實驗設定檔的本機目錄。

compute_target
AbstractComputeTargetstr
必要

將進行定型的計算目標。 這可以是 物件或字串 「local」。

vm_size
str
必要

將針對定型建立之計算目標的 VM 大小。 支援的值:任何 Azure VM 大小

vm_priority
str
必要

將針對定型建立之計算目標的 VM 優先順序。 如果未指定,則會使用 'dedicated'。

支援的值:'dedicated' 和 'lowpriority'。

只有在輸入中指定 時 vm_size param ,才會生效。

entry_script
str
必要

字串,表示用來開始定型之檔案的相對路徑。

script_params
dict
必要

命令列引數的字典,用來傳遞至 中指定的 entry_script 定型腳本。

use_docker
bool
必要

布林值,指出執行實驗的環境是否應該以 Docker 為基礎。

custom_docker_image
str
必要

要用來定型之映射的 Docker 映射名稱。 如果未設定,則會使用預設 CPU 型映射作為基底映射。

image_registry_details
ContainerRegistry
必要

Docker 映射登錄的詳細資料。

user_managed
bool
必要

指定 Azure ML 是否重複使用現有的 Python 環境。 False 表示 AzureML 會根據 conda 相依性規格建立 Python 環境。

conda_packages
list
必要

字串清單,表示要新增至實驗 Python 環境的 conda 套件。

pip_packages
list
必要

字串清單,表示要新增至實驗 Python 環境的 pip 套件。

conda_dependencies_file_path
str
必要

字串,表示 conda 相依性 yaml 檔案的相對路徑。 如果指定,Azure ML 將不會安裝任何架構相關套件。 這可與 參數搭配 conda_packages 使用。 已淘汰。 conda_dependencies_file使用 參數。

pip_requirements_file_path
str
必要

字串,表示 pip 需求文字檔的相對路徑。 這可與 參數搭配 pip_packages 使用。 已淘汰。 pip_requirements_file使用 參數。

conda_dependencies_file
str
必要

字串,表示 conda 相依性 yaml 檔案的相對路徑。 如果指定,Azure ML 將不會安裝任何架構相關套件。 這可與 參數搭配 conda_packages 使用。

pip_requirements_file
str
必要

字串,表示 pip 需求文字檔的相對路徑。 這可與 參數搭配 pip_packages 使用。

environment_variables
dict
必要

環境變數名稱和值的字典。 這些環境變數會在執行使用者指令碼的程序上設定。

environment_definition
Environment
必要

實驗的環境定義包括 PythonSection、DockerSection 和環境變數。 任何未透過其他參數直接公開至估算器建構的環境選項,都可以使用 environment_definition 參數來設定。 如果指定此參數,則會優先于其他環境相關參數,例如 use_gpucustom_docker_imageconda_packagespip_packages 。 錯誤將會回報不正確組合。

inputs
list
必要

azureml.data.data_reference的清單。要做為輸入的 DataReference 物件。

shm_size
str
必要

Docker 容器的共用記憶體區塊大小。 如果未設定,則會使用預設azureml.core.environment._DEFAULT_SHM_SIZE。

resume_from
DataPath
必要

包含要繼續實驗之檢查點或模型檔案的資料路徑。

max_run_duration_seconds
int
必要

執行的最大允許時間。 如果執行時間超過此值,Azure ML 將會嘗試自動取消執行。

framework_version
str
必要

要用於執行定型程式碼的 Scikit-learn 版本。 SKLearn.get_supported_versions() 會傳回目前 SDK 支援的版本清單。

_enable_optimized_mode
bool
必要

使用預先建置的架構映射啟用累加環境建置,以加快環境準備速度。 預先建置的架構映射是以預先安裝架構相依性的 Azure ML 預設 CPU/GPU 基底映射為基礎所建置。

_disable_validation
bool
必要

在執行提交之前停用腳本驗證。 預設值為 True。

_show_lint_warnings
bool
必要

顯示腳本 linting 警告。 預設值是 False。

_show_package_warnings
bool
必要

顯示套件驗證警告。 預設值是 False。

備註

提交定型作業時,Azure ML 會在 Docker 容器內的 conda 環境中執行腳本。 SKLearn 容器已安裝下列相依性。

相依性 |Scikit-learn 0.20.3 |———————- |—————– |Python |3.6.2 |azureml-defaults |最新 |IntelMpi |2018.3.222 |scikit-learn |0.20.3 |numpy |1.16.2 |miniconda |4.5.11 |scipy |1.2.1 |joblib |0.13.2 |git |2.7.4 |

Docker 映射會擴充 Ubuntu 16.04。

如果您需要安裝其他相依性,您可以使用 pip_packagesconda_packages 參數,也可以提供 pip_requirements_fileconda_dependencies_file 檔案。 或者,您可以建置自己的映射,並將 參數傳遞 custom_docker_image 至估算器建構函式。

屬性

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'