Dela via


SKLearn Klass

Skapar en beräkning för träning i Scikit-learn-experiment.

DEPRECATED. Använd objektet ScriptRunConfig med din egen definierade miljö eller den AzureML-Tutorial kuraterade miljön. En introduktion till hur du konfigurerar SKLearn-experimentkörningar med ScriptRunConfig finns i Träna scikit-learn-modeller i stor skala med Azure Machine Learning.

Den här uppskattningen stöder endast cpu-träning med en nod.

Versioner som stöds: 0.20.3

Initiera en Scikit-learn-skattare.

Arv
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

Konstruktor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametrar

source_directory
str
Obligatorisk

En lokal katalog som innehåller experimentkonfigurationsfiler.

compute_target
AbstractComputeTarget eller str
Obligatorisk

Beräkningsmålet där träningen ska ske. Detta kan antingen vara ett -objekt eller strängen "lokal".

vm_size
str
Obligatorisk

VM-storleken för beräkningsmålet som ska skapas för träningen.

Värden som stöds: Valfri storlek på virtuella Azure-datorer.

vm_priority
str
Obligatorisk

VM-prioriteten för beräkningsmålet som ska skapas för träningen. Om inget anges används "dedikerad".

Värden som stöds: "dedikerad" och "lågprioritet".

Detta börjar endast gälla när vm_size param anges i indata.

entry_script
str
Obligatorisk

En sträng som representerar den relativa sökvägen till filen som används för att starta träningen.

script_params
dict
Obligatorisk

En ordlista med kommandoradsargument som ska skickas till träningsskriptet som anges i entry_script.

custom_docker_image
str
Obligatorisk

Namnet på den Docker-avbildning som avbildningen som ska användas för träning kommer att skapas. Om den inte anges används en standard-CPU-baserad avbildning som basavbildning.

image_registry_details
ContainerRegistry
Obligatorisk

Information om Docker-avbildningsregistret.

user_managed
bool
Obligatorisk

Anger om Azure ML återanvänder en befintlig Python-miljö. Falskt innebär att AzureML skapar en Python-miljö baserat på specifikationen för conda-beroenden.

conda_packages
list
Obligatorisk

En lista med strängar som representerar conda-paket som ska läggas till i Python-miljön för experimentet.

pip_packages
list
Obligatorisk

En lista med strängar som representerar pip-paket som ska läggas till i Python-miljön för experimentet.

conda_dependencies_file_path
str
Obligatorisk

En sträng som representerar den relativa sökvägen till yaml-filen med conda-beroenden. Om detta anges installerar Inte Azure ML några ramverksrelaterade paket. Detta kan anges i kombination med parametern conda_packages . DEPRECATED. Använd parametern conda_dependencies_file .

pip_requirements_file_path
str
Obligatorisk

En sträng som representerar den relativa sökvägen till textfilen pip-krav. Detta kan anges i kombination med parametern pip_packages . DEPRECATED. Använd parametern pip_requirements_file .

conda_dependencies_file
str
Obligatorisk

En sträng som representerar den relativa sökvägen till yaml-filen med conda-beroenden. Om detta anges installerar Inte Azure ML några ramverksrelaterade paket. Detta kan anges i kombination med parametern conda_packages .

pip_requirements_file
str
Obligatorisk

En sträng som representerar den relativa sökvägen till textfilen pip-krav. Detta kan anges i kombination med parametern pip_packages .

environment_variables
dict
Obligatorisk

En ordlista med miljövariablers namn och värden. Dessa miljövariabler anges i processen där användarskript körs.

environment_definition
Environment
Obligatorisk

Miljödefinitionen för ett experiment innehåller PythonSection, DockerSection och miljövariabler. Alla miljöalternativ som inte exponeras direkt via andra parametrar för beräkningskonstruktionen kan anges med hjälp av environment_definition parametern . Om den här parametern anges har den företräde framför andra miljörelaterade parametrar som use_gpu, custom_docker_image, conda_packageseller pip_packages. Fel rapporteras ogiltiga kombinationer.

inputs
list
Obligatorisk

En lista över DataReference eller DatasetConsumptionConfig objekt som ska användas som indata.

shm_size
str
Obligatorisk

Storleken på Docker-containerns delade minnesblock. Om det inte anges används standard azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
DataPath
Obligatorisk

Datasökvägen som innehåller kontrollpunkten eller modellfilerna som experimentet ska återupptas från.

max_run_duration_seconds
int
Obligatorisk

Den maximala tillåtna tiden för körningen. Azure ML försöker automatiskt avbryta körningen om det tar längre tid än det här värdet.

framework_version
str
Obligatorisk

Scikit-learn-versionen som ska användas för att köra träningskod. SKLearn.get_supported_versions() returnerar en lista över de versioner som stöds av aktuell SDK.

source_directory
str
Obligatorisk

En lokal katalog som innehåller experimentkonfigurationsfiler.

compute_target
AbstractComputeTarget eller str
Obligatorisk

Beräkningsmålet där träningen ska ske. Detta kan antingen vara ett -objekt eller strängen "lokal".

vm_size
str
Obligatorisk

VM-storleken för beräkningsmålet som ska skapas för träningen. Värden som stöds: Valfri storlek på virtuella Azure-datorer.

vm_priority
str
Obligatorisk

VM-prioriteten för beräkningsmålet som ska skapas för träningen. Om inget anges används "dedikerad".

Värden som stöds: "dedikerad" och "lågprioritet".

Detta börjar endast gälla när vm_size param anges i indata.

entry_script
str
Obligatorisk

En sträng som representerar den relativa sökvägen till filen som används för att starta träningen.

script_params
dict
Obligatorisk

En ordlista med kommandoradsargument som ska skickas till träningsskriptet som anges i entry_script.

use_docker
bool
Obligatorisk

Ett bool-värde som anger om miljön som ska köra experimentet ska vara Docker-baserad.

custom_docker_image
str
Obligatorisk

Namnet på den Docker-avbildning som avbildningen som ska användas för träning kommer att skapas. Om den inte anges används en standard-CPU-baserad avbildning som basavbildning.

image_registry_details
ContainerRegistry
Obligatorisk

Information om Docker-avbildningsregistret.

user_managed
bool
Obligatorisk

Anger om Azure ML återanvänder en befintlig Python-miljö. Falskt innebär att AzureML skapar en Python-miljö baserat på specifikationen för conda-beroenden.

conda_packages
list
Obligatorisk

En lista med strängar som representerar conda-paket som ska läggas till i Python-miljön för experimentet.

pip_packages
list
Obligatorisk

En lista med strängar som representerar pip-paket som ska läggas till i Python-miljön för experimentet.

conda_dependencies_file_path
str
Obligatorisk

En sträng som representerar den relativa sökvägen till yaml-filen med conda-beroenden. Om detta anges installerar Inte Azure ML några ramverksrelaterade paket. Detta kan anges i kombination med parametern conda_packages . DEPRECATED. Använd parametern conda_dependencies_file .

pip_requirements_file_path
str
Obligatorisk

En sträng som representerar den relativa sökvägen till textfilen pip-krav. Detta kan anges i kombination med parametern pip_packages . DEPRECATED. Använd parametern pip_requirements_file .

conda_dependencies_file
str
Obligatorisk

En sträng som representerar den relativa sökvägen till yaml-filen med conda-beroenden. Om detta anges installerar Inte Azure ML några ramverksrelaterade paket. Detta kan anges i kombination med parametern conda_packages .

pip_requirements_file
str
Obligatorisk

En sträng som representerar den relativa sökvägen till textfilen pip-krav. Detta kan anges i kombination med parametern pip_packages .

environment_variables
dict
Obligatorisk

En ordlista med miljövariablers namn och värden. Dessa miljövariabler anges i processen där användarskript körs.

environment_definition
Environment
Obligatorisk

Miljödefinitionen för ett experiment innehåller PythonSection, DockerSection och miljövariabler. Alla miljöalternativ som inte exponeras direkt via andra parametrar för beräkningskonstruktionen kan anges med hjälp av environment_definition parametern . Om den här parametern anges har den företräde framför andra miljörelaterade parametrar som use_gpu, custom_docker_image, conda_packageseller pip_packages. Fel rapporteras ogiltiga kombinationer.

inputs
list
Obligatorisk

En lista över azureml.data.data_reference. DataReference-objekt som ska användas som indata.

shm_size
str
Obligatorisk

Storleken på Docker-containerns delade minnesblock. Om inte anges används standard azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
DataPath
Obligatorisk

Datasökvägen som innehåller kontrollpunkten eller modellfilerna som experimentet ska återupptas från.

max_run_duration_seconds
int
Obligatorisk

Den maximala tillåtna tiden för körningen. Azure ML försöker automatiskt avbryta körningen om det tar längre tid än det här värdet.

framework_version
str
Obligatorisk

Scikit-learn-versionen som ska användas för att köra träningskod. SKLearn.get_supported_versions() returnerar en lista över de versioner som stöds av den aktuella SDK:en.

_enable_optimized_mode
bool
Obligatorisk

Aktivera inkrementell miljöversion med färdiga ramverksbilder för snabbare förberedelse av miljön. En fördefinierad ramverksavbildning bygger på Azure ML-standard-CPU/GPU-basavbildningar med ramverksberoenden förinstallerade.

_disable_validation
bool
Obligatorisk

Inaktivera skriptvalidering innan du kör sändningen. Standardvärdet är Sant.

_show_lint_warnings
bool
Obligatorisk

Visa varningar om skriptlindning. Standardvärdet är Falskt.

_show_package_warnings
bool
Obligatorisk

Visa paketverifieringsvarningar. Standardvärdet är Falskt.

Kommentarer

När du skickar ett träningsjobb kör Azure ML skriptet i en conda-miljö i en Docker-container. SKLearn-containrar har följande beroenden installerade.

Beroenden | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Senaste | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Docker-avbildningarna utökar Ubuntu 16.04.

Om du behöver installera ytterligare beroenden kan du antingen använda parametrarna pip_packages eller conda_packages eller så kan du ange din pip_requirements_file eller conda_dependencies_file filen. Du kan också skapa en egen avbildning och skicka parametern custom_docker_image till beräkningskonstruktorn.

Attribut

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'