Condividi tramite


SKLearn Classe

Crea un stimatore per il training negli esperimenti scikit-learn.

DEPRECATO. Usare l'oggetto con un ambiente definito o l'ambiente ScriptRunConfig AzureML-Tutorial curato. Per un'introduzione alla configurazione dell'esperimento SKLearn con ScriptRunConfig, vedere Eseguire il training di modelli scikit-learn su larga scala con Azure Machine Learning.

Questo strumento di stima supporta solo il training della CPU a nodo singolo.

Versioni supportate: 0.20.3

Inizializzare un stimatore Scikit-learn.

Ereditarietà
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

Costruttore

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametri

source_directory
str
Necessario

Directory locale contenente i file di configurazione dell'esperimento.

compute_target
AbstractComputeTarget oppure str
Necessario

Destinazione di calcolo in cui si verificherà il training. Può essere un oggetto o la stringa "local".

vm_size
str
Necessario

Dimensioni della macchina virtuale della destinazione di calcolo che verrà creata per il training.

Valori supportati: qualsiasi dimensione della macchina virtuale di Azure.

vm_priority
str
Necessario

Priorità della macchina virtuale della destinazione di calcolo che verrà creata per il training. Se non specificato, viene usato "dedicato".

Valori supportati: 'dedicato' e 'lowpriority'.

Ciò ha effetto solo quando l'oggetto viene specificato nell'input vm_size param .

entry_script
str
Necessario

Stringa che rappresenta il percorso relativo del file usato per avviare il training.

script_params
dict
Necessario

Dizionario degli argomenti della riga di comando da passare allo script di training specificato in entry_script.

custom_docker_image
str
Necessario

Nome dell'immagine Docker da cui verrà compilata l'immagine da usare per il training. In caso contrario, verrà usata un'immagine predefinita basata sulla CPU come immagine di base.

image_registry_details
ContainerRegistry
Necessario

Dettagli del Registro immagini Docker.

user_managed
bool
Necessario

Specifica se Azure ML riutilizza un ambiente Python esistente. False significa che AzureML creerà un ambiente Python in base alla specifica delle dipendenze conda.

conda_packages
list
Necessario

Elenco di stringhe che rappresentano pacchetti conda da aggiungere all'ambiente Python per l'esperimento.

pip_packages
list
Necessario

Elenco di stringhe che rappresentano i pacchetti pip da aggiungere all'ambiente Python per l'esperimento.

conda_dependencies_file_path
str
Necessario

Stringa che rappresenta il percorso relativo del file yaml delle dipendenze conda. Se specificato, Azure ML non installerà pacchetti correlati al framework. Questa opzione può essere fornita in combinazione con il conda_packages parametro . DEPRECATO. Usare il conda_dependencies_file parametro .

pip_requirements_file_path
str
Necessario

Stringa che rappresenta il percorso relativo del file di testo dei requisiti pip. Questa opzione può essere fornita in combinazione con il pip_packages parametro . DEPRECATO. Usare il pip_requirements_file parametro .

conda_dependencies_file
str
Necessario

Stringa che rappresenta il percorso relativo del file yaml delle dipendenze conda. Se specificato, Azure ML non installerà pacchetti correlati al framework. Questa opzione può essere fornita in combinazione con il conda_packages parametro .

pip_requirements_file
str
Necessario

Stringa che rappresenta il percorso relativo del file di testo dei requisiti pip. Questa opzione può essere fornita in combinazione con il pip_packages parametro .

environment_variables
dict
Necessario

Dizionario dei nomi e dei valori delle variabili di ambiente. Queste variabili di ambiente vengono impostate nel processo in cui viene eseguito lo script utente.

environment_definition
Environment
Necessario

La definizione di ambiente per un esperimento include PythonSection, DockerSection e variabili di ambiente. Qualsiasi opzione di ambiente non esposta direttamente tramite altri parametri alla costruzione di Estimator può essere impostata usando environment_definition il parametro . Se questo parametro è specificato, avrà la precedenza su altri parametri correlati all'ambiente, ad esempio use_gpu, custom_docker_image, conda_packageso pip_packages. Gli errori verranno segnalati combinazioni non valide.

inputs
list
Necessario

Elenco di DataReference oggetti da DatasetConsumptionConfig usare come input.

shm_size
str
Necessario

Dimensioni del blocco di memoria condiviso del contenitore Docker. Se non è impostato, viene usato il azureml.core.environment._DEFAULT_SHM_SIZE predefinito.

resume_from
DataPath
Necessario

Percorso dati contenente i file di checkpoint o modello da cui riprendere l'esperimento.

max_run_duration_seconds
int
Necessario

Tempo massimo consentito per l'esecuzione. Azure ML tenterà di annullare automaticamente l'esecuzione se richiede più tempo di questo valore.

framework_version
str
Necessario

Versione scikit-learn da usare per l'esecuzione del codice di training. SKLearn.get_supported_versions() restituisce un elenco delle versioni supportate dall'SDK corrente.

source_directory
str
Necessario

Directory locale contenente i file di configurazione dell'esperimento.

compute_target
AbstractComputeTarget oppure str
Necessario

Destinazione di calcolo in cui si verificherà il training. Può essere un oggetto o la stringa "local".

vm_size
str
Necessario

Dimensioni della macchina virtuale della destinazione di calcolo che verrà creata per il training. Valori supportati: qualsiasi dimensione della macchina virtuale di Azure.

vm_priority
str
Necessario

Priorità della macchina virtuale della destinazione di calcolo che verrà creata per il training. Se non specificato, viene usato "dedicato".

Valori supportati: 'dedicato' e 'lowpriority'.

Ciò ha effetto solo quando l'oggetto viene specificato nell'input vm_size param .

entry_script
str
Necessario

Stringa che rappresenta il percorso relativo del file usato per avviare il training.

script_params
dict
Necessario

Dizionario degli argomenti della riga di comando da passare allo script di training specificato in entry_script.

use_docker
bool
Necessario

Valore bool che indica se l'ambiente da eseguire l'esperimento deve essere basato su Docker.

custom_docker_image
str
Necessario

Nome dell'immagine Docker da cui verrà compilata l'immagine da usare per il training. In caso contrario, un'immagine basata sulla CPU predefinita verrà usata come immagine di base.

image_registry_details
ContainerRegistry
Necessario

Dettagli del Registro immagini Docker.

user_managed
bool
Necessario

Specifica se Azure ML riutilizza un ambiente Python esistente. False significa che AzureML creerà un ambiente Python in base alla specifica delle dipendenze conda.

conda_packages
list
Necessario

Elenco di stringhe che rappresentano pacchetti conda da aggiungere all'ambiente Python per l'esperimento.

pip_packages
list
Necessario

Elenco di stringhe che rappresentano i pacchetti pip da aggiungere all'ambiente Python per l'esperimento.

conda_dependencies_file_path
str
Necessario

Stringa che rappresenta il percorso relativo del file yaml delle dipendenze conda. Se specificato, Azure ML non installerà pacchetti correlati al framework. Questa opzione può essere fornita in combinazione con il conda_packages parametro . DEPRECATO. Usare il conda_dependencies_file parametro .

pip_requirements_file_path
str
Necessario

Stringa che rappresenta il percorso relativo del file di testo dei requisiti pip. Questa opzione può essere fornita in combinazione con il pip_packages parametro . DEPRECATO. Usare il pip_requirements_file parametro .

conda_dependencies_file
str
Necessario

Stringa che rappresenta il percorso relativo del file yaml delle dipendenze conda. Se specificato, Azure ML non installerà pacchetti correlati al framework. Questa opzione può essere fornita in combinazione con il conda_packages parametro .

pip_requirements_file
str
Necessario

Stringa che rappresenta il percorso relativo del file di testo dei requisiti pip. Questa opzione può essere fornita in combinazione con il pip_packages parametro .

environment_variables
dict
Necessario

Dizionario dei nomi e dei valori delle variabili di ambiente. Queste variabili di ambiente vengono impostate nel processo in cui viene eseguito lo script utente.

environment_definition
Environment
Necessario

La definizione di ambiente per un esperimento include PythonSection, DockerSection e variabili di ambiente. Qualsiasi opzione di ambiente non esposta direttamente tramite altri parametri alla costruzione di Estimator può essere impostata usando environment_definition il parametro . Se questo parametro è specificato, avrà la precedenza su altri parametri correlati all'ambiente, ad esempio use_gpu, custom_docker_image, conda_packageso pip_packages. Gli errori verranno segnalati combinazioni non valide.

inputs
list
Necessario

Elenco di azureml.data.data_reference. Oggetti DataReference da usare come input.

shm_size
str
Necessario

Dimensioni del blocco di memoria condiviso del contenitore Docker. Se non è impostato, viene usato il azureml.core.environment._DEFAULT_SHM_SIZE predefinito.

resume_from
DataPath
Necessario

Percorso dati contenente i file di checkpoint o modello da cui riprendere l'esperimento.

max_run_duration_seconds
int
Necessario

Tempo massimo consentito per l'esecuzione. Azure ML tenterà di annullare automaticamente l'esecuzione se richiede più tempo di questo valore.

framework_version
str
Necessario

Versione scikit-learn da usare per l'esecuzione del codice di training. SKLearn.get_supported_versions() restituisce un elenco delle versioni supportate dall'SDK corrente.

_enable_optimized_mode
bool
Necessario

Abilitare la compilazione incrementale dell'ambiente con immagini framework predefinite per una preparazione più rapida dell'ambiente. Un'immagine del framework predefinita è basata su immagini predefinite di CPU/GPU di Azure ML con dipendenze del framework preinstallate.

_disable_validation
bool
Necessario

Disabilitare la convalida dello script prima di eseguire l'invio. Il valore predefinito è True.

_show_lint_warnings
bool
Necessario

Mostra avvisi di linting dello script. Il valore predefinito è False.

_show_package_warnings
bool
Necessario

Mostra avvisi di convalida del pacchetto. Il valore predefinito è False.

Commenti

Quando si invia un processo di training, Azure ML esegue lo script in un ambiente conda all'interno di un contenitore Docker. I contenitori SKLearn hanno le dipendenze seguenti installate.

Dipendenze | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Ultima | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Le immagini Docker estendono Ubuntu 16.04.

Se è necessario installare dipendenze aggiuntive, è possibile usare i pip_packages parametri o conda_packages oppure specificare il pip_requirements_file file o conda_dependencies_file . In alternativa, è possibile creare un'immagine personalizzata e passare il custom_docker_image parametro al costruttore di stima.

Attributi

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'