SKLearn Klas
Hiermee maakt u een estimator voor training in Scikit-learn-experimenten.
AFGEKEURD. Gebruik het ScriptRunConfig object met uw eigen gedefinieerde omgeving of de AzureML-Tutorial gecureerde omgeving. Zie Scikit-learn-modellen op schaal trainen met Azure Machine Learning voor een inleiding tot het configureren van SKLearn-experimentuitvoeringen met ScriptRunConfig.
Deze estimator ondersteunt alleen CPU-training met één knooppunt.
Ondersteunde versies: 0.20.3
Initialiseer een Scikit-learn-estimator.
- Overname
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Constructor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parameters
- compute_target
- AbstractComputeTarget of str
Het rekendoel waar de training plaatsvindt. Dit kan een object of de tekenreeks 'lokaal' zijn.
- vm_size
- str
De VM-grootte van het rekendoel dat voor de training wordt gemaakt.
Ondersteunde waarden: elke grootte van azure-VM's.
- vm_priority
- str
De VM-prioriteit van het rekendoel dat voor de training wordt gemaakt. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.
Ondersteunde waarden: 'dedicated' en 'lowpriority'.
Dit wordt alleen van kracht wanneer de vm_size param
is opgegeven in de invoer.
- entry_script
- str
Een tekenreeks die het relatieve pad vertegenwoordigt naar het bestand dat wordt gebruikt om de training te starten.
- script_params
- dict
Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan het trainingsscript dat is opgegeven in entry_script
.
- custom_docker_image
- str
De naam van de Docker-installatiekopieën van waaruit de installatiekopieën voor training worden gemaakt. Als dit niet is ingesteld, wordt een standaard-CPU-installatiekopieën gebruikt als basisinstallatiekopieën.
- image_registry_details
- ContainerRegistry
De details van het register van de Docker-installatiekopieën.
- user_managed
- bool
Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. False betekent dat AzureML een Python-omgeving maakt op basis van de specificatie conda-afhankelijkheden.
- conda_packages
- list
Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.
- pip_packages
- list
Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.
- conda_dependencies_file_path
- str
Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden vertegenwoordigt.
Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten.
Dit kan worden opgegeven in combinatie met de conda_packages
parameter .
AFGEKEURD. Gebruik de conda_dependencies_file
parameter .
- pip_requirements_file_path
- str
Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten vertegenwoordigt.
Dit kan worden opgegeven in combinatie met de pip_packages
parameter .
AFGEKEURD. Gebruik de pip_requirements_file
parameter .
- conda_dependencies_file
- str
Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden vertegenwoordigt.
Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten.
Dit kan worden opgegeven in combinatie met de conda_packages
parameter .
- pip_requirements_file
- str
Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten vertegenwoordigt.
Dit kan worden opgegeven in combinatie met de pip_packages
parameter .
- environment_variables
- dict
Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.
- environment_definition
- Environment
De omgevingsdefinitie voor een experiment omvat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks beschikbaar wordt gemaakt via andere parameters voor de constructie van de estimator, kan worden ingesteld met behulp van environment_definition
de parameter . Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu
, custom_docker_image
, conda_packages
of pip_packages
.
Fouten worden gerapporteerd als ongeldige combinaties.
- inputs
- list
Een lijst met DataReferenceDatasetConsumptionConfig of-objecten die als invoer moeten worden gebruikt.
- shm_size
- str
De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, wordt de standaard azureml.core.environment._DEFAULT_SHM_SIZE gebruikt.
- resume_from
- DataPath
Het gegevenspad met het controlepunt of de modelbestanden van waaruit het experiment moet worden hervat.
- max_run_duration_seconds
- int
De maximaal toegestane tijd voor de uitvoering. Azure ML probeert de uitvoering automatisch te annuleren als deze langer duurt dan deze waarde.
- framework_version
- str
De Scikit-learn-versie die moet worden gebruikt voor het uitvoeren van trainingscode.
SKLearn.get_supported_versions()
retourneert een lijst met de versies die worden ondersteund door de huidige SDK.
- compute_target
- AbstractComputeTarget of str
Het rekendoel waar de training plaatsvindt. Dit kan een object of de tekenreeks 'lokaal' zijn.
- vm_size
- str
De VM-grootte van het rekendoel dat voor de training wordt gemaakt. Ondersteunde waarden: elke grootte van azure-VM's.
- vm_priority
- str
De VM-prioriteit van het rekendoel dat voor de training wordt gemaakt. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.
Ondersteunde waarden: 'dedicated' en 'lowpriority'.
Dit wordt alleen van kracht wanneer de vm_size param
is opgegeven in de invoer.
- entry_script
- str
Een tekenreeks die het relatieve pad vertegenwoordigt naar het bestand dat wordt gebruikt om de training te starten.
- script_params
- dict
Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan het trainingsscript dat is opgegeven in entry_script
.
- use_docker
- bool
Een boolwaarde die aangeeft of de omgeving voor het uitvoeren van het experiment docker moet zijn.
- custom_docker_image
- str
De naam van de Docker-installatiekopieën van waaruit de installatiekopieën voor training worden gemaakt. Als dit niet is ingesteld, wordt een standaard-CPU-installatiekopieën gebruikt als basisinstallatiekopieën.
- image_registry_details
- ContainerRegistry
De details van het register van de Docker-installatiekopieën.
- user_managed
- bool
Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. False betekent dat AzureML een Python-omgeving maakt op basis van de specificatie conda-afhankelijkheden.
- conda_packages
- list
Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.
- pip_packages
- list
Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.
- conda_dependencies_file_path
- str
Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden vertegenwoordigt. Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten.
Dit kan worden opgegeven in combinatie met de conda_packages
parameter .
AFGEKEURD. Gebruik de conda_dependencies_file
parameter .
- pip_requirements_file_path
- str
Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten vertegenwoordigt.
Dit kan worden opgegeven in combinatie met de pip_packages
parameter .
AFGEKEURD. Gebruik de pip_requirements_file
parameter .
- conda_dependencies_file
- str
Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden vertegenwoordigt. Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten.
Dit kan worden opgegeven in combinatie met de conda_packages
parameter .
- pip_requirements_file
- str
Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten vertegenwoordigt.
Dit kan worden opgegeven in combinatie met de pip_packages
parameter .
- environment_variables
- dict
Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.
- environment_definition
- Environment
De omgevingsdefinitie voor een experiment omvat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks beschikbaar wordt gemaakt via andere parameters voor de constructie van de estimator, kan worden ingesteld met behulp van environment_definition
de parameter . Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu
, custom_docker_image
, conda_packages
of pip_packages
.
Fouten worden gerapporteerd als ongeldige combinaties.
- inputs
- list
Een lijst met azureml.data.data_reference. DataReference-objecten die als invoer moeten worden gebruikt.
- shm_size
- str
De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, wordt de standaard azureml.core.environment._DEFAULT_SHM_SIZE gebruikt.
- resume_from
- DataPath
Het gegevenspad met het controlepunt of de modelbestanden waaruit het experiment moet worden hervat.
- max_run_duration_seconds
- int
De maximaal toegestane tijd voor de uitvoering. Azure ML probeert de uitvoering automatisch te annuleren als het langer duurt dan deze waarde.
- framework_version
- str
De Scikit-learn-versie die moet worden gebruikt voor het uitvoeren van trainingscode.
SKLearn.get_supported_versions()
retourneert een lijst met de versies die worden ondersteund door de huidige SDK.
- _enable_optimized_mode
- bool
Incrementele omgevingsbuild inschakelen met vooraf gebouwde frameworkinstallatiekopieën voor een snellere voorbereiding van de omgeving. Een vooraf gebouwde frameworkinstallatiekopie is gebouwd op basisinstallatiekopieën van Azure ML standaard CPU/GPU met vooraf geïnstalleerde frameworkafhankelijkheden.
- _disable_validation
- bool
Schakel scriptvalidatie uit voordat u de verzending uitvoert. De standaardwaarde is True.
- _show_lint_warnings
- bool
Waarschuwingen voor linting van scripts weergeven. De standaardwaarde is False.
- _show_package_warnings
- bool
Waarschuwingen voor pakketvalidatie weergeven. De standaardwaarde is False.
Opmerkingen
Wanneer u een trainingstaak verzendt, voert Azure ML uw script uit in een Conda-omgeving binnen een Docker-container. SkLearn-containers hebben de volgende afhankelijkheden geïnstalleerd.
Afhankelijkheden | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Meest recente | IntelMpi | 3.222 2018 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
De Docker-installatiekopieën breiden Ubuntu 16.04 uit.
Als u aanvullende afhankelijkheden wilt installeren, kunt u de pip_packages
parameters of conda_packages
gebruiken, of u kunt het pip_requirements_file
bestand of conda_dependencies_file
opgeven. U kunt ook uw eigen installatiekopieën bouwen en de custom_docker_image
parameter doorgeven aan de estimator-constructor.
Kenmerken
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor