Estimator Klas
Vertegenwoordigt een algemene estimator om gegevens te trainen met behulp van een opgegeven framework.
AFGEKEURD. Gebruik het ScriptRunConfig object met uw eigen gedefinieerde omgeving of een gecureerde Azure ML-omgeving. Zie Trainingsuitvoeringen configureren en verzenden voor een inleiding tot het configureren van experimentuitvoeringen met ScriptRunConfig.
Deze klasse is ontworpen voor gebruik met machine learning-frameworks die nog geen vooraf geconfigureerde Azure Machine Learning-estimator hebben. Er bestaan vooraf geconfigureerde schattingen voor Chainer, PyTorch, TensorFlowen SKLearn. Zie Modellen trainen met Azure Machine Learning met behulp van estimator als u een estimator wilt maken die niet vooraf is geconfigureerd.
De Estimator-klasse verpakt uitvoeringsconfiguratiegegevens om de taken van het opgeven van een script te vereenvoudigen. Het ondersteunt zowel uitvoering met één knooppunt als uitvoering van meerdere knooppunten. Als u de estimator uitvoert, wordt een model geproduceerd in de uitvoermap die is opgegeven in uw trainingsscript.
Initialiseer de estimator.
azureml.core.environment._DEFAULT_SHM_SIZE wordt gebruikt. Zie Naslaginformatie over Docker-uitvoering voor meer informatie. :type shm_size: str :p aram resume_from: het gegevenspad met de controlepunt- of modelbestanden van waaruit het experiment moet worden hervat. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: De maximaal toegestane tijd voor de uitvoering. Azure ML probeert dit automatisch te doen
de uitvoering annuleren als deze langer duurt dan deze waarde.
- Overname
-
azureml.train.estimator._mml_base_estimator.MMLBaseEstimatorEstimator
Constructor
Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parameters
- source_directory
- str
Een lokale map met experimentconfiguratie en codebestanden die nodig zijn voor een trainingstaak.
- compute_target
- AbstractComputeTarget of str
Het rekendoel waar de training plaatsvindt. Dit kan een object of de tekenreeks 'lokaal' zijn.
- vm_size
- str
De VM-grootte van het rekendoel dat voor de training wordt gemaakt. Ondersteunde waarden: elke grootte van azure-VM's.
- vm_priority
- str
De VM-prioriteit van het rekendoel dat voor de training wordt gemaakt. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.
Ondersteunde waarden: 'dedicated' en 'lowpriority'.
Dit wordt alleen van kracht wanneer de vm_size
parameter is opgegeven in de invoer.
- entry_script
- str
Het relatieve pad naar het bestand dat wordt gebruikt om de training te starten.
- script_params
- dict
Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan het trainingsscript dat is opgegeven in entry_script
.
- node_count
- int
Het aantal knooppunten in het rekendoel dat voor de training wordt gebruikt. Als deze groter is dan 1, wordt een gedistribueerde MPI-taak uitgevoerd.
- process_count_per_node
- int
Het aantal processen (of 'werkrollen') dat op elk knooppunt moet worden uitgevoerd. Als deze groter is dan 1, wordt een gedistribueerde MPI-taak uitgevoerd. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde taken.
- distributed_backend
- str
De communicatie-back-end voor gedistribueerde training.
AFGEKEURD. Gebruik de distributed_training
parameter .
Ondersteunde waarden: 'mpi'. 'mpi' staat voor MPI/Horovod.
Deze parameter is vereist wanneer node_count
of process_count_per_node
> 1.
Wanneer node_count
== 1 en process_count_per_node
== 1, wordt er geen back-end gebruikt, tenzij de back-end expliciet is ingesteld. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde training.
- distributed_training
- Mpi
Parameters voor het uitvoeren van een gedistribueerde trainingstaak.
Voor het uitvoeren van een gedistribueerde taak met MPI-back-end gebruikt Mpi u object om op te geven process_count_per_node
.
- use_gpu
- bool
Geeft aan of de omgeving om het experiment uit te voeren GPU's moet ondersteunen.
Als dit waar is, wordt in de omgeving een standaard Docker-installatiekopieën op basis van een GPU gebruikt. Als onwaar is, wordt een op CPU gebaseerde installatiekopieën gebruikt. Standaard Docker-installatiekopieën (CPU of GPU) worden alleen gebruikt als de custom_docker_image
parameter niet is ingesteld. Deze instelling wordt alleen gebruikt in docker-rekendoelen.
- use_docker
- bool
Hiermee geeft u op of de omgeving om het experiment uit te voeren op Basis van Docker moet zijn.
- custom_docker_base_image
- str
De naam van de Docker-installatiekopieën van waaruit de installatiekopieën voor training worden gemaakt.
AFGEKEURD. Gebruik de custom_docker_image
parameter .
Als dit niet is ingesteld, wordt een standaard-CPU-installatiekopieën gebruikt als basisinstallatiekopieën.
- custom_docker_image
- str
De naam van de Docker-installatiekopieën van waaruit de installatiekopieën voor training worden gemaakt. Als dit niet is ingesteld, wordt een standaard-CPU-installatiekopieën gebruikt als basisinstallatiekopieën. Geef alleen installatiekopieën op die beschikbaar zijn in openbare Docker-opslagplaatsen (Docker Hub). Als u een installatiekopieën uit een privé-Docker-opslagplaats wilt gebruiken, gebruikt u in plaats daarvan de parameter van environment_definition
de constructor.
- image_registry_details
- ContainerRegistry
De details van het register van de Docker-installatiekopieën.
- user_managed
- bool
Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. Indien onwaar, wordt er een Python-omgeving gemaakt op basis van de specificatie conda-afhankelijkheden.
- conda_packages
- list
Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.
- pip_packages
- list
Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.
- conda_dependencies_file_path
- str
Het relatieve pad naar het yaml-bestand conda-afhankelijkheden. Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten.
AFGEKEURD. Gebruik de conda_dependencies_file
paramenter.
Geef of conda_dependencies_file_path
conda_dependencies_file
op. Als beide zijn opgegeven, conda_dependencies_file
wordt gebruikt.
- pip_requirements_file_path
- str
Het relatieve pad naar het tekstbestand pip-vereisten.
AFGEKEURD. Gebruik de pip_requirements_file
parameter .
Deze parameter kan worden opgegeven in combinatie met de pip_packages
parameter . Geef of pip_requirements_file_path
pip_requirements_file
op. Als beide zijn opgegeven, pip_requirements_file
wordt gebruikt.
- conda_dependencies_file
- str
Het relatieve pad naar het yaml-bestand conda-afhankelijkheden. Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten.
- pip_requirements_file
- str
Het relatieve pad naar het tekstbestand pip-vereisten.
Deze parameter kan worden opgegeven in combinatie met de pip_packages
parameter .
- environment_variables
- dict
Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.
- environment_definition
- Environment
De omgevingsdefinitie voor het experiment. Het omvat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks via andere parameters aan de Estimator-constructie wordt weergegeven, kan worden ingesteld met behulp van deze parameter. Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu
, custom_docker_image
, conda_packages
of pip_packages
.
Fouten worden gerapporteerd bij ongeldige combinaties.
- inputs
- list
Een lijst met DataReferenceDatasetConsumptionConfig of-objecten die als invoer moeten worden gebruikt.
- shm_size
- str
De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, wordt de standaard azureml.core.environment._DEFAULT_SHM_SIZE gebruikt. Zie Naslaginformatie over Docker-uitvoering voor meer informatie.
- resume_from
- DataPath
Het gegevenspad met het controlepunt of de modelbestanden van waaruit het experiment moet worden hervat.
- max_run_duration_seconds
- int
De maximaal toegestane tijd voor de uitvoering. Azure ML probeert de uitvoering automatisch te annuleren als deze langer duurt dan deze waarde.
- source_directory
- str
Een lokale map met experimentconfiguratie en codebestanden die nodig zijn voor een trainingstaak.
- compute_target
- AbstractComputeTarget of str
Het rekendoel waar de training plaatsvindt. Dit kan een object of de tekenreeks 'lokaal' zijn.
- vm_size
- str
De VM-grootte van het rekendoel dat voor de training wordt gemaakt. Ondersteunde waarden: elke grootte van azure-VM's.
- vm_priority
- str
De VM-prioriteit van het rekendoel dat voor de training wordt gemaakt. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.
Ondersteunde waarden: 'dedicated' en 'lowpriority'.
Dit wordt alleen van kracht wanneer de vm_size
parameter is opgegeven in de invoer.
- entry_script
- str
Het relatieve pad naar het bestand dat wordt gebruikt om de training te starten.
- script_params
- dict
Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan het trainingsscript dat is opgegeven in entry_script
.
- node_count
- int
Het aantal knooppunten in het rekendoel dat voor de training wordt gebruikt. Als deze groter is dan 1, wordt een gedistribueerde MPI-taak uitgevoerd. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde taken.
- process_count_per_node
- int
Het aantal processen per knooppunt. Als deze groter is dan 1, wordt een gedistribueerde MPI-taak uitgevoerd. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde taken.
- distributed_backend
- str
De communicatie-back-end voor gedistribueerde training.
AFGEKEURD. Gebruik de distributed_training
parameter .
Ondersteunde waarden: 'mpi'. 'mpi' staat voor MPI/Horovod.
Deze parameter is vereist wanneer node_count
of process_count_per_node
> 1.
Wanneer node_count
== 1 en process_count_per_node
== 1, wordt er geen back-end gebruikt, tenzij de back-end expliciet is ingesteld. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde training.
- distributed_training
- Mpi
Parameters voor het uitvoeren van een gedistribueerde trainingstaak.
Voor het uitvoeren van een gedistribueerde taak met MPI-back-end gebruikt Mpi u object om op te geven process_count_per_node
.
- use_gpu
- bool
Hiermee geeft u op of de omgeving om het experiment uit te voeren GPU's moet ondersteunen.
Als dit waar is, wordt in de omgeving een standaard Docker-installatiekopieën op basis van een GPU gebruikt. Als onwaar is, wordt een op CPU gebaseerde installatiekopieën gebruikt. Standaard Docker-installatiekopieën (CPU of GPU) worden alleen gebruikt als de custom_docker_image
parameter niet is ingesteld. Deze instelling wordt alleen gebruikt in Docker-rekendoelen.
- use_docker
- bool
Hiermee geeft u op of de omgeving om het experiment uit te voeren op Basis van Docker moet zijn.
- custom_docker_base_image
- str
De naam van de Docker-installatiekopieën van waaruit de installatiekopieën voor training worden gemaakt.
AFGEKEURD. Gebruik de custom_docker_image
parameter .
Als dit niet is ingesteld, wordt een standaard-CPU-installatiekopieën gebruikt als basisinstallatiekopieën.
- custom_docker_image
- str
De naam van de Docker-installatiekopieën van waaruit de installatiekopieën voor training worden gemaakt. Als dit niet is ingesteld, wordt een standaard-CPU-installatiekopieën gebruikt als basisinstallatiekopieën. Geef alleen installatiekopieën op die beschikbaar zijn in openbare Docker-opslagplaatsen (Docker Hub). Als u een installatiekopieën uit een privé-Docker-opslagplaats wilt gebruiken, gebruikt u in plaats daarvan de parameter van environment_definition
de constructor.
- image_registry_details
- ContainerRegistry
De details van het register van de Docker-installatiekopieën.
- user_managed
- bool
Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. Indien onwaar, wordt er een Python-omgeving gemaakt op basis van de specificatie conda-afhankelijkheden.
- conda_packages
- list
Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.
- pip_packages
- list
Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.
- conda_dependencies_file_path
Het relatieve pad naar het yaml-bestand conda-afhankelijkheden. Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten.
AFGEKEURD. Gebruik de conda_dependencies_file
paramenter.
Geef of conda_dependencies_file_path
conda_dependencies_file
op. Als beide zijn opgegeven, conda_dependencies_file
wordt gebruikt.
- pip_requirements_file_path
Het relatieve pad naar het tekstbestand pip-vereisten.
AFGEKEURD. Gebruik de pip_requirements_file
parameter .
Dit kan worden opgegeven in combinatie met de pip_packages
parameter . Geef of pip_requirements_file_path
pip_requirements_file
op. Als beide zijn opgegeven, pip_requirements_file
wordt gebruikt.
- pip_requirements_file
- str
Het relatieve pad naar het tekstbestand pip-vereisten.
Dit kan worden opgegeven in combinatie met de pip_packages
parameter .
- environment_variables
- dict
Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.
- environment_definition
- Environment
De omgevingsdefinitie voor het experiment. Het omvat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks via andere parameters aan de Estimator-constructie wordt weergegeven, kan worden ingesteld met behulp van deze parameter. Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu
, custom_docker_image
, conda_packages
of pip_packages
.
Fouten worden gerapporteerd bij ongeldige combinaties.
- inputs
- list
Een lijst met DataReferenceDatasetConsumptionConfig of-objecten die als invoer moeten worden gebruikt.
- shm_size
De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, wordt de standaardinstelling
- _disable_validation
- bool
Schakel scriptvalidatie uit voordat u de verzending uitvoert. De standaardwaarde is True.
- _show_lint_warnings
- bool
Waarschuwingen voor linting van scripts weergeven. De standaardwaarde is False.
- _show_package_warnings
- bool
Waarschuwingen voor pakketvalidatie weergeven. De standaardwaarde is False.
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor