MpiStep Classe

Referência

Cria um passo de pipeline do Azure ML para executar uma tarefa de MPI.

Para obter um exemplo de utilização do MpiStep, consulte o bloco de notas https://aka.ms/pl-style-trans.

Crie um passo de pipeline do Azure ML para executar uma tarefa de MPI.

PRETERIDO. Em vez disso, utilize o CommandStep . Para obter um exemplo, veja Como executar a preparação distribuída em pipelines com CommandStep.

Herança: PythonScriptStep

MpiStep

Construtor

MpiStep(name=None, source_directory=None, script_name=None, arguments=None, compute_target=None, node_count=None, process_count_per_node=None, inputs=None, outputs=None, allow_reuse=True, version=None, hash_paths=None, **kwargs)

Parâmetros

name: str

valor predefinido: None

[Obrigatório] O nome do módulo.

source_directory: str

valor predefinido: None

[Obrigatório] Uma pasta que contém script python, conda env e outros recursos utilizados no passo.

script_name: str

valor predefinido: None

[Obrigatório] O nome de um script python relativo a source_directory.

arguments: list

valor predefinido: None

[Obrigatório] Uma lista de argumentos da linha de comandos.

compute_target: AmlCompute, str

valor predefinido: None

[Obrigatório] Um destino de computação a utilizar.

node_count: int

valor predefinido: None

[Obrigatório] O número de nós no destino de computação utilizado para a preparação. Se for superior a 1, será executada uma tarefa distribuída por mpi. Apenas o destino de computação AmlCompute é suportado para tarefas distribuídas. Os valores de PipelineParameter são suportados.

process_count_per_node: int

valor predefinido: None

[Obrigatório] O número de processos por nó. Se for superior a 1, será executada uma tarefa distribuída por mpi. Apenas o destino de computação AmlCompute é suportado para tarefas distribuídas. Os valores de PipelineParameter são suportados.

inputs: list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputAbstractDataset, DatasetConsumptionConfig]]

valor predefinido: None

Uma lista de enlaces de portas de entrada.

outputs: list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]]

valor predefinido: None

Uma lista de enlaces de portas de saída.

params: dict

Necessário

Um dicionário de pares nome-valor registados como variáveis de ambiente com "AML_PARAMETER_".

allow_reuse: bool

valor predefinido: True

Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições. A reutilização está ativada por predefinição. Se o conteúdo do passo (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, o resultado da execução anterior deste passo será reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização é determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados.

version: str

valor predefinido: None

Uma etiqueta de versão opcional para denotar uma alteração na funcionalidade do módulo.

hash_paths: list

valor predefinido: None

PRETERIDO: já não é necessário.

Uma lista de caminhos para hash ao verificar se existem alterações nos conteúdos do passo. Se não forem detetadas alterações, o pipeline reutilizará o conteúdo do passo de uma execução anterior. Por predefinição, os conteúdos de source_directory são transformados em hash, à exceção dos ficheiros listados em .amlignoree ou .gitignore.

use_gpu: bool

Necessário

Indica se o ambiente para executar a experimentação deve suportar GPUs. Se For Verdadeiro, será utilizada uma imagem predefinida do Docker baseada em GPU no ambiente. Se For Falso, será utilizada uma imagem baseada na CPU. As imagens do Docker predefinidas (CPU ou GPU) só serão utilizadas se o custom_docker_image parâmetro não estiver definido. Esta definição é utilizada apenas em destinos de computação compatíveis com o Docker.

use_docker: bool

Necessário

Indica se o ambiente para executar a experimentação deve ser baseado no Docker.

custom_docker_image: str

Necessário

O nome da imagem do Docker a partir da qual será criada a imagem a utilizar para preparação. Se não for definida, será utilizada uma imagem baseada na CPU predefinida como imagem de base.

image_registry_details: ContainerRegistry

Necessário

Os detalhes do registo de imagens do Docker.

user_managed: bool

Necessário

Indica se o Azure ML reutiliza um ambiente Python existente; Falso significa que o Azure ML criará um ambiente Python com base na especificação das dependências conda.

conda_packages: list

Necessário

Uma lista de cadeias que representam pacotes conda a serem adicionados ao ambiente Python.

pip_packages: list

Necessário

Uma lista de cadeias que representam pacotes pip a serem adicionados ao ambiente Python.

pip_requirements_file_path: str

Necessário

O caminho relativo para o ficheiro de texto dos requisitos do pip. Este parâmetro pode ser especificado em combinação com o pip_packages parâmetro .

environment_definition: EnvironmentDefinition

Necessário

A EnvironmentDefinition para a experimentação. Inclui PythonSection e DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente através de outros parâmetros para a construção MpiStep pode ser definida com environment_definition parâmetro. Se este parâmetro for especificado, terá precedência sobre outros parâmetros relacionados com o ambiente, como use_gpu, custom_docker_image, conda_packages ou pip_packages e serão comunicados erros nestas combinações inválidas.

name: str

Necessário

[Obrigatório] O nome do módulo.

source_directory: str

Necessário

[Obrigatório] Uma pasta que contém script python, conda env e outros recursos utilizados no passo.

script_name: str

Necessário

[Obrigatório] O nome de um script python relativo a source_directory.

arguments: list

Necessário

[Obrigatório] Uma lista de argumentos da linha de comandos.

compute_target: <xref:azureml.core.compute.AmlComputeCompute>, str

Necessário

[Obrigatório] Um destino de computação a utilizar.

node_count: int

Necessário

[Obrigatório] Número de nós no destino de computação utilizado para a preparação. Se for superior a 1, a tarefa distribuída por mpi será executada. Apenas o destino de computação AmlCompute é suportado para tarefas distribuídas. Os valores de PipelineParameter são suportados.

process_count_per_node: int

Necessário

[Obrigatório] Número de processos por nó. Se for superior a 1, a tarefa distribuída por mpi será executada. Apenas o destino de computação AmlCompute é suportado para tarefas distribuídas. Os valores de PipelineParameter são suportados.

inputs: list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputAbstractDataset, DatasetConsumptionConfig]]

Necessário

Uma lista de enlaces de portas de entrada.

outputs: list[Union[PipelineData, OutputDatasetConfig, PipelineOutputAbstractDataset, OutputPortBinding]]

Necessário

Uma lista de enlaces de portas de saída.

params: dict

Necessário

Um dicionário de pares nome-valor registados como variáveis de ambiente com ">>AML_PARAMETER_<<".

allow_reuse: bool

Necessário

Indica se o passo deve reutilizar os resultados anteriores quando a nova execução com os mesmos parâmetros permanece inalterada. O resultado da execução anterior deste passo é reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização é determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados.

version: str

Necessário

Etiqueta de versão opcional para denotar uma alteração na funcionalidade do módulo

hash_paths: list

Necessário

PRETERIDO: já não é necessário.

use_gpu: bool

Necessário

use_docker: bool

Necessário

Indica se o ambiente para executar a experimentação deve ser baseado no Docker. custom_docker_image (str): o nome da imagem do docker a partir da qual a imagem a utilizar para a tarefa de mpi será criada. Se não for definida, será utilizada uma imagem baseada na CPU predefinida como imagem de base.

custom_docker_image: str

Necessário

O nome da imagem do Docker a partir da qual será criada a imagem a utilizar para preparação. Se não for definida, será utilizada uma imagem baseada na CPU predefinida como imagem de base.

image_registry_details: ContainerRegistry

Necessário

Os detalhes do registo de imagens do Docker.

user_managed: bool

Necessário

Indica se o Azure ML reutiliza um ambiente Python existente; Falso significa que o Azure ML criará um ambiente Python com base na especificação das dependências conda.

conda_packages: list

Necessário

Uma lista de cadeias que representam pacotes conda a serem adicionados ao ambiente Python.

pip_packages: list

Necessário

Uma lista de cadeias que representam pacotes pip a serem adicionados ao ambiente Python.

pip_requirements_file_path: str

Necessário

O caminho relativo para o ficheiro de texto dos requisitos do pip. Este parâmetro pode ser especificado em combinação com o pip_packages parâmetro .

environment_definition: EnvironmentDefinition

Necessário

EnvironmentDefinition para a experimentação. Inclui PythonSection e DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente através de outros parâmetros para a construção MpiStep pode ser definida com environment_definition parâmetro. Se este parâmetro for especificado, terá precedência sobre outros parâmetros relacionados com o ambiente, como use_gpu, custom_docker_image, conda_packages ou pip_packages e serão comunicados erros nestas combinações inválidas.

Partilhar via

MpiStep Classe

Construtor

Parâmetros

Comentários

Comentários

Recursos adicionais