OutputPortBinding Classe

Référence

Définit une sortie nommée d’une étape de pipeline.

OutputPortBinding peut être utilisé pour spécifier le type de données qui sera produit par une étape et la façon dont les données seront produites. Il peut être utilisé avec InputPortBinding pour spécifier que la sortie de l’étape est une entrée obligatoire d’une autre étape.

Initialisez OutputPortBinding.

Héritage: builtins.object

OutputPortBinding

Constructeur

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Paramètres

name: str

Obligatoire

Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement.

datastore: Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]

valeur par défaut: None

Magasin de données dans lequel réside PipelineData.

output_name: str

valeur par défaut: None

Nom de la sortie, si aucun nom (None) n’est utilisé. Ne peut contenir que des lettres, des chiffres et des traits de soulignement.

bind_mode: str

valeur par défaut: mount

Spécifie si l’étape de production utilisera la méthode « upload », « mount » ou « hdfs » pour accéder aux données.

path_on_compute: str

valeur par défaut: None

Pour le mode « upload », chemin où le module écrit la sortie.

is_directory: bool

valeur par défaut: None

Indique si la sortie est un répertoire ou un fichier unique.

overwrite: bool

valeur par défaut: None

Pour le mode « upload », indique s’il est nécessaire de remplacer les données existantes.

data_type: str

valeur par défaut: None

facultatif. Vous pouvez utiliser le type de données pour spécifier le type attendu de la sortie et pour détailler la façon dont les étapes de consommation doivent utiliser les données. Il peut s’agir de n’importe quelle chaîne définie par l’utilisateur.

pipeline_output_name: str

valeur par défaut: None

Si cette valeur est fournie, cette sortie sera disponible à l’aide de PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline.

training_output: TrainingOutput

valeur par défaut: None

Définit la sortie du résultat de la formation. Uniquement nécessaire pour les formations spécifiques qui aboutissent à différents types de sorties, comme des métriques et un modèle. Par exemple, AutoMLStep aboutit à des métriques et un modèle. Vous pouvez également définir une itération ou une métrique de formation spécifique pour obtenir le meilleur modèle possible. Pour HyperDriveStep, vous pouvez également définir les fichiers de modèle spécifiques à inclure dans la sortie.

dataset_registration: DatasetRegistration

valeur par défaut: None

facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt PipelineData.as_dataset.

dataset_output: OutputDatasetConfig

valeur par défaut: None

facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt OutputFileDatasetConfig.

name: str

Obligatoire

Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement.

datastore: Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]

Obligatoire

Magasin de données dans lequel réside PipelineData.

output_name: str

Obligatoire

Nom de la sortie, si aucun nom (None) n’est utilisé. Peut contenir uniquement des lettres, des chiffres et des traits de soulignement.

bind_mode: str

Obligatoire

Spécifie si l’étape de production utilisera la méthode « upload », « mount » ou « hdfs » pour accéder aux données.

path_on_compute: str

Obligatoire

Pour le mode « upload », chemin où le module écrit la sortie.

is_directory: bool

Obligatoire

si la sortie est un répertoire

overwrite: bool

Obligatoire

Pour le mode « upload », indique s’il est nécessaire de remplacer les données existantes.

data_type: str

Obligatoire

pipeline_output_name: str

Obligatoire

Si cette valeur est fournie, cette sortie sera disponible à l’aide de PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline.

training_output: TrainingOutput

Obligatoire

dataset_registration: DatasetRegistration

Obligatoire

facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt PipelineData.as_dataset.

dataset_output: OutputDatasetConfig

Obligatoire

facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt OutputFileDatasetConfig.

Remarques

OutputPortBinding peut être utilisé de la même façon que PipelineData lors de la création d’un pipeline pour spécifier des entrées et sorties d’étape. La différence est que OutputPortBinding doit être utilisé avec InputPortBinding pour être consommé comme entrée d’une autre étape.

Voici un exemple de construction d’un pipeline avec OutputPortBinding :


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Cela permet de créer un pipeline en deux étapes. L’étape de traitement est exécutée en premier. Une fois qu’elle a été effectuée, l’étape de formation est exécutée. Azure ML fournit la sortie produite par l’étape de traitement, comme décrit par l’objet OutputPortBinding, à l’étape de formation.

TrainingOutput

OutputPortBinding Classe

Constructeur

Paramètres

Remarques

Attributs

bind_mode

Retours

Type de retour

data_type

Retours

Type de retour

dataset_registration

Retours

Type de retour

datastore

Retours

Type de retour

is_directory

Retours

Type de retour

name

Retours

Type de retour

overwrite

Retours

Type de retour

path_on_compute

Retours

Type de retour

pipeline_output_name

Retours

Type de retour

training_output

Retours

Type de retour

Commentaires

Commentaires

Ressources supplémentaires