PipelineOutputTabularDataset Classe

Référence

Représente les données de pipeline intermédiaires promues en jeu de données tabulaires Azure Machine Learning.

Une fois que les données intermédiaires ont été promues en jeu de données Azure Machine Learning, elles sont également consommées en tant que jeu de données plutôt qu’en tant que référence de données dans les étapes suivantes.

Créez des données intermédiaires qui seront promues en jeu de données Azure Machine Learning.

Héritage: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

Constructeur

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Paramètres

pipeline_output_dataset: PipelineOutputFileDataset

Obligatoire

Jeu de données de fichier qui représente la sortie intermédiaire à transformer en jeu de données tabulaires.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Obligatoire

Transformations supplémentaires appliquées sur le jeu de données de fichier.

pipeline_output_dataset: PipelineOutputFileDataset

Obligatoire

Jeu de données de fichier qui représente la sortie intermédiaire à transformer en jeu de données tabulaires.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Obligatoire

Transformations supplémentaires appliquées sur le jeu de données de fichier.

Méthodes

create_input_binding	Permet de créer une liaison d’entrée.
drop_columns	Supprimez les colonnes spécifiées du jeu de données.
keep_columns	Conservez les colonnes spécifiées et supprimez toutes les autres du jeu de données.
random_split	Fractionne les enregistrements dans le jeu de données en deux parties de façon aléatoire et approximative selon le pourcentage spécifié.

create_input_binding

Permet de créer une liaison d’entrée.

create_input_binding()

Retours

InputPortBinding avec ce PipelineData en tant que source.

Type de retour

InputPortBinding

drop_columns

Supprimez les colonnes spécifiées du jeu de données.

drop_columns(columns)

Paramètres

columns: str ou list[str]

Obligatoire

Nom ou liste des noms des colonnes à supprimer.

Retours

Retourne de nouvelles données intermédiaires avec uniquement les colonnes spécifiées supprimées.

Type de retour

PipelineOutputTabularDataset

keep_columns

Conservez les colonnes spécifiées et supprimez toutes les autres du jeu de données.

keep_columns(columns)

Paramètres

columns: str ou list[str]

Obligatoire

Nom ou liste des noms des colonnes à conserver.

Retours

Retourne de nouvelles données intermédiaires avec uniquement les colonnes spécifiées conservées.

Type de retour

PipelineOutputTabularDataset

random_split

Fractionne les enregistrements dans le jeu de données en deux parties de façon aléatoire et approximative selon le pourcentage spécifié.

random_split(percentage, seed=None)

Paramètres

percentage: float

Obligatoire

Pourcentage approximatif par lequel fractionner le jeu de données. Il doit s’agir d’un nombre compris entre 0,0 et 1,0.

seed: int

valeur par défaut: None

Valeur initiale facultative à utiliser pour le générateur aléatoire.

Retours

Retourne un tuple de nouveaux objets TabularDataset représentant les deux jeux de données après le fractionnement.

Type de retour

(TabularDataset, TabularDataset)

PipelineOutputTabularDataset Classe

Constructeur

Paramètres

Méthodes

create_input_binding

Retours

Type de retour

drop_columns

Paramètres

Retours

Type de retour

keep_columns

Paramètres

Retours

Type de retour

random_split

Paramètres

Retours

Type de retour

Commentaires

Commentaires

Ressources supplémentaires