PipelineOutputTabularDataset Classe

Représente les données de pipeline intermédiaires promues en jeu de données tabulaires Azure Machine Learning.

Une fois que les données intermédiaires ont été promues en jeu de données Azure Machine Learning, elles sont également consommées en tant que jeu de données plutôt qu’en tant que référence de données dans les étapes suivantes.

Créez des données intermédiaires qui seront promues en jeu de données Azure Machine Learning.

Héritage
PipelineOutputTabularDataset

Constructeur

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Paramètres

pipeline_output_dataset
PipelineOutputFileDataset
Obligatoire

Jeu de données de fichier qui représente la sortie intermédiaire à transformer en jeu de données tabulaires.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Obligatoire

Transformations supplémentaires appliquées sur le jeu de données de fichier.

pipeline_output_dataset
PipelineOutputFileDataset
Obligatoire

Jeu de données de fichier qui représente la sortie intermédiaire à transformer en jeu de données tabulaires.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Obligatoire

Transformations supplémentaires appliquées sur le jeu de données de fichier.

Méthodes

create_input_binding

Permet de créer une liaison d’entrée.

drop_columns

Supprimez les colonnes spécifiées du jeu de données.

keep_columns

Conservez les colonnes spécifiées et supprimez toutes les autres du jeu de données.

random_split

Fractionne les enregistrements dans le jeu de données en deux parties de façon aléatoire et approximative selon le pourcentage spécifié.

create_input_binding

Permet de créer une liaison d’entrée.

create_input_binding()

Retours

InputPortBinding avec ce PipelineData en tant que source.

Type de retour

drop_columns

Supprimez les colonnes spécifiées du jeu de données.

drop_columns(columns)

Paramètres

columns
str ou list[str]
Obligatoire

Nom ou liste des noms des colonnes à supprimer.

Retours

Retourne de nouvelles données intermédiaires avec uniquement les colonnes spécifiées supprimées.

Type de retour

keep_columns

Conservez les colonnes spécifiées et supprimez toutes les autres du jeu de données.

keep_columns(columns)

Paramètres

columns
str ou list[str]
Obligatoire

Nom ou liste des noms des colonnes à conserver.

Retours

Retourne de nouvelles données intermédiaires avec uniquement les colonnes spécifiées conservées.

Type de retour

random_split

Fractionne les enregistrements dans le jeu de données en deux parties de façon aléatoire et approximative selon le pourcentage spécifié.

random_split(percentage, seed=None)

Paramètres

percentage
float
Obligatoire

Pourcentage approximatif par lequel fractionner le jeu de données. Il doit s’agir d’un nombre compris entre 0,0 et 1,0.

seed
int
valeur par défaut: None

Valeur initiale facultative à utiliser pour le générateur aléatoire.

Retours

Retourne un tuple de nouveaux objets TabularDataset représentant les deux jeux de données après le fractionnement.

Type de retour