PipelineOutputTabularDataset Klasse

Stellen Sie zwischengeschaltete Pipelinedaten dar, die zu einem tabellarischesn Azure Machine Learning-Dataset werden.

Sobald Zwischendaten zu einem Azure Machine Learning Dataset aufgestuft werden, werden sie in den nachfolgenden Schritten auch als Dataset statt als DataReference verwendet.

Erstellen Sie eine Zwischendaten, die zu einem Azure Machine Learning-Dataset heraufgestuft werden.

Vererbung
PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parameter

pipeline_output_dataset
PipelineOutputFileDataset
Erforderlich

Das Dateidataset, das die Zwischenausgabe darstellt, die in ein tabellarisches Dataset transformiert wird.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Erforderlich

Zusätzliche Transformationen, die auf das Dateidataset angewendet werden.

pipeline_output_dataset
PipelineOutputFileDataset
Erforderlich

Das Dateidataset, das die Zwischenausgabe darstellt, die in ein tabellarisches Dataset transformiert wird.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Erforderlich

Zusätzliche Transformationen, die auf das Dateidataset angewendet werden.

Methoden

create_input_binding

Erstellen einer Eingabebindung.

drop_columns

Löschen der angegebenen Spalten aus dem Dataset.

keep_columns

Beibehalten der angegebenen Spalten und Löschen aller anderen Spalten aus dem Dataset.

random_split

Aufteilen von Datensätzen im Dataset in zwei Teile nach dem Zufallsprinzip und ungefähr nach dem angegebenen Prozentsatz.

create_input_binding

Erstellen einer Eingabebindung.

create_input_binding()

Gibt zurück

InputPortBinding mit diesen PipelineData als Quelle.

Rückgabetyp

drop_columns

Löschen der angegebenen Spalten aus dem Dataset.

drop_columns(columns)

Parameter

columns
str oder list[str]
Erforderlich

Der Name oder eine Liste der Namen für die zu löschenden Spalten.

Gibt zurück

Gibt neue Zwischendaten zurück, wobei nur die angegebenen Spalten gelöscht wurden.

Rückgabetyp

keep_columns

Beibehalten der angegebenen Spalten und Löschen aller anderen Spalten aus dem Dataset.

keep_columns(columns)

Parameter

columns
str oder list[str]
Erforderlich

Der Name oder eine Liste der Namen für die Spalten, die beibehalten werden sollen.

Gibt zurück

Gibt neue Zwischendaten zurück, wobei nur die angegebenen Spalten beibehalten werden.

Rückgabetyp

random_split

Aufteilen von Datensätzen im Dataset in zwei Teile nach dem Zufallsprinzip und ungefähr nach dem angegebenen Prozentsatz.

random_split(percentage, seed=None)

Parameter

percentage
float
Erforderlich

Der ungefähre Prozentsatz, nach dem das Dataset aufgeteilt werden soll. Es muss eine Zahl zwischen 0,0 und 1,0 sein.

seed
int
Standardwert: None

Ein optionaler Seed für den Zufallsgenerator.

Gibt zurück

Gibt ein Tupel neuer TabularDataset-Objekte zurück, die die beiden Datasets nach der Teilung darstellen.

Rückgabetyp