PipelineOutputTabularDataset Klasse

Referenz

Stellen Sie zwischengeschaltete Pipelinedaten dar, die zu einem tabellarischesn Azure Machine Learning-Dataset werden.

Sobald Zwischendaten zu einem Azure Machine Learning Dataset aufgestuft werden, werden sie in den nachfolgenden Schritten auch als Dataset statt als DataReference verwendet.

Erstellen Sie eine Zwischendaten, die zu einem Azure Machine Learning-Dataset heraufgestuft werden.

Vererbung: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parameter

pipeline_output_dataset: PipelineOutputFileDataset

Erforderlich

Das Dateidataset, das die Zwischenausgabe darstellt, die in ein tabellarisches Dataset transformiert wird.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Erforderlich

Zusätzliche Transformationen, die auf das Dateidataset angewendet werden.

pipeline_output_dataset: PipelineOutputFileDataset

Erforderlich

Das Dateidataset, das die Zwischenausgabe darstellt, die in ein tabellarisches Dataset transformiert wird.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Erforderlich

Zusätzliche Transformationen, die auf das Dateidataset angewendet werden.

Methoden

create_input_binding	Erstellen einer Eingabebindung.
drop_columns	Löschen der angegebenen Spalten aus dem Dataset.
keep_columns	Beibehalten der angegebenen Spalten und Löschen aller anderen Spalten aus dem Dataset.
random_split	Aufteilen von Datensätzen im Dataset in zwei Teile nach dem Zufallsprinzip und ungefähr nach dem angegebenen Prozentsatz.

create_input_binding

Erstellen einer Eingabebindung.

create_input_binding()

Gibt zurück

InputPortBinding mit diesen PipelineData als Quelle.

Rückgabetyp

InputPortBinding

drop_columns

Löschen der angegebenen Spalten aus dem Dataset.

drop_columns(columns)

Parameter

columns: str oder list[str]

Erforderlich

Der Name oder eine Liste der Namen für die zu löschenden Spalten.

Gibt zurück

Gibt neue Zwischendaten zurück, wobei nur die angegebenen Spalten gelöscht wurden.

Rückgabetyp

PipelineOutputTabularDataset

keep_columns

Beibehalten der angegebenen Spalten und Löschen aller anderen Spalten aus dem Dataset.

keep_columns(columns)

Parameter

columns: str oder list[str]

Erforderlich

Der Name oder eine Liste der Namen für die Spalten, die beibehalten werden sollen.

Gibt zurück

Gibt neue Zwischendaten zurück, wobei nur die angegebenen Spalten beibehalten werden.

Rückgabetyp

PipelineOutputTabularDataset

random_split

Aufteilen von Datensätzen im Dataset in zwei Teile nach dem Zufallsprinzip und ungefähr nach dem angegebenen Prozentsatz.

random_split(percentage, seed=None)

Parameter

percentage: float

Erforderlich

Der ungefähre Prozentsatz, nach dem das Dataset aufgeteilt werden soll. Es muss eine Zahl zwischen 0,0 und 1,0 sein.

seed: int

Standardwert: None

Ein optionaler Seed für den Zufallsgenerator.

Gibt zurück

Gibt ein Tupel neuer TabularDataset-Objekte zurück, die die beiden Datasets nach der Teilung darstellen.

Rückgabetyp

(TabularDataset, TabularDataset)

PipelineOutputTabularDataset Klasse

Konstruktor

Parameter

Methoden

create_input_binding

Gibt zurück

Rückgabetyp

drop_columns

Parameter

Gibt zurück

Rückgabetyp

keep_columns

Parameter

Gibt zurück

Rückgabetyp

random_split

Parameter

Gibt zurück

Rückgabetyp

Feedback

Feedback

Zusätzliche Ressourcen