PipelineOutputTabularDataset Klasse
Stellen Sie zwischengeschaltete Pipelinedaten dar, die zu einem tabellarischesn Azure Machine Learning-Dataset werden.
Sobald Zwischendaten zu einem Azure Machine Learning Dataset aufgestuft werden, werden sie in den nachfolgenden Schritten auch als Dataset statt als DataReference verwendet.
Erstellen Sie eine Zwischendaten, die zu einem Azure Machine Learning-Dataset heraufgestuft werden.
- Vererbung
-
PipelineOutputTabularDataset
Konstruktor
PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)
Parameter
- pipeline_output_dataset
- PipelineOutputFileDataset
Das Dateidataset, das die Zwischenausgabe darstellt, die in ein tabellarisches Dataset transformiert wird.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Zusätzliche Transformationen, die auf das Dateidataset angewendet werden.
- pipeline_output_dataset
- PipelineOutputFileDataset
Das Dateidataset, das die Zwischenausgabe darstellt, die in ein tabellarisches Dataset transformiert wird.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Zusätzliche Transformationen, die auf das Dateidataset angewendet werden.
Methoden
create_input_binding |
Erstellen einer Eingabebindung. |
drop_columns |
Löschen der angegebenen Spalten aus dem Dataset. |
keep_columns |
Beibehalten der angegebenen Spalten und Löschen aller anderen Spalten aus dem Dataset. |
random_split |
Aufteilen von Datensätzen im Dataset in zwei Teile nach dem Zufallsprinzip und ungefähr nach dem angegebenen Prozentsatz. |
create_input_binding
Erstellen einer Eingabebindung.
create_input_binding()
Gibt zurück
InputPortBinding mit diesen PipelineData als Quelle.
Rückgabetyp
drop_columns
Löschen der angegebenen Spalten aus dem Dataset.
drop_columns(columns)
Parameter
Der Name oder eine Liste der Namen für die zu löschenden Spalten.
Gibt zurück
Gibt neue Zwischendaten zurück, wobei nur die angegebenen Spalten gelöscht wurden.
Rückgabetyp
keep_columns
Beibehalten der angegebenen Spalten und Löschen aller anderen Spalten aus dem Dataset.
keep_columns(columns)
Parameter
Der Name oder eine Liste der Namen für die Spalten, die beibehalten werden sollen.
Gibt zurück
Gibt neue Zwischendaten zurück, wobei nur die angegebenen Spalten beibehalten werden.
Rückgabetyp
random_split
Aufteilen von Datensätzen im Dataset in zwei Teile nach dem Zufallsprinzip und ungefähr nach dem angegebenen Prozentsatz.
random_split(percentage, seed=None)
Parameter
- percentage
- float
Der ungefähre Prozentsatz, nach dem das Dataset aufgeteilt werden soll. Es muss eine Zahl zwischen 0,0 und 1,0 sein.
Gibt zurück
Gibt ein Tupel neuer TabularDataset-Objekte zurück, die die beiden Datasets nach der Teilung darstellen.
Rückgabetyp
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für