Dela via


PipelineOutputTabularDataset Klass

Representera mellanliggande pipelinedata som befordrats till en Azure Machine Learning-tabelldatauppsättning.

När mellanliggande data har befordrats till en Azure Machine Learning-datauppsättning, kommer den också att användas som en datauppsättning i stället för en DataReference i efterföljande steg.

Skapa mellanliggande data som ska höjas upp till en Azure Machine Learning-datauppsättning.

Arv
PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parametrar

pipeline_output_dataset
PipelineOutputFileDataset
Obligatorisk

Fildatauppsättningen som representerar mellanliggande utdata som omvandlas till en tabellbaserad datauppsättning.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Obligatorisk

Ytterligare transformeringar som ska tillämpas ovanpå fildatauppsättningen.

pipeline_output_dataset
PipelineOutputFileDataset
Obligatorisk

Fildatauppsättningen som representerar mellanliggande utdata som omvandlas till en tabellbaserad datauppsättning.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Obligatorisk

Ytterligare transformeringar som ska tillämpas ovanpå fildatauppsättningen.

Metoder

create_input_binding

Skapa en indatabindning.

drop_columns

Ta bort de angivna kolumnerna från datauppsättningen.

keep_columns

Behåll de angivna kolumnerna och ta bort alla andra från datauppsättningen.

random_split

Dela upp poster i datauppsättningen i två delar slumpmässigt och ungefär med den procentandel som anges.

create_input_binding

Skapa en indatabindning.

create_input_binding()

Returer

InputPortBinding med denna PipelineData som källa.

Returtyp

drop_columns

Ta bort de angivna kolumnerna från datauppsättningen.

drop_columns(columns)

Parametrar

columns
str eller list[str]
Obligatorisk

Namnet eller en lista med namn som kolumnerna ska släppa.

Returer

Returnerar nya mellanliggande data med endast de angivna kolumnerna borttagna.

Returtyp

keep_columns

Behåll de angivna kolumnerna och ta bort alla andra från datauppsättningen.

keep_columns(columns)

Parametrar

columns
str eller list[str]
Obligatorisk

Namnet eller en lista med namn som kolumnerna ska behålla.

Returer

Returnerar nya mellanliggande data med endast de angivna kolumnerna behålls.

Returtyp

random_split

Dela upp poster i datauppsättningen i två delar slumpmässigt och ungefär med den procentandel som anges.

random_split(percentage, seed=None)

Parametrar

percentage
float
Obligatorisk

Den ungefärliga procentandelen som datauppsättningen ska delas med. Detta måste vara ett tal mellan 0,0 och 1,0.

seed
int
standardvärde: None

Valfritt startvärde som ska användas för slumpgeneratorn.

Returer

Returnerar en tupplar med nya TabularDataset-objekt som representerar de två datauppsättningarna efter delningen.

Returtyp