PipelineOutputTabularDataset Klass

Referens

Representera mellanliggande pipelinedata som befordrats till en Azure Machine Learning-tabelldatauppsättning.

När mellanliggande data har befordrats till en Azure Machine Learning-datauppsättning, kommer den också att användas som en datauppsättning i stället för en DataReference i efterföljande steg.

Skapa mellanliggande data som ska höjas upp till en Azure Machine Learning-datauppsättning.

Arv: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parametrar

pipeline_output_dataset: PipelineOutputFileDataset

Obligatorisk

Fildatauppsättningen som representerar mellanliggande utdata som omvandlas till en tabellbaserad datauppsättning.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Obligatorisk

Ytterligare transformeringar som ska tillämpas ovanpå fildatauppsättningen.

pipeline_output_dataset: PipelineOutputFileDataset

Obligatorisk

Fildatauppsättningen som representerar mellanliggande utdata som omvandlas till en tabellbaserad datauppsättning.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Obligatorisk

Ytterligare transformeringar som ska tillämpas ovanpå fildatauppsättningen.

Metoder

create_input_binding	Skapa en indatabindning.
drop_columns	Ta bort de angivna kolumnerna från datauppsättningen.
keep_columns	Behåll de angivna kolumnerna och ta bort alla andra från datauppsättningen.
random_split	Dela upp poster i datauppsättningen i två delar slumpmässigt och ungefär med den procentandel som anges.

create_input_binding

Skapa en indatabindning.

create_input_binding()

Returer

InputPortBinding med denna PipelineData som källa.

Returtyp

InputPortBinding

drop_columns

Ta bort de angivna kolumnerna från datauppsättningen.

drop_columns(columns)

Parametrar

columns: str eller list[str]

Obligatorisk

Namnet eller en lista med namn som kolumnerna ska släppa.

Returer

Returnerar nya mellanliggande data med endast de angivna kolumnerna borttagna.

Returtyp

PipelineOutputTabularDataset

keep_columns

Behåll de angivna kolumnerna och ta bort alla andra från datauppsättningen.

keep_columns(columns)

Parametrar

columns: str eller list[str]

Obligatorisk

Namnet eller en lista med namn som kolumnerna ska behålla.

Returer

Returnerar nya mellanliggande data med endast de angivna kolumnerna behålls.

Returtyp

PipelineOutputTabularDataset

random_split

Dela upp poster i datauppsättningen i två delar slumpmässigt och ungefär med den procentandel som anges.

random_split(percentage, seed=None)

Parametrar

percentage: float

Obligatorisk

Den ungefärliga procentandelen som datauppsättningen ska delas med. Detta måste vara ett tal mellan 0,0 och 1,0.

seed: int

standardvärde: None

Valfritt startvärde som ska användas för slumpgeneratorn.

Returer

Returnerar en tupplar med nya TabularDataset-objekt som representerar de två datauppsättningarna efter delningen.

Returtyp

(TabularDataset, TabularDataset)

Dela via

PipelineOutputTabularDataset Klass

Konstruktor

Parametrar

Metoder

create_input_binding

Returer

Returtyp

drop_columns

Parametrar

Returer

Returtyp

keep_columns

Parametrar

Returer

Returtyp

random_split

Parametrar

Returer

Returtyp

Feedback

Feedback

Ytterligare resurser