PipelineOutputTabularDataset Classe
Representar os dados intermediários do pipeline promovidos a um conjunto de dados tabular do Azure Machine Learning.
Depois que um dado intermediário for promovido para um conjunto de dados do Azure Machine Learning, eles também serão consumidos como um conjunto de dados em vez de uma DataReference nas etapas subsequentes.
Crie dados intermediários que serão promovidos a um Conjunto de Dados do Azure Machine Learning.
- Herança
-
PipelineOutputTabularDataset
Construtor
PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)
Parâmetros
- pipeline_output_dataset
- PipelineOutputFileDataset
O conjunto de dados de arquivo que representa a saída intermediária que será transformada em um conjunto de dados tabular.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Transformações adicionais que serão aplicadas sobre o conjuntos de dados do arquivo.
- pipeline_output_dataset
- PipelineOutputFileDataset
O conjunto de dados de arquivo que representa a saída intermediária que será transformada em um conjunto de dados tabular.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Transformações adicionais que serão aplicadas sobre o conjuntos de dados do arquivo.
Métodos
create_input_binding |
Criar uma associação de entrada. |
drop_columns |
Remove as colunas especificadas do conjunto de dados. |
keep_columns |
Mantém as colunas especificadas e remove todas as outras do conjunto de dados. |
random_split |
Divide os registros no conjunto de dados em duas partes aleatoriamente e aproximadamente pelo percentual especificado. |
create_input_binding
Criar uma associação de entrada.
create_input_binding()
Retornos
O InputPortBinding com esse PipelineData como origem.
Tipo de retorno
drop_columns
Remove as colunas especificadas do conjunto de dados.
drop_columns(columns)
Parâmetros
O nome ou uma lista de nomes para as colunas a serem removidas.
Retornos
Retorna novos dados intermediários com apenas as colunas especificadas removidas.
Tipo de retorno
keep_columns
Mantém as colunas especificadas e remove todas as outras do conjunto de dados.
keep_columns(columns)
Parâmetros
Retornos
Retorna novos dados intermediários com apenas as colunas especificadas mantidas.
Tipo de retorno
random_split
Divide os registros no conjunto de dados em duas partes aleatoriamente e aproximadamente pelo percentual especificado.
random_split(percentage, seed=None)
Parâmetros
- percentage
- float
A porcentagem aproximada para dividir o conjunto de dados. Precisa ser um número entre 0.0 e 1.0.
Retornos
Retorna uma tupla de novos objetos TabularDataset que representam os dois conjuntos de dados após a divisão.
Tipo de retorno
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de