Selecionar colunas para transformação

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Cria uma transformação que seleciona o mesmo subconjunto de colunas que no conjunto de dados especificado

Categoria: transformação/manipulação de dados

Observação

aplica-se a: somente Machine Learning Studio (clássico)

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

este artigo descreve como usar o módulo selecionar colunas de transformação no Machine Learning Studio (clássico). A finalidade do módulo selecionar colunas de transformação é garantir que um conjunto de colunas consistente e previsível seja sempre usado em operações de aprendizado de máquina downstream.

Esse módulo é particularmente útil para tarefas como pontuação, que exigem colunas específicas. As alterações nas colunas disponíveis podem interromper o experimento ou alterar os resultados.

Use a transformação selecionar colunas para criar e salvar um conjunto de colunas. Em seguida, use o módulo Aplicar transformação para aplicar essas seleções a novos dados.

Como usar Selecionar colunas para transformação

Este cenário pressupõe que você pretende usar a seleção de recursos para gerar um conjunto dinâmico de colunas que serão usadas para treinar um modelo. Para garantir que as seleções de coluna sejam as mesmas para o processo de pontuação, use o módulo selecionar colunas de transformação para capturar as seleções de coluna e aplicá-las em outro lugar no experimento.

  1. Adicione um conjunto de dados de entrada ao seu experimento no estúdio (clássico).

  2. Adicione uma instância da Seleção de recursos baseada em filtro.

  3. Conexão os módulos e configurar o módulo seleção de recursos para localizar automaticamente alguns dos melhores recursos no conjunto de dados de entrada.

  4. Adicione uma instância do Modelo de treinamento e use a saída da Seleção de recursos baseada em filtro como a entrada para treinamento.

    Importante

    Como a importância do recurso é decidida com base nos valores na coluna, você não pode saber com antecedência quais colunas podem estar disponíveis para entrada para treinar o modelo.

  5. Agora, anexe uma instância do módulo selecionar colunas de transformação .

    Isso gera uma seleção de coluna como uma transformação que pode ser salva ou aplicada a outros conjuntos de os. Essa etapa garante que as colunas identificadas pela seleção de recursos sejam salvas para reutilização por outros módulos.

  6. Adicionar o módulo Modelo de Pontuação.

    Não conecte o conjunto de dados de entrada.

    Em vez disso, adicione o módulo Aplicar transformação e conecte a saída do recurso transformação de seleção.

    Importante

    Não é possível esperar a aplicação da seleção de recursos baseada em filtro ao conjunto de texto de Pontuação e obter os mesmos resultados. Como a seleção de recursos se baseia em valores, ela pode escolher um conjunto diferente de colunas, o que causaria uma falha na operação de pontuação.

  7. Execute o experimento.

Esse processo de salvar e aplicar uma seleção de coluna garante que o mesmo esquema de dados esteja disponível para treinamento e pontuação.

Exemplos

Para obter exemplos de como usar esse módulo, consulte a Galeria de ia do Azure:

Entradas esperadas

Nome Tipo Descrição
Conjunto de linhas com colunas desejadas Tabela de Dados Conjunto de linhas que contém o conjunto desejado de colunas

Saídas

Nome Tipo Descrição
Transformação seleção de colunas Interface ITransform Transformação que seleciona o mesmo subconjunto de colunas que no conjunto de dados fornecido.

Exceções

Exceção Descrição
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia.

Confira também

Manipulação
Projetar Colunas no Conjunto de Dados