Selecionar colunas para transformação

Cria uma transformação que seleciona o mesmo subconjunto de colunas que no conjunto de dados especificado

Categoria: transformação/manipulação de dados

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

Este artigo descreve como usar o módulo selecionar colunas de transformação no Azure Machine Learning Studio (clássico). A finalidade do módulo selecionar colunas de transformação é garantir que um conjunto de colunas consistente e previsível seja sempre usado em operações de aprendizado de máquina downstream.

Esse módulo é particularmente útil para tarefas como pontuação, que exigem colunas específicas. As alterações nas colunas disponíveis podem interromper o experimento ou alterar os resultados.

Use a transformação selecionar colunas para criar e salvar um conjunto de colunas. Em seguida, use o módulo aplicar transformação para aplicar essas seleções a novos dados.

Como usar a transformação selecionar colunas

Este cenário pressupõe que você pretende usar a seleção de recursos para gerar um conjunto dinâmico de colunas que serão usadas para treinar um modelo. Para garantir que as seleções de coluna sejam as mesmas para o processo de pontuação, use o módulo selecionar colunas de transformação para capturar as seleções de coluna e aplicá-las em outro lugar no experimento.

  1. Adicione um conjunto de dados de entrada ao seu experimento no estúdio (clássico).

  2. Adicione uma instância da seleção de recursos baseada em filtro.

  3. Conecte os módulos e configure o módulo seleção de recursos para localizar automaticamente alguns dos melhores recursos no conjunto de dados de entrada.

  4. Adicione uma instância do modelo de treinamento e use a saída da seleção de recursos baseada em filtro como a entrada para treinamento.

    Importante

    Como a importância do recurso é decidida com base nos valores na coluna, você não pode saber com antecedência quais colunas podem estar disponíveis para entrada para treinar o modelo.

  5. Agora, anexe uma instância do módulo selecionar colunas de transformação .

    Isso gera uma seleção de coluna como uma transformação que pode ser salva ou aplicada a outros conjuntos de os. Essa etapa garante que as colunas identificadas pela seleção de recursos sejam salvas para reutilização por outros módulos.

  6. Adicione o módulo modelo de Pontuação .

    Não conecte o conjunto de dados de entrada.

    Em vez disso, adicione o módulo aplicar transformação e conecte a saída da transformação seleção de recursos.

    Importante

    Não é possível esperar a aplicação da seleção de recursos baseada em filtro ao conjunto de texto de Pontuação e obter os mesmos resultados. Como a seleção de recursos se baseia em valores, ela pode escolher um conjunto diferente de colunas, o que causaria uma falha na operação de pontuação.

  7. Execute o experimento.

Esse processo de salvar e aplicar uma seleção de coluna garante que o mesmo esquema de dados esteja disponível para treinamento e pontuação.

Exemplos

Para obter exemplos de como usar esse módulo, consulte a Galeria de ia do Azure:

Entradas esperadas

Nome Tipo Descrição
Conjunto de linhas com colunas desejadas Tabela de Dados Conjunto de linhas que contém o conjunto desejado de colunas

Saídas

Nome Tipo Descrição
Transformação seleção de colunas Interface ITransform Transformação que seleciona o mesmo subconjunto de colunas que no conjunto de dados fornecido.

Exceções

Exceção Descrição
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia.

Consulte também

Manusei
Projetar Colunas no Conjunto de Dados