Importância do recurso de permuta

Calcula as pontuações de importância de recurso de permutação de variáveis de recurso considerando um modelo treinado e um conjunto de dados de teste

Categoria: módulos de seleção de recursos

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

Visão geral do módulo

Este artigo descreve como usar o módulo de importância do recurso de permuta no Azure Machine Learning Studio (clássico) para computar um conjunto de pontuações de importância do recurso para seu conjunto de seus conjuntos de resultados. Você usa essas pontuações para ajudá-lo a determinar os melhores recursos a serem usados em um modelo.

Nesse módulo, os valores de recurso são aleatoriamente aleatórios, uma coluna por vez e o desempenho do modelo é medido antes e depois. Você pode escolher uma das métricas padrão fornecidas para medir o desempenho.

As pontuações que o módulo retorna representam a alteração no desempenho de um modelo treinado, após a permutação. Os recursos importantes são geralmente mais sensíveis ao processo de colocar em ordem aleatória e, portanto, resultarão em maiores pontuações de importância.

Este artigo fornece uma boa visão geral da importância do recurso de permuta, sua base teórica e seus aplicativos no aprendizado de máquina: importância do recurso de permuta

Como usar a importância do recurso de permuta

Para gerar um conjunto de pontuações de recursos, é necessário que você tenha um modelo já treinado, bem como um conjunto de teste.

  1. Adicione o módulo importância do recurso de permuta ao seu experimento. Você pode encontrar esse módulo na categoria seleção de recursos .

  2. Conecte um modelo treinado à entrada à esquerda. O modelo deve ser um modelo de regressão ou modelo de classificação.

  3. Na entrada correta, conecte um conjunto de dados, preferencialmente um que seja diferente do conjunto de dados usado para treinar o modelo. Esse conjunto de recursos é usado para pontuação com base no modelo treinado e para avaliar o modelo após a alteração dos valores de recurso.

  4. Para semente aleatória, digite um valor a ser usado como semente para randomização. Se você especificar 0 (o padrão), um número será gerado com base no relógio do sistema.

    Um valor de semente é opcional, mas você deve fornecer um valor se quiser reprodução em execuções do mesmo experimento.

  5. Para métrica para medir o desempenho, selecione uma única métrica a ser usada ao computar a qualidade do modelo após a permuta.

    Azure Machine Learning Studio (clássico) dá suporte às seguintes métricas, dependendo se você está avaliando um modelo de classificação ou regressão:

    • Classificação

      Precisão, precisão, recall, perda de log média

    • Regressão

      Precisão, cancelamento, erro absoluto médio, erro de raiz quadrada média, erro absoluto relativo, erro de quadrado relativo, coeficiente de determinação

    Para obter uma descrição mais detalhada dessas métricas de avaliação e como elas são calculadas, consulte avaliar.

  6. Execute o experimento.

  7. O módulo gera uma lista de colunas de recursos e as pontuações associadas a elas, classificadas em ordem de pontuação, decrescente.

Exemplos

Consulte estes experimentos de exemplo na Galeria de ia do Azure:

Observações técnicas

Esta seção fornece detalhes de implementação, dicas e respostas para perguntas frequentes.

Como isso se compara a outros métodos de seleção de recursos?

A importância do recurso de permuta funciona alterando aleatoriamente os valores de cada coluna de recursos, uma coluna de cada vez e, em seguida, avaliando o modelo.

As classificações fornecidas pela importância do recurso de permuta são muitas vezes diferentes das que você obtém da seleção de recursos baseada em filtro, que calcula as pontuações antes de um modelo ser criado.

Isso ocorre porque a importância do recurso de permuta não mede a associação entre um recurso e um valor de destino, mas, em vez disso, captura quanto influência cada recurso tem em previsões do modelo.

Entradas esperadas

Nome Tipo Descrição
Modelo treinado Interface ILearner Um modelo de classificação ou regressão treinado
Dados de teste Tabela de Dados O conjunto de dados de teste para classificar e avaliar um modelo depois da permutação de valores de recurso

Parâmetros do módulo

Nome Tipo Intervalo Opcional Padrão Descrição
Propagação aleatória Integer >= 0 Necessária 0 Valor de propagação do gerador de número aleatório
Métrica para medir o desempenho EvaluationMetricType selecionar da lista Necessária Classificação – Precisão Selecione a métrica a ser usada ao avaliar a variabilidade do modelo após as permutas

Saídas

Nome Tipo Descrição
Importância do recurso Tabela de Dados Um conjunto de dados que contém os resultados de importância do recurso, com base na métrica selecionada

Exceções

Exceção Descrição
Erro 0062 Ocorrerá uma exceção durante a tentativa de comparar dois modelos com tipos diferentes de aprendiz.
Erro 0024 Ocorrerá uma exceção se o conjunto de dados não contiver uma coluna de rótulo.
Erro 0105 Gerado quando um arquivo de definição de módulo define um tipo de parâmetro sem suporte
Erro 0021 Ocorrerá uma exceção se o número de linhas em alguns dos conjuntos de dados passados para o módulo for muito pequeno.

Consulte também

Seleção de recursos
Seleção de recursos baseada em filtro
Análise de componente principal