Importância do recurso de permuta

Este artigo descreve como usar o componente Importância do Recurso de Permuta no designer do Azure Machine Learning para computar um conjunto de pontuações de importância do recurso para seu conjunto de dados. Use essas pontuações para ajudar a determinar os melhores recursos a serem usados em um modelo.

Neste componente, os valores de recurso são embaralhados aleatoriamente, uma coluna de cada vez. O desempenho do modelo é medido antes e depois. Você pode escolher uma das métricas padrão para medir o desempenho.

As pontuações que o componente retorna representam a alteração no desempenho de um modelo treinado depois da permutação. Recursos importantes geralmente são mais sensíveis ao processo de embaralhamento, de modo que resultam em pontuações de importância mais elevadas.

Este artigo fornece uma visão geral do recurso de permuta, sua base teórica e suas aplicações no machine learning: Importância do Recurso de Permuta.

Como usar a Importância do Recurso de Permuta

A geração de um conjunto de pontuações de recursos requer que você tenha um modelo já treinado, bem como um conjunto de dados de teste.

  1. Adicione o componente Importância do Recurso de Permuta ao seu pipeline. Esse componente pode ser encontrado na categoria Seleção de Recurso.

  2. Conecte um modelo treinado à entrada à esquerda. Ele deve ser um modelo de regressão ou de classificação.

  3. Na entrada à direita, conecte um conjunto de dados. Preferencialmente, escolha um diferente do conjunto de dados usado para treinar o modelo. Esse conjunto de dados é usado para pontuação com base no modelo treinado. Ele também é usado para avaliar o modelo após a alteração dos valores dos recursos.

  4. Para Semente aleatória, insira um valor a ser usado como semente para randomização. Se você especificar 0 (o padrão), um número será gerado com base no relógio do sistema.

    Um valor de semente é opcional, mas você deverá fornecer um se quiser ter capacidade de reprodução em execuções do mesmo pipeline.

  5. Para Métrica para medir o desempenho, selecione uma métrica a ser usada quando você estiver computando a qualidade do modelo após a permuta.

    O designer do Azure Machine Learning dá suporte às seguintes métricas, dependendo de você estar avaliando um modelo de classificação ou regressão:

    • Classificação

      Exatidão, Precisão, Recall

    • Regressão

      Precisão, Recall, Erro Médio Absoluto, Raiz do Erro Quadrático Médio, Erro Relativo Absoluto, Erro Quadrático Relativo e Coeficiente de Determinação

    Para obter uma descrição mais detalhada dessas métricas de avaliação e como são calculadas, confira Avaliar modelo.

  6. Envie o pipeline.

  7. O componente gera uma lista de colunas de recursos e as pontuações associadas a elas. A lista é classificada em ordem decrescente de pontuações.

Observações técnicas

A Importância do Recurso de Permuta funciona alterando aleatoriamente os valores de cada coluna de recurso, uma coluna por vez. Em seguida, ela avalia o modelo.

As classificações que o componente fornece são, muitas vezes, diferentes daquelas que você obtém da Seleção de Recursos Baseada em Filtro. A Seleção de Recursos Baseada em Filtro calcula pontuações antes de um modelo ser criado.

O motivo da diferença é que a Importância do Recurso de Permuta não mede a associação entre um recurso e um valor de destino. Em vez disso, ela captura quanta influência cada recurso tem em previsões do modelo.

Próximas etapas

Confira o conjunto de componentes disponíveis no Azure Machine Learning.