Importância da funcionalidade de permutação

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Calcula a permutação característica pontuações de variações de características dado um modelo treinado e um conjunto de dados de teste

Categoria: Módulos de Seleção de Recursos

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo descreve como usar o módulo De Importância de Recurso de Permutação no Machine Learning Studio (clássico), para calcular um conjunto de pontuações de importância de recurso para o seu conjunto de dados. Utiliza estas pontuações para o ajudar a determinar as melhores funcionalidades para utilizar num modelo.

Neste módulo, os valores de características são baralhados aleatoriamente, uma coluna de cada vez, e o desempenho do modelo é medido antes e depois. Pode escolher uma das métricas padrão fornecidas para medir o desempenho.

As pontuações que o módulo devolve representam a alteração no desempenho de um modelo treinado, após permutação. Características importantes são geralmente mais sensíveis ao processo de baralhar, e assim resultar em pontuações de maior importância.

Este artigo fornece uma boa visão geral da importância da permutação, a sua base teórica e as suas aplicações na aprendizagem automática: A permutação tem importância

Como usar a importância da característica de permutação

Para gerar um conjunto de pontuações de funcionalidades requer que tenha um modelo já treinado, bem como um conjunto de dados de teste.

  1. Adicione o módulo de Importância de Recurso de Permutação à sua experiência. Pode encontrar este módulo na categoria 'Seleção de Recursos '.

  2. Ligação um modelo treinado para a entrada esquerda. O modelo deve ser um modelo de regressão ou modelo de classificação.

  3. Na entrada direita, ligue um conjunto de dados, de preferência diferente do conjunto de dados utilizado para a formação do modelo. Este conjunto de dados é utilizado para pontuar com base no modelo treinado e para avaliar o modelo após a alteração dos valores da funcionalidade.

  4. Para sementes aleatórias, escreva um valor a utilizar como semente para aleatoriedade. Se especificar 0 (o padrão), um número é gerado com base no relógio do sistema.

    Um valor de sementes é opcional, mas você deve fornecer um valor se você quiser reprodutibilidade através de execuções da mesma experiência.

  5. Para medir o desempenho, selecione uma única métrica para utilizar ao calcular a qualidade do modelo após a permutação.

    Machine Learning Studio (clássico) suporta as seguintes métricas, dependendo se está a avaliar um modelo de classificação ou regressão:

    • Classificação

      Precisão, Precisão, Recordação, Perda média de registo

    • Regressão

      Precisão, Recordação, Erro Absoluto Médio, Erro Quadrado Médio Raiz, Erro Absoluto Relativo, Erro A quadrado relativo, Coeficiente de Determinação

    Para uma descrição mais detalhada destas métricas de avaliação e como são calculadas, consulte Avaliar.

  6. Execute a experimentação.

  7. O módulo produz uma lista de colunas de funcionalidades e as pontuações associadas a elas, classificadas por ordem das pontuações, descendo.

Exemplos

Veja estas experiências de amostra na Galeria Azure AI:

Notas técnicas

Esta secção fornece detalhes de implementação, dicas e respostas a perguntas frequentes.

Como é que isto se compara a outros métodos de seleção de recursos?

A permutação de recursos funciona alterando aleatoriamente os valores de cada coluna de recurso, uma coluna de cada vez e, em seguida, avaliando o modelo.

Os rankings fornecidos pela importância da funcionalidade de permutação são muitas vezes diferentes dos que obtém da Seleção de Recursos Baseados em Filtros, que calcula as pontuações antes de um modelo ser criado.

Isto porque a permutação tem importância não mede a associação entre um recurso e um valor-alvo, mas em vez disso capta a influência que cada recurso tem nas previsões do modelo.

Entradas esperadas

Nome Tipo Description
Modelo treinado Interface ILearner Um modelo de classificação ou regressão treinado
Dados de teste Tabela de Dados Conjunto de dados de teste para pontuação e avaliação de um modelo após permutação dos valores de recurso

Parâmetros do módulo

Nome Tipo Intervalo Opcional Predefinição Description
Sementes aleatórias Número inteiro >=0 Necessário 0 Valor aleatório das sementes do gerador de números
Métrica para medir o desempenho Tipo De Avaliação selecionar a partir da lista Necessário Classificação - Precisão Selecione a métrica a utilizar ao avaliar a variabilidade do modelo após permutações

Saídas

Nome Tipo Description
Importância do recurso Tabela de Dados Um conjunto de dados que contém os resultados de importância da funcionalidade, com base na métrica selecionada

Exceções

Exceção Description
Erro 0062 A exceção ocorre quando se tenta comparar dois modelos com diferentes tipos de aprendizes.
Erro 0024 A exceção ocorre se o conjunto de dados não contiver uma coluna de etiqueta.
Erro 0105 Lançado quando um ficheiro de definição de módulo define um tipo de parâmetro não suportado
Erro 0021 A exceção ocorre se o número de linhas em alguns dos conjuntos de dados passados para o módulo for demasiado pequeno.

Ver também

Seleção de Recursos
Seleção de funcionalidades baseadas em filtro
Análise principal de componentes