Importância da funcionalidade de permutação

Artigo
05/06/2019

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
Saiba mais sobre Azure Machine Learning.

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Calcula a permutação característica pontuações de variações de características dado um modelo treinado e um conjunto de dados de teste

Categoria: Módulos de Seleção de Recursos

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo descreve como usar o módulo De Importância de Recurso de Permutação no Machine Learning Studio (clássico), para calcular um conjunto de pontuações de importância de recurso para o seu conjunto de dados. Utiliza estas pontuações para o ajudar a determinar as melhores funcionalidades para utilizar num modelo.

Neste módulo, os valores de características são baralhados aleatoriamente, uma coluna de cada vez, e o desempenho do modelo é medido antes e depois. Pode escolher uma das métricas padrão fornecidas para medir o desempenho.

As pontuações que o módulo devolve representam a alteração no desempenho de um modelo treinado, após permutação. Características importantes são geralmente mais sensíveis ao processo de baralhar, e assim resultar em pontuações de maior importância.

Este artigo fornece uma boa visão geral da importância da permutação, a sua base teórica e as suas aplicações na aprendizagem automática: A permutação tem importância

Como usar a importância da característica de permutação

Para gerar um conjunto de pontuações de funcionalidades requer que tenha um modelo já treinado, bem como um conjunto de dados de teste.

Adicione o módulo de Importância de Recurso de Permutação à sua experiência. Pode encontrar este módulo na categoria 'Seleção de Recursos '.
Ligação um modelo treinado para a entrada esquerda. O modelo deve ser um modelo de regressão ou modelo de classificação.
Na entrada direita, ligue um conjunto de dados, de preferência diferente do conjunto de dados utilizado para a formação do modelo. Este conjunto de dados é utilizado para pontuar com base no modelo treinado e para avaliar o modelo após a alteração dos valores da funcionalidade.
Para sementes aleatórias, escreva um valor a utilizar como semente para aleatoriedade. Se especificar 0 (o padrão), um número é gerado com base no relógio do sistema.

Um valor de sementes é opcional, mas você deve fornecer um valor se você quiser reprodutibilidade através de execuções da mesma experiência.
Para medir o desempenho, selecione uma única métrica para utilizar ao calcular a qualidade do modelo após a permutação.

Machine Learning Studio (clássico) suporta as seguintes métricas, dependendo se está a avaliar um modelo de classificação ou regressão:
- Classificação
  
  Precisão, Precisão, Recordação, Perda média de registo
- Regressão
  
  Precisão, Recordação, Erro Absoluto Médio, Erro Quadrado Médio Raiz, Erro Absoluto Relativo, Erro A quadrado relativo, Coeficiente de Determinação
Para uma descrição mais detalhada destas métricas de avaliação e como são calculadas, consulte Avaliar.
Execute a experimentação.
O módulo produz uma lista de colunas de funcionalidades e as pontuações associadas a elas, classificadas por ordem das pontuações, descendo.

Exemplos

Veja estas experiências de amostra na Galeria Azure AI:

Importância da característica de permutação: Demonstra como usar este módulo para classificar variáveis de um conjunto de dados por ordem de pontuações de importância de permutação.
Utilizando o módulo De Importância da Característica Permutação: Ilustra a utilização deste módulo num serviço web.

Notas técnicas

Esta secção fornece detalhes de implementação, dicas e respostas a perguntas frequentes.

Como é que isto se compara a outros métodos de seleção de recursos?

A permutação de recursos funciona alterando aleatoriamente os valores de cada coluna de recurso, uma coluna de cada vez e, em seguida, avaliando o modelo.

Os rankings fornecidos pela importância da funcionalidade de permutação são muitas vezes diferentes dos que obtém da Seleção de Recursos Baseados em Filtros, que calcula as pontuações antes de um modelo ser criado.

Isto porque a permutação tem importância não mede a associação entre um recurso e um valor-alvo, mas em vez disso capta a influência que cada recurso tem nas previsões do modelo.

Entradas esperadas

Nome	Tipo	Description
Modelo treinado	Interface ILearner	Um modelo de classificação ou regressão treinado
Dados de teste	Tabela de Dados	Conjunto de dados de teste para pontuação e avaliação de um modelo após permutação dos valores de recurso

Parâmetros do módulo

Nome	Tipo	Intervalo	Opcional	Predefinição	Description
Sementes aleatórias	Número inteiro	>=0	Necessário	0	Valor aleatório das sementes do gerador de números
Métrica para medir o desempenho	Tipo De Avaliação	selecionar a partir da lista	Necessário	Classificação - Precisão	Selecione a métrica a utilizar ao avaliar a variabilidade do modelo após permutações

Saídas

Nome	Tipo	Description
Importância do recurso	Tabela de Dados	Um conjunto de dados que contém os resultados de importância da funcionalidade, com base na métrica selecionada

Exceções

Exceção	Description
Erro 0062	A exceção ocorre quando se tenta comparar dois modelos com diferentes tipos de aprendizes.
Erro 0024	A exceção ocorre se o conjunto de dados não contiver uma coluna de etiqueta.
Erro 0105	Lançado quando um ficheiro de definição de módulo define um tipo de parâmetro não suportado
Erro 0021	A exceção ocorre se o número de linhas em alguns dos conjuntos de dados passados para o módulo for demasiado pequeno.

Ver também

Seleção de Recursos
Seleção de funcionalidades baseadas em filtro
Análise principal de componentes