Importancia de la característica de permutación

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Calcula las puntuaciones de importancia de la característica de permutación de variables de características dado un modelo entrenado y un conjunto de datos de prueba

Categoría: Módulos de selección de características

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Importancia de características de permutación en Machine Learning Studio (clásico) para calcular un conjunto de puntuaciones de importancia de características para el conjunto de datos. Estas puntuaciones se usan para ayudarle a determinar las mejores características que se deben usar en un modelo.

En este módulo, los valores de las características se ordenan aleatoriamente, una columna a la vez y el rendimiento del modelo se mide antes y después. Puede elegir una de las métricas estándar que se proporcionan para medir el rendimiento.

Las puntuaciones que devuelve el módulo representan el cambio en el rendimiento de un modelo formado, después de la permutación. Las características importantes suelen ser más sensibles al proceso orden aleatorio y, por tanto, se obtendrán mayores puntuaciones de importancia.

En este artículo se proporciona una buena introducción general de la importancia de las características de permutación, su base teórica y sus aplicaciones en el aprendizaje automático: importancia de las características de permutación

Cómo usar la Importancia de la característica de permutación

Para generar un conjunto de puntuaciones de características, es necesario tener un modelo ya formado, así como un conjunto de datos de prueba.

  1. Agregue el módulo Permutation Feature Importance (Importancia de la característica de permutación) al experimento. Puede encontrar este módulo en la categoría Selección de características.

  2. Conecte un modelo formado a la entrada izquierda. El modelo debe ser un modelo de clasificación o modelo de regresión.

  3. En la entrada derecha, conecte un conjunto de datos, preferiblemente uno que sea diferente del conjunto de datos usado para formar al modelo. Este conjunto de datos se usa para puntuar según el modelo formado y para evaluar el modelo después de haber cambiado los valores de las características.

  4. Para Inicialización aleatoria, escriba un valor que se usará como valor de inicialización para la selección aleatoria. Si especifica 0 (el valor predeterminado), se genera un número basado en el reloj del sistema.

    Un valor de valor de ed es opcional, pero debe proporcionar un valor si desea reproducibilidad entre ejecuciones del mismo experimento.

  5. Para Métrica para medir el rendimiento, seleccione una sola métrica para usar al calcular la calidad del modelo después de la permutación.

    Machine Learning Studio (clásico) admite las siguientes métricas, en función de si está evaluando un modelo de clasificación o regresión:

    • Clasificación

      Exactitud, precisión, recuperación, pérdida de registro promedio

    • Regresión

      Precision, Recall, Mean Absolute Error , Root Mean Squared Error, Relative Absolute Error, Relative Squared Error, Coefficient of Determination

    Para obtener una descripción más detallada de estas métricas de evaluación y cómo se calculan, vea Evaluar.

  6. Ejecute el experimento.

  7. El módulo genera una lista de columnas de características y las puntuaciones asociadas con ellas, clasificadas en orden de puntuación, descendiendo.

Ejemplos

Consulte estos experimentos de ejemplo en el Azure AI Gallery:

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

¿Cómo se compara con otros métodos de selección de características?

La importancia de la característica de permutación funciona al cambiar aleatoriamente los valores de cada columna de característica, una columna a la vez y, después, evaluar el modelo.

Las clasificaciones proporcionadas por la importancia de la característica de permutación suelen ser diferentes de las que obtiene de Selección de características basada en filtro, que calcula las puntuaciones antes de que se cree un modelo.

Esto se debe a que la importancia de la característica de permutación no mide la asociación entre una característica y un valor de destino, sino que captura la influencia de cada característica en las predicciones del modelo.

Entradas esperadas

Nombre Tipo Descripción
Modelo entrenado Interfaz ILearner Un modelo de clasificación o de regresión entrenado
Datos de prueba Tabla de datos Conjunto de datos de prueba para puntuar y evaluar un modelo tras la permutación de valores de características

Parámetros del módulo

Nombre Tipo Intervalo Opcional Valor predeterminado Descripción
Inicialización aleatoria Entero >=0 Obligatorio 0 Valor de inicialización del generador de números aleatorios
Métrica para medir el rendimiento EvaluationMetricType seleccionar de la lista Obligatorio Clasificación: precisión Selección de la métrica que se va a usar al evaluar la variabilidad del modelo después de permutaciones

Salidas

Nombre Tipo Descripción
Importancia de característica Tabla de datos Un conjunto de datos que contiene los resultados de importancia de las características según la métrica seleccionada.

Excepciones

Excepción Descripción
Error 0062 Se produce una excepción cuando se intenta comparar dos modelos con tipos diferentes de aprendiz.
Error 0024 Se produce una excepción si el conjunto de datos no contiene una columna de etiqueta.
Error 0105 Se produce cuando un archivo de definición de módulo define un tipo de parámetro no admitido
Error 0021 Se produce una excepción si el número de filas en algunos de los conjuntos de datos que se pasan al módulo es demasiado pequeño.

Consulte también

Selección de características
Selección de características basada en filtros
Análisis de componentes principales