Regresión ordinal

Artículo
05/06/2019

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
Más información sobre Azure Machine Learning.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Crea un modelo de regresión ordinal

Categoría: Machine Learning/ Inicializar modelo/Regresión

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Regresión ordinal en Machine Learning Studio (clásico) para crear un modelo de regresión que se pueda usar para predecir valores clasificados.

Algunos ejemplos de valores clasificados:

Respuestas de encuesta que capturan las marcas preferidas del usuario en una escala de 1 a 5
El orden de los remates en una carrera
Direcciones URL en los resultados de búsqueda clasificados

Más información sobre la regresión ordinal

La regresión ordinal se usa cuando la etiqueta o columna de destino contiene números, pero los números representan una clasificación o un orden en lugar de una medida numérica.

La predicción de números ordinales requiere un algoritmo diferente al de predecir los valores de los números en una escala continua, ya que los números asignados para representar el orden de clasificación no tienen escala intrínseca.

Por ejemplo, para predecir las puntuaciones de las pruebas de los alumnos, usaría un modelo de regresión estándar, ya que las puntuaciones de las pruebas de los alumnos varían en una escala continua y se pueden medir. Sin embargo, para predecir su clasificación de clases, debe usar un modelo de regresión ordinal.

Para obtener más información sobre la investigación detrás de este algoritmo, consulte este documento (PDF descargable): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf

Configuración de la regresión ordinal

Este módulo resuelve un problema de clasificación como una serie de problemas de clasificación relacionados. Por lo tanto, el algoritmo crea una serie de ejemplos de entrenamiento extendidos mediante un modelo binario para cada rango y se entrena con ese conjunto extendido. Esta operación puede ser costosa computacionalmente.

Agregue el módulo Modelo de regresión ordinal al experimento en Studio (clásico). Puede encontrar este módulo en Machine Learning - Inicializar, en la categoría Regresión.
Agregue un módulo que admita la clasificación binaria y configure el modelo. Hay varios módulos de dos clases en la categoría de clasificación.
Conectar el modelo de clasificación binaria como una entrada al módulo Modelo de regresión ordinal.
No se requieren parámetros adicionales en el modelo de regresión ordinal; el algoritmo se ha preconfigurado con los parámetros más eficaces para resolver un problema de clasificación.
Conectar un conjunto de datos de entrenamiento y el módulo Entrenar modelo.
En el módulo Entrenar modelo , seleccione la columna que contiene los valores de rango.

Los valores de rango deben ser valores numéricos, pero no deben ser enteros ni números positivos, siempre que representen una secuencia.

Para fines de procesamiento, se supone que las rangos tienen el orden 1 a K, donde 1 es la clasificación más baja y K es la clasificación más alta. Sin embargo, el módulo Entrenar modelo puede funcionar incluso si se invierte la semántica de la escala.

Por ejemplo, si en la encuesta original, 1 era la puntuación más alta y 5 es la más baja, no afecta al procesamiento del modelo.
Ejecute el experimento.

Results

Una vez completado el entrenamiento:

Para realizar predicciones, conecte el modelo entrenado, junto con los datos nuevos, al módulo Puntuar modelo.
Para realizar la validación cruzada en un conjunto de datos etiquetado, conecte el modelo sin entrenar a Modelo de validación cruzada.

Ejemplos

Para obtener ejemplos de cómo se usa la regresión ordinal en el aprendizaje automático, consulte el Azure AI Gallery.

Mantenimiento predictivo: paso C: en este ejemplo, la regresión ordinal se usa para clasificar los valores que genera un modelo de clasificación, en la suposición de que el valor refleja la gravedad de la clasificación de errores.

Notas técnicas

El algoritmo de regresión ordinal que se usa en este sistema aprendiz se implementa con la clasificación binaria extendida, como se describe en el documento titulado Regresión ordinal por clasificación binaria extendida de Ling Li y Hsuan-Tien Lin en NIPS 2006.

Restricciones en los datos de entrada

Puede usar cualquier columna numérica como destino de un modelo de regresión ordinal, pero en la práctica solo debe usar datos que represente algún tipo de orden o clasificación.

Se supone que los intervalos entre rangos son desconocidos y que el tamaño del intervalo no importa para el modelo; Sin embargo, el modelo supone que la secuencia de rangos sigue el orden natural de los números.

El propio modelo no asigna ningún significado a una escala determinada. En otras palabras, podría crear un modelo en el que 1 es una clasificación buena y 10 es la peor, y en otro modelo se supone que 10 es la clasificación deseada y 1 es la peor.

Algoritmo de clasificación

El conjunto de entrenamiento (X,Y) consta de vectores de entrada x y etiquetas y . Las etiquetas representan rangos que van de 1 a k en secuencia: 1,2, ... , K. Se supone que las rangos están ordenadas de forma que 1 es la clasificación más baja o la peor, y K es la mejor o la más alta.

La clave del algoritmo radica en modificar las características de entrada X y las etiquetas Y dadas para usar ejemplos extendidos y, a continuación, usar un clasificador binario para resolver el problema de regresión ordinal. El clasificador binario se entrena para dar una respuesta sí o no a la pregunta"¿ Es el rango mayor que r?"

Por ejemplo, para cada caso del conjunto de entrenamiento hay ejemplos extendidos de K-1 y el rango máximo observado es K. Las características extendidas se forman anexando la fila ^ith de una matriz de identidad K-1 x K-1 a las características de entrada para todas las i. Las etiquetas reciben +1 para las primeras filas r-1 si su rango es r y -1 para el resto.

Cálculos de ejemplo

Para ilustrar cómo funciona, deje que ^x1 sea la característica de entrenamiento cuyo rango es 3, donde el rango máximo observado es 5. Los ejemplos extendidos correspondientes a esta característica son los siguientes:

Caso	Prueba	Etiqueta resultante
X11000	¿Es mayor que 1?	Sí; por lo tanto, +1
X10100	¿Es mayor que 2?	Sí; por lo tanto, +1
X10010	¿Es mayor que 3?	No; por lo tanto, no hay ninguna característica adicional
X10001	¿Es mayor que 4?	No; por lo tanto, no hay ninguna característica adicional

Entradas esperadas

Nombre	Tipo	Descripción
Modelo de clasificación binaria no entrenado	Interfaz ILearner	Un modelo de clasificación binaria no entrenado

Salidas

Nombre	Tipo	Descripción
Modelo no entrenado	Interfaz ILearner	Un modelo de regresión ordinal no entrenado

Consulte también

Regresión