Machine Learning: puntuación

En esta sección se enumeran los módulos proporcionados en Azure Machine Learning Studio (clásico) para la puntuación.

Nota

Se aplica a: machine learning Studio (clásico)

Este contenido solo pertenece a Studio (clásico). Se han agregado módulos similares de arrastrar y colocar al diseñador de Azure Machine Learning. Obtenga más información en este artículo comparativa de las dos versiones.

La puntuación también se denomina predicción y es el proceso de generar valores basados en un modelo de aprendizaje automático entrenado, dados algunos datos de entrada nuevos. Los valores o puntuaciones que se crean pueden representar predicciones de valores futuros, pero también pueden representar una categoría o un resultado probables. El significado de la puntuación depende del tipo de datos que proporcione y del tipo de modelo que ha creado.

Crear y usar modelos en Machine Learning Studio (clásico)

El flujo de trabajo típico de machine learning incluye estas fases:

  • Elegir un algoritmo adecuado y establecer las opciones iniciales.
  • Entrenar el modelo en datos compatibles.
  • Crear predicciones usando nuevos datos, basándose en los patrones del modelo.
  • Evaluar el modelo para determinar si las predicciones son precisas, cuántos errores hay y si hay algún sobreajuste.

Machine Learning Studio (clásico) es compatible con un marco de trabajo flexible y personalizable para el aprendizaje automático. Cada tarea de este proceso se realiza mediante un tipo específico de módulo, que se puede modificar, agregar o quitar, sin interrumpir el resto del experimento.

Los módulos de esta sección incluyen herramientas para puntuar. En esta fase del aprendizaje automático, se aplica un modelo entrenado a los nuevos datos para generar predicciones. Puede enviar esas predicciones a una aplicación que consume resultados de aprendizaje automático, o bien usar los resultados de la puntuación para evaluar la precisión y la utilidad del modelo.

Más información sobre la puntuación

La puntuación se utiliza ampliamente en el aprendizaje automático para indicar el proceso de generación de nuevos valores, dado un modelo y una nueva entrada. Se usa el término genérico "puntuación", en lugar de "predicción", ya que el proceso de puntuación puede generar muchos tipos diferentes de valores:

  • Una lista de elementos recomendados y una puntuación de similitud.
  • Valores numéricos, para los modelos de serie temporal y los modelos de regresión.
  • Un valor de probabilidad que indica la probabilidad de que una nueva entrada pertenezca a alguna categoría existente.
  • Nombre de una categoría o clúster en el que un nuevo elemento es más similar.
  • Clase o resultado de predicción para los modelos de clasificación.

Nota

Es posible que también haya escuchado la puntuación de palabras usada para indicar un peso o valor asignado como resultado del análisis de datos. Sin embargo, en Machine Learning Studio (clásico), la puntuación suele indicar el proceso de generación de valores de predicción a partir de nuevos datos.

Al agregar uno de estos módulos en el experimento, debe adjuntar un modelo de aprendizaje automático ya entrenado y algunos datos nuevos. Al ejecutar el experimento o el módulo seleccionado, el módulo de puntuación ingeri los nuevos datos, calcula puntuaciones basadas en el modelo y devuelve las puntuaciones de una tabla.

Datos usados para la puntuación

Los nuevos datos que proporcione como entrada generalmente deben tener las mismas columnas que se usaron para entrenar el modelo, menos la etiqueta o la columna de resultados.

Las columnas que se usan únicamente como identificadores se excluyen normalmente al entrenar un modelo y, por lo tanto, se deben excluir también en la puntuación. Sin embargo, los identificadores como las claves principales se pueden volver a combinar fácilmente con el conjunto de resultados más adelante, mediante el módulo Agregar columnas . Este módulo funciona sin tener que especificar una clave de combinación, siempre y cuando el tamaño del conjunto de cambios no haya cambiado.

Antes de realizar la puntuación en el conjunto de resultados, compruebe siempre si faltan valores y valores NULL. Cuando los datos utilizados como entrada para la puntuación tienen valores que faltan, los valores que faltan se usan como entradas. Dado que los valores NULL se propagan, el resultado suele ser un valor que falta.

Lista de módulos de puntuación

Machine Learning Studio (clásico) proporciona muchos módulos de puntuación diferentes. Seleccione una según el tipo de modelo que esté usando o el tipo de tarea de puntuación que está llevando a cabo:

  • Aplicar transformación: aplica una transformación de datos bien especificada a un conjunto de datos.

    Use este módulo para aplicar un proceso guardado a un conjunto de datos.

  • Asignar datos a clústeres: asigna datos a los clústeres mediante un modelo de agrupación en clústeres entrenado existente.

    Use este módulo si desea agrupar los datos nuevos en función de un modelo de agrupación en clústeres K-means existente.

    Este módulo reemplaza el módulo asignar a clústeres (en desuso), que está en desuso, pero sigue estando disponible para su uso en experimentos existentes.

  • Puntuación Matchbox recomendación: puntúa las predicciones para un conjunto de resultados mediante el recomendador Matchbox.

    Use este módulo si desea generar recomendaciones, buscar elementos o usuarios relacionados o predecir clasificaciones.

  • Puntuar modelo: Puntua las predicciones de un modelo de clasificación o regresión entrenado.

    Use este módulo para todos los demás modelos de regresión y clasificación, así como algunos modelos de detección de anomalías.

Ejemplos

En estos ejemplos del Azure AI Gallery se muestra el proceso de puntuación, desde escenarios básicos a avanzados:

En los artículos siguientes se proporcionan ejemplos reales de cómo puede usar un modelo de aprendizaje automático para puntuar:

Vea también