Máquina del punto de Bayes de dos clases

Crea un modelo de clasificación binaria de la máquina del punto de Bayes

Categoría: machine learning/inicializar modelo/clasificación

Nota

Se aplica a: machine learning Studio (clásico)

Este contenido solo pertenece a Studio (clásico). Se han agregado módulos similares de arrastrar y colocar al diseñador de Azure Machine Learning. Obtenga más información en este artículo comparativa de las dos versiones.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo de equipo de punto de Bayes de dos clases en Azure machine learning Studio (clásico) para crear un modelo de clasificación binaria no entrenado.

El algoritmo de este módulo utiliza un enfoque bayesiano para la clasificación lineal denominada "equipo de punto de Bayes". Este algoritmo aproxima de forma eficaz la media bayesiana teóricamente óptima de clasificadores lineales (en términos de rendimiento de generalización) eligiendo un clasificador "medio", el punto de Bayes. Dado que la máquina del punto de Bayes es un modelo de clasificación bayesiano, no tiende a sobreajustar los datos de entrenamiento.

Para obtener más información, consulte la publicación de Chris Bishop en el blog de Microsoft Machine Learning: adopción de la inferencia de incertidumbre.

Configuración de Two-Class equipo de punto de Bayes

  1. En Azure Machine Learning Studio (clásico), agregue el módulo de equipo de punto de Bayes de dos clases al experimento. Puede encontrar el módulo en machine learning, inicializar modelo, clasificación.

  2. En número de iteraciones de entrenamiento, escriba un número para especificar la frecuencia con la que el algoritmo de paso de mensajes recorre en iteración los datos de entrenamiento. Normalmente, el número de iteraciones debe configurarse con un valor comprendido entre 5 y 100.

    Cuanto mayor sea el número de iteraciones de entrenamiento, más precisas serán las predicciones; sin embargo, el aprendizaje será más lento.

    Con la mayoría de los conjuntos de datos, el valor predeterminado de 30 iteraciones de entrenamiento es suficiente para que el algoritmo realice predicciones precisas. Algunas veces, se pueden realizar predicciones precisas con menos iteraciones. Para los conjuntos de datos con características muy correlacionadas, puede resultarle útil emplear más iteraciones de entrenamiento.

  3. Seleccione la opción incluir sesgo si desea que se agregue una característica o una inclinación constante a cada instancia en el aprendizaje y la predicción.

    Es necesario incluir un sesgo cuando los datos no contienen una característica de constante.

  4. Seleccione la opción permitir valores desconocidos en las características de categorías para crear un grupo de valores desconocidos.

    Si desactiva esta opción, el modelo puede aceptar únicamente los valores que se encuentran en los datos de entrenamiento.

    Si selecciona esta opción y permite valores desconocidos, es posible que el modelo sea menos preciso para los valores conocidos, pero puede proporcionar mejores predicciones para los valores nuevos (desconocidos).

  5. Agregue una instancia del módulo Train Model (entrenar modelo ) y los datos de entrenamiento.

  6. Conecte los datos de entrenamiento y la salida del módulo de máquina del punto de Bayes de dos clases al módulo entrenar modelo y elija la columna etiqueta.

  7. Ejecute el experimento.

Results

Una vez completado el entrenamiento, haga clic con el botón derecho en la salida del módulo entrenar modelo para ver los resultados:

  • Para ver un resumen de los parámetros del modelo, junto con los pesos de las características aprendidos en el entrenamiento, seleccione visualizar.

  • Para guardar el modelo para su uso posterior, haga clic con el botón derecho en la salida de entrenar modelo y seleccione Guardar como modelo entrenado.

  • Para hacer predicciones, use el modelo entrenado como entrada para el módulo puntuar modelo .

    El modelo no entrenado también puede pasarse al modelo de validación cruzada para la validación cruzada en un conjunto de datos etiquetado.

Ejemplos

Para ver cómo se usa la máquina del punto de Bayes Two-Class en el aprendizaje automático, consulte estos experimentos de ejemplo en el Azure AI Gallery:

Notas técnicas

Esta sección contiene detalles de implementación y preguntas más frecuentes sobre este algoritmo.

Los detalles de la investigación original y la teoría subyacente están disponibles en este documento (PDF): máquinas de punto de Bayes, por Herbert, Graepe y Campbell

Sin embargo, esta implementación mejora el algoritmo original de varias maneras:

Estas mejoras hacen que el modelo de clasificación de la máquina del punto de Bayes sea más sólido y fácil de usar, y puede omitir el tedioso paso de optimización de parámetros.

Parámetros del módulo

Nombre Intervalo Tipo Valor predeterminado Descripción
Número de iteraciones de entrenamiento >=1 Entero 30 Especificar el número de iteraciones que se van a usar al entrenar
Incluir sesgo Any Boolean True Indicar si se debe agregar una característica de constante o sesgo a cada instancia
Permitir valores desconocidos en características de categorías Any Boolean True Si es True, crea un nivel adicional para cada columna de categoría. Los niveles del conjunto de datos de prueba que no están disponibles en el conjunto de datos de entrenamiento se asignan a este nivel adicional.

Output

Nombre Tipo Descripción
Modelo no entrenado Interfaz ILearner Un modelo de clasificación binaria no entrenado

Vea también

Lista de módulos a-Z de clasificación