Módulos de agrupación en clústeres

En este artículo se describen los módulos de Azure Machine Learning Studio (clásico) que admiten la creación de modelos de agrupación en clústeres.

Nota

Se aplica a: machine learning Studio (clásico)

Este contenido solo pertenece a Studio (clásico). Se han agregado módulos similares de arrastrar y colocar al diseñador de Azure Machine Learning. Obtenga más información en este artículo comparativa de las dos versiones.

¿Qué es la agrupación en clústeres?

La agrupación en clústeres, en machine learning, es un método para agrupar los puntos de datos en clústeres similares. También se denomina segmentación.

A lo largo de los años, se han desarrollado muchos algoritmos de clústeres. Casi todos los algoritmos de clúster usan las características de elementos individuales para buscar elementos similares. Por ejemplo, puede aplicar la agrupación en clústeres para buscar personas similares por datos demográficos. Puede usar la agrupación en clústeres con el análisis de texto para agrupar oraciones con temas o opiniones similares.

La agrupación en clústeres se denomina técnica de aprendizaje no supervisado porque se puede usar en datos sin etiquetar. En realidad, la agrupación en clústeres es un primer paso útil para detectar nuevos patrones y requiere poco conocimiento previo sobre cómo se pueden estructurar los datos o cómo se relacionan los elementos. La agrupación en clústeres se usa a menudo para la exploración de datos antes del análisis con otros algoritmos más predictivos.

Cómo crear un modelo de agrupación en clústeres

En Machine Learning Studio (clásico), puede usar la agrupación en clústeres con datos etiquetados o sin etiquetar.

  • En los datos sin etiquetar, el algoritmo de clústeres determina los puntos de datos más cercanos y crea clústeres alrededor de un punto central o centroide. Después, puede usar el identificador de clúster como etiqueta temporal para el grupo de datos.

  • Si los datos tienen etiquetas, puede usar la etiqueta para impulsar el número de clústeres, o bien usar la etiqueta como otra característica.

Después de haber configurado el algoritmo de clústeres, debe entrenarlo en los datos mediante el modelo de agrupación en clústeres de trenes o los módulos de clústeres de barrido .

Cuando el modelo esté entrenado, úselo para predecir la pertenencia al clúster para los nuevos puntos de datos. Por ejemplo, si ha usado la agrupación en clústeres para agrupar los clientes mediante el comportamiento de compra, puede usar el modelo para predecir el comportamiento de compra de los nuevos clientes.

Lista de módulos

La categoría agrupación en clústeres incluye este módulo:

Para usar un algoritmo de clústeres diferente o crear un modelo de agrupación en clústeres personalizado mediante R, consulte estos temas:

Ejemplos

Para obtener ejemplos de la agrupación en clústeres en acción, vea el Azure AI Gallery.

Consulte estos artículos para obtener ayuda para elegir un algoritmo:

Vea también