Módulos de aprendizaje automático en ML Studio (clásico)

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

El flujo de trabajo típico para el aprendizaje automático incluye muchas fases:

  • Identificar un problema que se va a resolver y una métrica para medir los resultados.

  • Buscar, limpiar y preparar los datos adecuados.

  • Identificar las mejores características e ingeniería de nuevas características.

  • Compilar, evaluar y optimizar modelos.

  • Usar modelos para generar predicciones, recomendaciones y otros resultados.

Los módulos de esta sección proporcionan herramientas para las fases finales del aprendizaje automático, en las que se aplica un algoritmo a los datos para entrenar un modelo. En estas fases finales, también se generan puntuaciones y, a continuación, se evalúa la precisión y utilidad del modelo.

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Lista de tareas de aprendizaje automático por categoría

  • Inicializar modelo

    Elija entre una variedad de algoritmos de aprendizaje automático personalizables, incluidos los modelos de agrupación en clústeres, regresión, clasificacióny detección de anomalías.

  • Entrenar

    Proporcione los datos al modelo configurado para aprender de los patrones y crear estadísticas que se puedan usar para las predicciones.

  • Puntuación

    Cree predicciones mediante los modelos entrenados.

  • Evaluate

    Mida la precisión de un modelo entrenado o compare varios modelos.

Para obtener una descripción detallada de este flujo de trabajo experimental, consulte el tutorial de la solución de riesgo de crédito.

Prerrequisitos

Para poder llegar a la parte divertida de la creación de un modelo, normalmente se requiere mucha preparación. En esta sección se proporcionan vínculos a herramientas de Machine Learning Studio (clásico) que pueden ayudarle a limpiar los datos, mejorar la calidad de la entrada y evitar errores en tiempo de ejecución.

Exploración de datos y calidad de datos

Asegúrese de que los datos son el tipo de datos correcto, la cantidad adecuada y la calidad adecuada para el algoritmo que ha elegido. Comprenda cuántos datos tiene y cómo se distribuyen. ¿Existen valores atípicos? ¿Cómo se generaron y qué significan? ¿Existen registros duplicados?

Controlar los valores que faltan

Los valores que faltan pueden afectar a los resultados de muchas maneras. Por ejemplo, casi todos los métodos estadísticos descartan casos con valores que faltan. De forma predeterminada, Machine Learning sigue estas reglas cuando encuentra filas con valores que faltan:

  • Si los datos utilizados para entrenar un modelo tienen valores que faltan, se omiten las filas con valores que faltan.

  • Si faltan valores en los datos usados como entrada al puntuar en un modelo, los valores que faltan se usan como entradas, pero se propagan los valores NULL. Esto suele significar que se inserta un valor NULL en los resultados en lugar de una predicción válida.

Asegúrese de comprobar los datos antes de entrenar el modelo. Para imputar los valores que faltan o corregir los datos, use este módulo:

Selección de características y reducción de la dimensionalidad

Machine Learning Studio (clásico) puede ayudarle a realizar un análisis de los datos para encontrar los atributos más útiles.

Ejemplos

Para obtener ejemplos de aprendizaje automático en acción, consulte el Azure AI Gallery.

Para obtener sugerencias y un tutorial de algunas tareas típicas de preparación de datos, consulte Tutoriales que ejecutan el proceso de ciencia de datos en equipo.

Consulte también