Ejemplos de entrenamiento de modelos

En esta sección se incluyen ejemplos que muestran cómo entrenar modelos de Machine Learning en Azure Databricks mediante muchas bibliotecas de código abierto conocidas.

También puede usar AutoML, que prepara automáticamente un conjunto de datos para el entrenamiento de modelos, realiza un conjunto de pruebas con bibliotecas de código abierto como scikit-learn y XGBoost, y crea un cuaderno de Python con el código fuente para cada ejecución de prueba para que pueda revisar, reproducir y modificar el código.

Para ver un cuaderno de ejemplo que muestra cómo entrenar un modelo de aprendizaje automático que utiliza datos del Catálogo Unity y escribir predicciones de nuevo en el Catálogo Unity, consulta Entrenar y registrar modelos de aprendizaje automático con el Catálogo Unity.

Ejemplos de aprendizaje automático

Paquete Cuadernos Características
scikit-learn Tutorial sobre aprendizaje automático Modelo de clasificación, MLflow, ajuste automático de hiperparámetros con Hyperopt y MLflow
scikit-learn Acceso de un extremo a otro Modelo de clasificación, MLflow, ajuste automático de hiperparámetros con Hyperopt y MLflow, XGBoost, registro de modelos, servicio de modelos
MLlib Ejemplos de MLlib Clasificación binaria, árboles de decisión, regresión de GBT, Structured Streaming, transformador personalizado
xgboost Ejemplos de XGBoost Python, PySpark y Scala, cargas de trabajo de un solo nodo y entrenamiento distribuido

Ejemplo de ajuste de hiperparámetros

Para obtener información general sobre el ajuste de hiperparámetros en Azure Databricks, consulte Ajuste de hiperparámetros.

Paquete Notebook Características
Hyperopt Hyperopt distribuido Hyperopt distribuido, scikit-learn, MLflow
Hyperopt Comparación de modelos Use Hyperopt distribuido para buscar espacio de hiperparámetros para diferentes tipos de modelo simultáneamente
Hyperopt Algoritmos de entrenamiento distribuido e Hyperopt Hyperopt, MLlib
Hyperopt Procedimientos recomendados de Hyperopt Procedimientos recomendados para conjuntos de datos de diferentes tamaños