Tutorial sobre Machine Learning

Nota

Databricks Runtime ML es una herramienta completa para desarrollar e implementar modelos de aprendizaje automático con Azure Databricks. Incluye las bibliotecas de aprendizaje profundo y aprendizaje automático más populares, así como MLflow, una API de plataforma de aprendizaje automático para realizar el seguimiento y la administración del ciclo de vida de aprendizaje automático de un extremo a otro. Consulte Guía de aprendizaje automático y aprendizaje en profundidad para obtener más información.

El Apache Spark biblioteca de aprendizaje automático (MLlib) permite a los científicos de datos centrarse en sus problemas y modelos de datos en lugar de resolver las complejidades que rodean los datos distribuidos (por ejemplo, la infraestructura, las configuraciones, etc.). El Bloc de notas del tutorial le guiará por los pasos necesarios para cargar y preprocesar datos, entrenar un modelo con un algoritmo MLlib, evaluar el rendimiento del modelo, optimizar el modelo y realizar predicciones. También muestra el uso de canalizaciones de MLlib y la plataforma de aprendizaje automático de MLflow.

Notebook

Use el cuaderno que corresponde a la versión Databricks Runtime del clúster. Para obtener más ejemplos de aprendizaje automático, consulte Guía de aprendizaje automático y aprendizaje profundo.

Introducción a MLlib Notebook (Databricks Runtime 7,0 y versiones posteriores)

Obtener el cuaderno

Introducción a MLlib Notebook (Databricks Runtime 5,5 LTS o 6. x)

Obtener el cuaderno