Guía de MLflow

MLflow es una plataforma de código abierto para administrar el ciclo de vida completo del aprendizaje automático. Tiene los siguientes componentes principales:

  • Seguimiento: Permite realizar un seguimiento de los experimentos para registrar y comparar parámetros y resultados.
  • Modelos: Permiten administrar e implementar modelos desde una variedad de bibliotecas de Machine Learning para una variedad de plataformas de inferencia y visualización de modelos.
  • Proyectos: Permiten empaquetar el código de Machine Learning en una forma reutilizable y reproducible para compartirlo con otros científicos de datos o transferirlos a producción.
  • Registro de modelos: Le permite centralizar un almacén de modelos para administrar las transiciones entre las etapas del ciclo de vida completo de los modelos, desde el almacenamiento provisional a producción, con funcionalidades que permiten crear versiones y anotaciones.
  • Servicio de modelos: Permite hospedar modelos de MLflow como puntos de conexión de REST.

MLflow admite Java, Python, R y API REST.

Azure Databricks proporciona una versión hospedada y totalmente administrada de MLflow integrada con características de seguridad empresarial, alta disponibilidad y otras características del área de trabajo de Azure Databricks, como la administración de experimentos y ejecuciones y la captura de revisiones de cuadernos. MLflow en Azure Databricks ofrece una experiencia integrada para el seguimiento y la protección de las ejecuciones de entrenamiento de los modelos de Machine Learning, así como la ejecución de proyectos de aprendizaje automático.

Azure Databricks cifra los datos de MLflow mediante una clave administrada por la plataforma. No se admite el cifrado mediante Habilitación de claves administradas por el cliente para servicios administrados.

Los nuevos usuarios deberían empezar por el inicio rápido, en el que se muestran las API básicas de seguimiento de MLflow. En los artículos siguientes se presentan los distintos componentes de MLflow con cuadernos de ejemplo y se describe cómo se hospedan estos componentes en Azure Databricks.