Introducción a los experimentos de MLflow

Esta colección de cuadernos muestra cómo puede ponerse en marcha con las ejecuciones de experimentos de MLflow.

Componentes de MLflow

MLflow es una plataforma de código abierto para administrar el ciclo de vida completo del aprendizaje automático. MLflow tiene tres componentes principales:

  • Seguimiento
  • Modelos
  • Proyectos

El componente de seguimiento de MLflow permite registrar y consultar sesiones de entrenamiento de modelos de máquina (ejecuciones) mediante las siguientes API:

Una ejecución de MLflow es una colección de parámetros, métricas, etiquetas y artefactos asociados a un proceso de entrenamiento de modelos de aprendizaje automático.

¿Qué son los experimentos en MLflow?

Los experimentos son la unidad principal de la organización en MLflow; todas las ejecuciones de MLflow pertenecen a un experimento. Un experimento le permite visualizar, buscar y comparar ejecuciones, así como descargar artefactos de ejecución o metadatos para su análisis en otras herramientas. Los experimentos se mantienen en un servidor de seguimiento de MLflow hospedado en Databricks.

Los experimentos se encuentran en el árbol de archivos del área de trabajo. Los experimentos se administran con las mismas herramientas que se usan para administrar otros objetos de área de trabajo, como carpetas, cuadernos y bibliotecas.

Cuadernos de ejemplo de MLflow

En los siguientes cuadernos se muestra cómo crear una ejecución de MLflow y, registrarse en ella, mediante las API de seguimiento de MLflow, y cómo usar la interfaz de usuario del experimento para ver la ejecución. Estos cuadernos están disponibles en Python, Scala y R.

Los cuadernos de Python y R usan un experimento de cuaderno. El cuaderno de Scala crea un experimento en la carpeta Shared.

Nota:

Con Databricks Runtime 10.4 LTS ML y versiones posteriores, el registro automático de Databricks está habilitado de forma predeterminada para los cuadernos de Python.