Начало работы с экспериментами MLflow

В этой коллекции записных книжек показано, как можно приступить к работе с помощью эксперимента MLflow.

Компоненты MLflow

Платформа MLflow с открытым кодом предназначена для управления жизненным циклом машинного обучения на всем его протяжении. MLflow имеет три основных компонента:

  • Отслеживание
  • Модели
  • Проекты

Компонент отслеживания MLflow позволяет записывать и запрашивать обучающие сеансы модели машины (выполняется) с помощью следующих API:

Выполнение MLflow — это коллекция параметров, метрик, тегов и артефактов, связанных с процессом обучения модели машинного обучения.

Что такое эксперименты в MLflow?

Эксперименты — это основная единица организации в MLflow; все запуски MLflow относятся к какому-либо эксперименту. Каждый эксперимент позволяет визуализировать запуски, выполнять по ним поиск и сравнивать их, а также скачивать артефакты или метаданные запусков для анализа в других инструментах. Эксперименты хранятся в решении Azure Databricks размещенном на сервере отслеживания MLflow.

Эксперименты расположены в дереве файлов рабочей области . Для управления экспериментами используются те же средства, которые используются для управления другими объектами рабочей области, такими как папки, записные книжки и библиотеки.

Примеры записных книжек MLflow

В следующих записных книжках показано, как создать и выполнить вход в MLflow с помощью API отслеживания MLflow, а также как использовать пользовательский интерфейс эксперимента для просмотра выполнения. Эти записные книжки доступны в Python, Scala и R.

В записных книжках Python и R используется эксперимент записной книжки. В записных книжках Scala создается эксперимент в папке Shared.

Примечание.

При использовании Databricks Runtime 10.4 LTS ML и более поздних версий функция автолога Databricks включена по умолчанию для записных книжек Python.