Что такое конструктор Машинное обучение Azure (версия 1)?

Конструктор Машинного обучения Azure — это интерфейс с функцией перетаскивания, используемый для обучения и развертывания моделей в службе “Машинное обучение Azure”. В этой статье описываются задачи, которые можно выполнять в конструкторе.

Примечание.

Конструктор поддерживает два типа компонентов, классические предварительно созданные компоненты (v1) и пользовательские компоненты (версии 2). Эти два типа компонентов несовместимы.

Классические предварительно созданные компоненты предоставляют предварительно созданные компоненты, главным образом для обработки данных и традиционных задач машинного обучения, таких как регрессия и классификация. Этот тип компонента по-прежнему поддерживается, но новые компоненты добавляться не будут.

Пользовательские компоненты позволяют упаковывать собственный код в качестве компонента. Она поддерживает совместное использование компонентов между рабочими областями и простой разработки в интерфейсах Studio, CLI версии 2 и ПАКЕТА SDK версии 2.

Для новых проектов мы настоятельно рекомендуем использовать настраиваемый компонент, совместимый с AzureML версии 2 и сохраняющий получение новых обновлений.

Эта статья относится к классическим предварительно созданным компонентам и не совместим с CLI версии 2 и пакетом SDK версии 2.

GIF of a building a pipeline in the designer.

Конструктор использует рабочую область Машинного обучения Azure для организации общих ресурсов, таких как:

Обучение и развертывание модели

Используйте визуальный холст для создания комплексного рабочего процесса машинного обучения. Обучение, тестирование и развертывание моделей в конструкторе:

  • Перетащите ресурсы и компоненты данных на холст.
  • соединять компоненты для создания черновика конвейера;
  • отправлять выполнение конвейера с помощью вычислительных ресурсов в рабочей области Машинного обучения Azure;
  • преобразовывать конвейеры обучения в конвейеры вывода;
  • Опубликуйте конвейеры в конечной точке конвейера REST, чтобы отправить новый конвейер, который выполняется с различными параметрами и ресурсами данных.
    • Опубликуйте конвейер обучения для повторного использования одного конвейера для обучения нескольких моделей при изменении параметров и ресурсов данных.
    • публиковать конвейер пакетного вывода для прогнозирования на основе новых данных с помощью ранее обученной модели;
  • развертыватьконвейер вывода в реальном времени в подключенной конечной точке для создания прогнозов на основе новых данных в реальном времени.

Workflow diagram for training, batch inference, and real-time inference in the designer.

Pipeline

Конвейер состоит из ресурсов данных и аналитических компонентов, которые подключаются. Конвейеры имеют множество назначений: можно создать конвейер для обучения одной или нескольких моделей. Можно создать конвейер, делающий прогнозы в режиме реального времени или в пакетном режиме, либо создать конвейер, который просто очищает данные. Конвейеры позволяют повторно использовать результаты работы и упорядочивать проекты.

Черновик конвейера

При изменении конвейера в конструкторе ход выполнения сохраняется в виде черновика конвейера. Черновик конвейера можно изменить в любой момент, добавив или удалив компоненты, настроив целевые объекты вычислений, создав параметры и т. д.

К конвейеру предъявляются указанные ниже требования.

  • Ресурсы данных могут подключаться только к компонентам.
  • компоненты могут подключаться только к ресурсам данных или другим компонентам.
  • Все входные порты для компонентов должны иметь связь с потоком данных.
  • Все необходимые параметры для каждого компонента должны быть установлены.

Когда вы будете готовы запустить проект конвейера, отправьте задание конвейера.

Задание конвейера

При каждом запуске конвейера конфигурация конвейера и его результаты хранятся в рабочей области в качестве задания конвейера. Вы можете вернуться к любому заданию конвейера, чтобы проверить его для устранения неполадок или аудита. Клонируйте задание конвейера, чтобы создать проект конвейера для редактирования.

Задания конвейера группируются в эксперименты для упорядочивания журнала заданий. Эксперимент можно задать для каждого задания конвейера.

Data

Ресурс данных машинного обучения упрощает доступ и работу с данными. Несколько примеров ресурсов данных включены в конструктор для экспериментов. Вы можете зарегистрировать дополнительные ресурсы данных по мере их необходимости.

Компонент

Компонент — это алгоритм, который можно выполнять с данными. В конструкторе имеется ряд компонентов, от функций входящего трафика данных до процессов обучения, оценки и проверки.

Компонент может иметь ряд параметров, которые можно использовать для настройки внутренних алгоритмов компонента. При выборе компонента на холсте его параметры отображаются в области "Свойства" в правой части холста. Подстройка модели осуществляется изменением параметров в этой области. Вы можете задать вычислительные ресурсы для отдельных компонент в конструкторе.

Screenshot showing the component properties.

Некоторые справки по переходу по библиотеке доступных алгоритмов машинного обучения см. в обзоре справочника по алгоритмам и компонентам. Получить помощь в выборе алгоритма можно в памятке по алгоритмам машинного обучения Azure.

Вычислительные ресурсы

Используйте вычислительные ресурсы из рабочей области для запуска конвейера и размещения развернутых моделей в качестве подключенных конечных точек или конечных точек конвейера (для пакетного вывода). Поддерживаются следующие целевые объекты вычислений:

Целевой объект вычислений Обучение Развертывание
Вычислительная среда Машинного обучения Azure
Служба Azure Kubernetes

Целевые объекты вычислений присоединяются к рабочей области Машинного обучения Azure. Управление целевыми объектами вычислений осуществляется в рабочей области в Студии машинного обучения Azure.

Развернуть

Чтобы выполнить вывод в режиме реального времени, необходимо развернуть конвейер в качестве сетевой конечной точки. Подключенная конечная точка создает интерфейс между внешним приложением и моделью оценки. Вызов подключенной конечной точки возвращает результаты прогнозирования приложению в реальном времени. Чтобы вызвать подключенную конечную точку, необходимо передать ключ API, созданный при развертывании конечной точки. Конечная точка работает на основе архитектуры REST, используемой в основном в проектах с веб-программированием.

Подключенные конечные точки должны развертываться в кластере Службы Azure Kubernetes.

Сведения о развертывании модели см. в руководстве по развертыванию модели машинного обучения с помощью конструктора.

Публикация

Конвейер можно также опубликовать в конечной точке конвейера. Как и в сети, конечная точка конвейера позволяет отправлять новые задания конвейера из внешних приложений с помощью вызовов REST. Однако вы не можете отправлять или получать данные в режиме реального времени с помощью конечной точки конвейера.

Опубликованные конвейеры обладают гибкостью: их можно использовать для обучения или переобучения моделей, выполнения пакетного вывода, обработки новых данных и многого другого. Вы можете опубликовать несколько конвейеров в одной конечной точке конвейера и указать, какую версию конвейера следует запустить.

Опубликованный конвейер выполняется на основе вычислительных ресурсов, которые определяются в черновике конвейера для каждого компонента.

Конструктор создает такой же объект PublishedPipeline, что и пакет SDK.

Следующие шаги