Поделиться через


Классификация AutoML

В этой статье описывается компонент в конструкторе Машинного обучения Azure.

Используйте этот компонент для создания модели машинного обучения, основанной на классификации AutoML.

Порядок настройки

Этот компонент создает модель классификации табличных данных.

Для этой модели требуется набор данных для обучения. Наборы данных для проверки и тестирования являются необязательными.

AutoML параллельно создает ряд конвейеров, которые используют различные алгоритмы и параметры для модели. Служба выполняет итерацию по алгоритмам машинного обучения, связанным с выбором признаков, где каждая итерация создает модель с оценкой обучения. Вы можете выбрать метрику, для которой будет оптимизироваться модель. Чем выше оценка для выбранной метрики, тем лучше модель считается "подходящей" для ваших данных. Вы можете определить критерии выхода для эксперимента. Критерием выхода будет модель с определенной оценкой обучения, которую вы хотите найти в AutoML. Он остановится после того, как достигнет определенных критериев выхода. Затем этот компонент выводит наилучшую модель, созданную в конце выполнения для набора данных.

  1. Добавьте компонент классификации AutoML в конвейер.

  2. Укажите целевой столбец , который модель будет выводить

  3. Для классификации можно также включить глубокое обучение.

Если глубокое обучение включено, то проверка ограничена разделением train_validation.

  1. Необязательно. Просмотрите дополнительные параметры конфигурации, которые можно использовать для лучшего управления заданием обучения. В противном случае применяются значения по умолчанию, основанные на выборе эксперимента и данных.

    Дополнительные конфигурации Описание
    Основная метрика Основная метрика, используемая для оценки модели. Узнайте больше о метриках модели.
    Отладка модели с помощью панели мониторинга ответственного ИИ Создайте панель мониторинга ответственного использования ИИ, чтобы выполнить комплексную оценку и отладку рекомендуемой лучшей модели. Сюда входят аналитические сведения, такие как объяснения модели, обозреватель справедливости и производительности, обозреватель данных и анализ ошибок модели. Узнайте больше о том, как создать панель мониторинга ответственного использования ИИ.
    Запрещенные алгоритмы Выберите алгоритмы, которые вы хотите исключить из задания обучения.

    Разрешение алгоритмов доступно только для экспериментов с пакетом SDK.
    См. поддерживаемые алгоритмы для каждого типа задачи.
    Критерий выхода Если выполняется любое из этих условий, задание обучения останавливается.
    Training job time (hours) (Время задания обучения (в часах)). Продолжительность выполнения задания обучения.
    Metric score threshold (Порог оценки метрики). Минимальный показатель метрики для всех конвейеров. Гарантирует, что при наличии определенной целевой метрики вы не потратите на задание обучения больше времени, чем это нужно.
    Параллелизм Max concurrent iterations (Максимальное число одновременных итераций). Максимальное количество конвейеров (итераций) для тестирования в задании обучения. Число итераций при выполнении задания не будет больше указанного числа. Дополнительные сведения о том, как автоматизированное машинное обучение выполняет несколько дочерних заданий в кластерах.
  2. Форма Проверка и тестирование [необязательно] позволяет выполнять перечисленные ниже действия.

    1. Укажите тип проверки для использования в задании обучения.

    2. Предоставьте тестовый набор данных (предварительная версия) для оценки рекомендуемой модели, которую автоматизированное машинное обучение сформирует для вас по окончании эксперимента. Если вы предоставите тестовые данные, по окончании эксперимента будет автоматически активировано тестовое задание. Тестовое задание выполняется только в наилучшей модели, рекомендованной автоматическим машинным обучением.

      Важно!

      Предоставление тестового набора данных для оценки созданных моделей доступно как предварительная версия функции. Этот возможность является предварительной версией экспериментальной функции и может быть изменена в любое время.

      • Тестовые данные рассматриваются отдельно от обучения и проверки, чтобы не искажать результаты выполнения тестового задания рекомендуемой модели. Дополнительные сведения о смещении при проверке модели.
      • Вы можете предоставить собственный тестовый набор данных или использовать часть учебного набора данных. Тестовые данные должны быть представлены в виде табличного набора данных Машинного обучения Azure.
      • Схема тестового набора данных должна соответствовать тестовому набору данных. Целевой столбец необязателен, но если целевой столбец не указан, тестовые метрики не вычисляются.
      • Тестовый набор данных должен отличаться от учебного или проверочного набора данных.

Дальнейшие действия

Ознакомьтесь с набором доступных компонентов для Машинного обучения Azure.