Автоматическая оптимизация Персонализатора (предварительная версия)

Важно!

Начиная с 20 сентября 2023 г. вы не сможете создавать новые ресурсы Персонализатора. Служба Персонализатора отменяется 1 октября 2026 года.

Введение

Автоматическая оптимизация Персонализатора избавляет вас от ручных усилий, обеспечивая максимальную производительность машинного обучения цикла Персонализатора за счет автоматического поиска улучшенных параметров обучения, используемых для обучения ваших моделей, и их применения. Персонализатор имеет строгие критерии для применения новых настроек обучения, чтобы гарантировать, что улучшения вряд ли приведут к потере вознаграждения.

Автоматическая оптимизация Персонализатора находится в общедоступной предварительной версии, и функции, подходы и процессы будут меняться в зависимости от отзывов пользователей.

Когда следует использовать автоматическую оптимизацию

В большинстве случаев лучше всего включить автоматическую оптимизацию. Автоматическая оптимизация включена по умолчанию для новых циклов Персонализатора.

Автоматическая оптимизация может помочь в следующих ситуациях:

  • Вы создаете приложения, которые используются многими арендаторами, и каждое получает свой собственный цикл (-ы) Персонализатора; например, если вы размещаете несколько сайтов электронной коммерции. Автоматическая оптимизация позволяет избежать ручных усилий, необходимых для настройки параметров обучения для большого количества циклов Персонализатора.
  • Вы развернули Персонализатор и подтвердили, что он работает хорошо, получает хорошие награды, и вы убедились, что в ваших функциях нет ошибок или проблем.

Примечание.

Автоматическая оптимизация будет периодически перезаписывать настройки обучения Персонализатора. Если для вашего варианта использования или отрасли требуется аудит и архивирование моделей и настроек или если вам нужны резервные копии предыдущих настроек, вы можете использовать API Персонализатора для получения настроек обучения или загрузить их через портал Azure.

Как включить и отключить автоматическую оптимизацию

Чтобы включить автоматическую оптимизацию, используйте переключатель в колонке «Параметры модели и обучения» на портале Azure.

Помимо этого, вы можете активировать автоматическую оптимизацию с помощью API Персонализатора /configurations/service.

Чтобы отключить автоматическую оптимизацию, выключите переключатель.

Отчеты функции автоматической оптимизации

В колонке «Параметры модели и обучения» можно просмотреть историю запусков автоматической оптимизации и действия, предпринятые для каждого из них.

В таблице представлены следующие сведения:

  • Когда была выполнена автоматическая оптимизация,
  • Какое окно данных было включено,
  • Какова была эффективность интерактивных, базовых и наиболее эффективных настроек обучения,
  • Предпринятые действия: были ли обновлены настройки обучения или нет.

Вознаграждение за эффективность различных настроек обучения в каждой строке истории автоматической оптимизации отображается в абсолютных числах и в процентах относительно базовой производительности.

Пример. Если ваше базовое среднее вознаграждение оценивается в 0,20, а поведение персонализатора в Интернете достигает 0,30, они будут показаны как 100% и 150% соответственно. Если автоматическая оптимизация обнаружила, что настройки обучения позволяют получить среднее вознаграждение 0,40, оно будет показано как 200% (0,40 - это 200% от 0,20). Предполагая, что пределы достоверности позволяют это, будут применены новые настройки, затем они будут использовать Персонализатор в качестве сетевых настроек до следующего запуска.

Для целей анализа сохраняется история до 24 предыдущих запусков автоматической оптимизации. Вы можете получить более подробную информацию об этих автономных оценках и отчетах по каждому из них. Помимо этого, отчеты содержат любые настройки обучения, которые есть в этой истории, которые вы можете найти, загрузить или применить.

Как это работает

Персонализатор проводит постоянное обучение моделей искусственного интеллекта, которые он использует, на основе вознаграждений. Обучение выполняется в соответствии с некоторыми настройками обучения, которые содержат гиперпараметры и другие значения, используемые в процессе обучения. Данные настройки обучения можно «настроить» на ваш конкретный экземпляр Персонализатора.

Персонализатор также может выполнять автономные оценки. Автономные оценки рассматривают прошлые данные и могут дать статистическую оценку среднего вознаграждения, которое могли бы получить различные алгоритмы и модели Персонализатора. Во время этого процесса Персонализатор также будет искать лучшие настройки обучения, оценивая их эффективность (сколько наград они получили бы) за прошедший период времени.

Частота автоматической оптимизации

Автоматическая оптимизация будет запускаться периодически и будет выполнять автоматическую оптимизацию на основе прошлых данных

  • Если ваше приложение отправляет в Персонализатор более 20 МБ данных за последние две недели, оно будет использовать данные за последние две недели.
  • Если ваше приложение отправляет меньше, чем данное количество, Персонализатор будет добавлять данные за предыдущие дни до тех пор, пока не будет достаточно данных для оптимизации или до тех пор, пока не будут достигнуты самые ранние сохраненные данные (до количества дней хранения данных).

Точное время и дни, когда запускается автоматическая оптимизация, определяется службой Персонализатора и может меняться со временем.

Критерии обновления настроек обучения

Персонализатор использует эти оценки вознаграждения, чтобы решить, менять ли текущие настройки обучения для других. Каждая оценка представляет собой кривую распределения с верхним и нижним доверительным интервалом 95%. Персонализатор применит новые настройки обучения, только если:

  • Они показали более высокие средние вознаграждения в период оценки, И
  • У них есть нижняя граница 95% доверительного интервала, что выше, чем нижняя граница 95% доверительного интервала настроек онлайн-обучения. Данный критерий для максимального увеличения вознаграждения при попытке устранить вероятность потери вознаграждения в будущем управляется Персонализатором и основан на исследованиях в области алгоритмов Селдона и безопасности искусственного интеллекта.

Ограничения автоматической оптимизации

Функция автоматической оптимизации Персонализатора полагается на оценку прошлого периода для оценки производительности в будущем. Возможно, что из-за внешних факторов в мире, вашем приложении и ваших пользователях эти оценки и прогнозы о моделях Персонализатора, сделанные за прошлый период, не будут репрезентативными для будущего.

Предварительный просмотр автоматической оптимизации недоступен для циклов Персонализатора, в которых включена функция предварительного просмотра API персонализации с несколькими слотами.

Следующие шаги