Принцип работы Персонализатора

Важно!

Начиная с 20 сентября 2023 г. вы не сможете создавать новые ресурсы Персонализатора. Служба Персонализатора отменяется 1 октября 2026 года.

Ресурс Персонализатора, ваш цикл обучения, используют машинное обучение для построения модели, которая предсказывает основные действия для вашего контента. Модель обучается исключительно на ваших данных, которые вы отправили ей с вызовами Ранг и Вознаграждение. Каждый цикл полностью независим друг от друга.

API ранга и вознаграждения влияют на модель

Вы отправляете действия с функциями и контекстными функциями в Ранг API. API ранжирования решает, какую из следующих моделей использовать.

  • Эксплуатация: текущая модель для принятия решения о наилучшем действии на основе прошлых данных.
  • Обзор: выберите другое действие вместо самого верхнего действия. Вы настраиваете этот процент для своего ресурса Персонализатора на портале Azure.

Вы определяете рейтинг вознаграждения и отправляете его в API Вознаграждений. API вознаграждения:

  • собирает данные для обучения модели, записывая характеристики и награды каждого вызова "Ранг";
  • Использует эти данные для обновления модели на основе конфигурации, указанной в Политике обучения.

Ваша система вызывает Персонализатора

На следующем изображении показан архитектурный процесс вызовов "Ранг" и "Вознаграждение".

alt text

  1. Вы отправляете действия с функциями и контекстными функциями в Ранг API.

    • Персонализатор решает, использовать ли текущую модель или исследовать новые варианты для модели.
    • Результат ранжирования отправляется в EventHub.
  2. Наивысший ранг возвращается в вашу систему как идентификатор действия вознаграждения. Система представляет это содержимое и определяет оценку вознаграждения на основе собственных бизнес-правил.

  3. Ваша система возвращает оценку вознаграждения в цикл обучения.

    • Когда Персонализатор получает вознаграждение, оно отправляется в EventHub.
    • "Ранг" и "Вознаграждение" связаны друг с другом.
    • Модель ИИ обновляется на основе результатов корреляции.
    • Механизм вывода обновляется с помощью новой модели.

Персонализатор повторно обучает вашу модель

Персонализатор повторно обучает вашу модель на основе параметра Частота обновления модели на ресурсе Персонализатора на портале Azure.

Персонализатор использует все данные, которые хранятся в настоящее время, в соответствии с настройкой Срок хранения данных в количестве дней на вашем ресурсе Персонализатора на портале Azure.

Исследование вне Персонализатора

Персонализатор базируется на новейших научных и исследовательских разработках в области обучения с подкреплением, включая статьи, исследовательскую деятельность и текущие области исследований в Microsoft Research.

Следующие шаги

Узнайте о лучших сценариях для Персонализатора