Анализ и расшифровка

Алгоритм анализа в Персонализаторе улучшает результаты персонализации даже после изменения поведения пользователя.

После получения вызова ранжирования Персонализатор возвращает ответ RewardActionID, который либо:

  • с помощью функции расшифровки сопоставляет наиболее вероятное поведение пользователя на основе текущей модели машинного обучения;
  • использует функцию анализа, которая не сопоставляет действие с наибольшей вероятностью в ранге.

Сейчас Персонализатор выполняет анализ с помощью жадного алгоритма Epsilon.

Выбор параметра анализа

Вы настраиваете процент трафика, который будет использоваться для исследования на странице Настройки портала Azure для Персонализатора. Этот параметр определяет процент анализируемых вызовов ранжирования.

Персонализатор определяет, что нужно делать в каждом вызове ранжирования с этой вероятностью: анализировать или расшифровывать. Это отличается от поведения некоторых платформ A/B-тестирования, блокирующих воздействие на определенные идентификаторы пользователей.

Рекомендации по выбору параметра анализа

Параметр анализа позволяет определить долю исследуемых взаимодействий пользователей, что улучшает саму модель.

Значение 0 нивелирует многие преимущества Персонализатора. В этом случае Персонализатор не использует данные о взаимодействиях пользователя, чтобы улучшить модель. Это приводит к застою, смещению и в конечном счете снижению производительности модели.

Слишком высокое значение параметра нивелирует преимущества обучения на основе поведения пользователя. Значение 100% подразумевает постоянный случайный выбор, а любое поведение пользователей не может повлиять на результат.

Очень важно не изменять поведение приложения на основе действия Персонализатора (анализ или расшифровка). Это может привести к смещению обучения, что в конечном счете снижает потенциальную производительность.

Дальнейшие действия

Обучение с подкреплением