Создание системы рекомендаций на основе содержимого

Azure Databricks
Машинное обучение Azure

Идеи решения

Эта статья является идеей решения. Если вы хотите расширить содержимое с дополнительными сведениями, такими как потенциальные варианты использования, альтернативные службы, рекомендации по реализации или рекомендации по ценам, сообщите нам, предоставив отзыв GitHub.

Рекомендации является ключевым драйвером доходов для многих предприятий и используется в различных отраслях промышленности, включая розничные, новости и средства массовой информации. Благодаря доступности больших объемов данных о действиях клиентов вы можете предоставлять высоко релевантные рекомендации с помощью машинного обучения.

Архитектура

Architectural diagram that shows training, evaluation, and development of a machine learning model for content-based personalization that uses Azure Databricks.

Скачайте файл PowerPoint этой архитектуры.

Поток данных

  1. Сохранение. Azure Data Lake служба хранилища хранит большие объемы данных о поведении пользователей и потребителей.

  2. Чтение. Azure Databricks подключается и считывается из Azure Data Lake служба хранилища. Прием данных в Databricks позволяет предварительно обработать и обучать для регистрации модели.

  3. Предварительной обработки. Предварительная обработка данных очищает, преобразует и подготавливает данные для отправки в модель системы рекомендаций.

  4. Железнодорожного. Учебный курс состоит из двух этапов: проектирование признаков и обучение модели. Во время обучения модели Azure Databricks использует предварительно обработанный набор данных для обучения и объяснения поведения оптимальной модели рекомендаций.

  5. Postprocess. После обработки используется оценка и выбор модели на основе оптимальной модели.

  6. Развертывание. Azure Databricks поддерживает модель. Управляемые пакетной службой конечные точки развертывают модель для отображения внешнего интерфейса. По мере развертывания модели новые данные доступны с помощью новых конечных точек. Поддерживаются рекомендации по пакетной службе и практически в режиме реального времени.

  7. Написать. Пользовательские интерфейсы, такие как веб-приложения, могут использовать результаты хранимой модели. Результаты записываются в Azure Synapse и записываются в них. Модель выполняется как пакетное вывод и сохраняет результаты в соответствующем хранилище данных.

Компоненты

В этой архитектуре используются следующие компоненты:

  • Azure Data Lake служба хранилища — это набор возможностей хранения, предназначенных для аналитики больших данных и обеспечивающих семантику файловой системы, безопасность на уровне файлов и масштабирование.

  • Azure Databricks — это управляемый кластер Apache Spark для обучения и оценки моделей.

  • Azure Synapse Analytics — это быстрое, гибкое и надежное облачное хранилище данных, которое позволяет масштабировать, вычислять и хранить эластично и независимо друг от друга с архитектурой массовой параллельной обработки.

Подробности сценария

Описанный в этой статье подход посвящен созданию системы рекомендаций на основе содержимого. Дополнительные сведения о рекомендациях по созданию систем рекомендаций см. в документации и примерах рекомендаций на сайте GitHub.

В этом примере показано, как использовать машинное обучение для автоматизации персонализации на основе контента для клиентов. Решение использует Azure Databricks для обучения модели, которая прогнозирует вероятность того, что пользователь будет заинтересован в элементе. пакетные управляемые конечные точки развертывают модель как службу прогнозирования. Эту службу можно использовать для создания персонализированных рекомендаций путем ранжирования элементов на основе содержимого, в который, скорее всего, заинтересован пользователь.

Потенциальные варианты использования

Это решение идеально подходит для розничной промышленности. Это относится к следующим вариантам использования:

  • Рекомендации по контенту для веб-сайтов и мобильных приложений
  • Рекомендации по продуктам для сайтов электронной коммерции
  • Отображаемые рекомендации по объявлению для веб-сайтов

Типы систем рекомендаций

Существует три основных типа систем рекомендаций:

  • Совместная фильтрация. Совместная фильтрация выявляет схожие модели поведения клиентов и рекомендует товары, с которыми взаимодействовали другие похожие клиенты. Преимущество совместной фильтрации — это простота создания данных — пользователи создают данные при взаимодействии с списками элементов и продуктов. Кроме того, клиенты могут обнаруживать новые элементы и продукты, отличные от тех, которые курируются из их исторических взаимодействий. Однако недостатком совместной фильтрации является проблема холодного запуска : так как между пользователями и новыми предложениями недостаточно взаимодействия, новые добавленные элементы не рекомендуется алгоритмом, который полностью зависит от взаимодействия с клиентом.

  • На основе содержимого. Рекомендация на основе содержимого использует сведения о элементах, чтобы узнать предпочтения клиентов, и рекомендует элементы, которые совместно используют свойства с элементами, с которыми ранее взаимодействовал клиент. Системы рекомендаций на основе содержимого не препятствуют проблеме холодного запуска и могут адаптироваться к внедрению новых элементов. Однако рекомендации ограничены функциями исходного элемента, с которым взаимодействует клиент.

  • Гибридный метод. Еще одним подходом к созданию систем рекомендаций является сочетание содержимого и совместной фильтрации. Эта система рекомендует элементы на основе оценок пользователей и сведений о элементах. Гибридный подход имеет преимущества как совместного фильтрации, так и рекомендаций на основе содержимого.

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участник.

Автор субъекта:

  • Скотт Грэм | Основной Специалист по обработке и анализу данных

Другие участник:

  • Эндрю Аджалува | Диспетчер программ
  • Гэри Мур | Программист или писатель

Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.

Следующие шаги