Создание системы рекомендаций на основе содержимого

Azure Databricks

Машинное обучение Azure

Идеи решения

Эта статья является идеей решения. Если вы хотите расширить содержимое с дополнительными сведениями, такими как потенциальные варианты использования, альтернативные службы, рекомендации по реализации или рекомендации по ценам, сообщите нам, предоставив отзыв GitHub.

Рекомендации является ключевым драйвером доходов для многих предприятий и используется в различных отраслях промышленности, включая розничные, новости и средства массовой информации. Благодаря доступности больших объемов данных о действиях клиентов вы можете предоставлять высоко релевантные рекомендации с помощью машинного обучения.

Архитектура

Скачайте файл PowerPoint этой архитектуры.

Поток данных

Сохранение. Azure Data Lake служба хранилища хранит большие объемы данных о поведении пользователей и потребителей.
Чтение. Azure Databricks подключается и считывается из Azure Data Lake служба хранилища. Прием данных в Databricks позволяет предварительно обработать и обучать для регистрации модели.
Предварительной обработки. Предварительная обработка данных очищает, преобразует и подготавливает данные для отправки в модель системы рекомендаций.
Железнодорожного. Учебный курс состоит из двух этапов: проектирование признаков и обучение модели. Во время обучения модели Azure Databricks использует предварительно обработанный набор данных для обучения и объяснения поведения оптимальной модели рекомендаций.
Postprocess. После обработки используется оценка и выбор модели на основе оптимальной модели.
Развертывание. Azure Databricks поддерживает модель. Управляемые пакетной службой конечные точки развертывают модель для отображения внешнего интерфейса. По мере развертывания модели новые данные доступны с помощью новых конечных точек. Поддерживаются рекомендации по пакетной службе и практически в режиме реального времени.
Написать. Пользовательские интерфейсы, такие как веб-приложения, могут использовать результаты хранимой модели. Результаты записываются в Azure Synapse и записываются в них. Модель выполняется как пакетное вывод и сохраняет результаты в соответствующем хранилище данных.

Компоненты

В этой архитектуре используются следующие компоненты:

Azure Data Lake служба хранилища — это набор возможностей хранения, предназначенных для аналитики больших данных и обеспечивающих семантику файловой системы, безопасность на уровне файлов и масштабирование.
Azure Databricks — это управляемый кластер Apache Spark для обучения и оценки моделей.
Azure Synapse Analytics — это быстрое, гибкое и надежное облачное хранилище данных, которое позволяет масштабировать, вычислять и хранить эластично и независимо друг от друга с архитектурой массовой параллельной обработки.

Подробности сценария

Описанный в этой статье подход посвящен созданию системы рекомендаций на основе содержимого. Дополнительные сведения о рекомендациях по созданию систем рекомендаций см. в документации и примерах рекомендаций на сайте GitHub.

В этом примере показано, как использовать машинное обучение для автоматизации персонализации на основе контента для клиентов. Решение использует Azure Databricks для обучения модели, которая прогнозирует вероятность того, что пользователь будет заинтересован в элементе. пакетные управляемые конечные точки развертывают модель как службу прогнозирования. Эту службу можно использовать для создания персонализированных рекомендаций путем ранжирования элементов на основе содержимого, в который, скорее всего, заинтересован пользователь.

Потенциальные варианты использования

Это решение идеально подходит для розничной промышленности. Это относится к следующим вариантам использования:

Рекомендации по контенту для веб-сайтов и мобильных приложений
Рекомендации по продуктам для сайтов электронной коммерции
Отображаемые рекомендации по объявлению для веб-сайтов

Типы систем рекомендаций

Существует три основных типа систем рекомендаций:

Совместная фильтрация. Совместная фильтрация выявляет схожие модели поведения клиентов и рекомендует товары, с которыми взаимодействовали другие похожие клиенты. Преимущество совместной фильтрации — это простота создания данных — пользователи создают данные при взаимодействии с списками элементов и продуктов. Кроме того, клиенты могут обнаруживать новые элементы и продукты, отличные от тех, которые курируются из их исторических взаимодействий. Однако недостатком совместной фильтрации является проблема холодного запуска : так как между пользователями и новыми предложениями недостаточно взаимодействия, новые добавленные элементы не рекомендуется алгоритмом, который полностью зависит от взаимодействия с клиентом.
На основе содержимого. Рекомендация на основе содержимого использует сведения о элементах, чтобы узнать предпочтения клиентов, и рекомендует элементы, которые совместно используют свойства с элементами, с которыми ранее взаимодействовал клиент. Системы рекомендаций на основе содержимого не препятствуют проблеме холодного запуска и могут адаптироваться к внедрению новых элементов. Однако рекомендации ограничены функциями исходного элемента, с которым взаимодействует клиент.
Гибридный метод. Еще одним подходом к созданию систем рекомендаций является сочетание содержимого и совместной фильтрации. Эта система рекомендует элементы на основе оценок пользователей и сведений о элементах. Гибридный подход имеет преимущества как совместного фильтрации, так и рекомендаций на основе содержимого.

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участник.

Автор субъекта:

Скотт Грэм | Основной Специалист по обработке и анализу данных

Другие участник:

Эндрю Аджалува | Диспетчер программ
Гэри Мур | Программист или писатель

Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.

Следующие шаги

Дополнительные примеры, учебники и инструменты, которые помогут вам создать собственную систему рекомендаций, см. в статье "Рекомендации Майкрософт", репозиторий GitHub.
См. статью "Создание систем рекомендаций с Машинное обучение Azure службой" в блоге Microsoft Azure.

Создание системы рекомендаций на основе содержимого

Архитектура

Поток данных

Компоненты

Подробности сценария

Потенциальные варианты использования

Типы систем рекомендаций

Соавторы

Следующие шаги

Обратная связь

Обратная связь

Дополнительные ресурсы

Создание системы рекомендаций на основе содержимого

Архитектура

Поток данных

Компоненты

Подробности сценария

Потенциальные варианты использования

Типы систем рекомендаций

Соавторы

Следующие шаги

Связанные ресурсы

Обратная связь

Обратная связь

Дополнительные ресурсы