Идеи решения
Эта статья является идеей решения. Если вы хотите расширить содержимое с дополнительными сведениями, такими как потенциальные варианты использования, альтернативные службы, рекомендации по реализации или рекомендации по ценам, сообщите нам, предоставив отзыв GitHub.
Рекомендации является ключевым драйвером доходов для многих предприятий и используется в различных отраслях промышленности, включая розничные, новости и средства массовой информации. Благодаря доступности больших объемов данных о действиях клиентов вы можете предоставлять высоко релевантные рекомендации с помощью машинного обучения.
Архитектура
Скачайте файл PowerPoint этой архитектуры.
Поток данных
Сохранение. Azure Data Lake служба хранилища хранит большие объемы данных о поведении пользователей и потребителей.
Чтение. Azure Databricks подключается и считывается из Azure Data Lake служба хранилища. Прием данных в Databricks позволяет предварительно обработать и обучать для регистрации модели.
Предварительной обработки. Предварительная обработка данных очищает, преобразует и подготавливает данные для отправки в модель системы рекомендаций.
Железнодорожного. Учебный курс состоит из двух этапов: проектирование признаков и обучение модели. Во время обучения модели Azure Databricks использует предварительно обработанный набор данных для обучения и объяснения поведения оптимальной модели рекомендаций.
Postprocess. После обработки используется оценка и выбор модели на основе оптимальной модели.
Развертывание. Azure Databricks поддерживает модель. Управляемые пакетной службой конечные точки развертывают модель для отображения внешнего интерфейса. По мере развертывания модели новые данные доступны с помощью новых конечных точек. Поддерживаются рекомендации по пакетной службе и практически в режиме реального времени.
Написать. Пользовательские интерфейсы, такие как веб-приложения, могут использовать результаты хранимой модели. Результаты записываются в Azure Synapse и записываются в них. Модель выполняется как пакетное вывод и сохраняет результаты в соответствующем хранилище данных.
Компоненты
В этой архитектуре используются следующие компоненты:
Azure Data Lake служба хранилища — это набор возможностей хранения, предназначенных для аналитики больших данных и обеспечивающих семантику файловой системы, безопасность на уровне файлов и масштабирование.
Azure Databricks — это управляемый кластер Apache Spark для обучения и оценки моделей.
Azure Synapse Analytics — это быстрое, гибкое и надежное облачное хранилище данных, которое позволяет масштабировать, вычислять и хранить эластично и независимо друг от друга с архитектурой массовой параллельной обработки.
Подробности сценария
Описанный в этой статье подход посвящен созданию системы рекомендаций на основе содержимого. Дополнительные сведения о рекомендациях по созданию систем рекомендаций см. в документации и примерах рекомендаций на сайте GitHub.
В этом примере показано, как использовать машинное обучение для автоматизации персонализации на основе контента для клиентов. Решение использует Azure Databricks для обучения модели, которая прогнозирует вероятность того, что пользователь будет заинтересован в элементе. пакетные управляемые конечные точки развертывают модель как службу прогнозирования. Эту службу можно использовать для создания персонализированных рекомендаций путем ранжирования элементов на основе содержимого, в который, скорее всего, заинтересован пользователь.
Потенциальные варианты использования
Это решение идеально подходит для розничной промышленности. Это относится к следующим вариантам использования:
- Рекомендации по контенту для веб-сайтов и мобильных приложений
- Рекомендации по продуктам для сайтов электронной коммерции
- Отображаемые рекомендации по объявлению для веб-сайтов
Типы систем рекомендаций
Существует три основных типа систем рекомендаций:
Совместная фильтрация. Совместная фильтрация выявляет схожие модели поведения клиентов и рекомендует товары, с которыми взаимодействовали другие похожие клиенты. Преимущество совместной фильтрации — это простота создания данных — пользователи создают данные при взаимодействии с списками элементов и продуктов. Кроме того, клиенты могут обнаруживать новые элементы и продукты, отличные от тех, которые курируются из их исторических взаимодействий. Однако недостатком совместной фильтрации является проблема холодного запуска : так как между пользователями и новыми предложениями недостаточно взаимодействия, новые добавленные элементы не рекомендуется алгоритмом, который полностью зависит от взаимодействия с клиентом.
На основе содержимого. Рекомендация на основе содержимого использует сведения о элементах, чтобы узнать предпочтения клиентов, и рекомендует элементы, которые совместно используют свойства с элементами, с которыми ранее взаимодействовал клиент. Системы рекомендаций на основе содержимого не препятствуют проблеме холодного запуска и могут адаптироваться к внедрению новых элементов. Однако рекомендации ограничены функциями исходного элемента, с которым взаимодействует клиент.
Гибридный метод. Еще одним подходом к созданию систем рекомендаций является сочетание содержимого и совместной фильтрации. Эта система рекомендует элементы на основе оценок пользователей и сведений о элементах. Гибридный подход имеет преимущества как совместного фильтрации, так и рекомендаций на основе содержимого.
Соавторы
Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участник.
Автор субъекта:
- Скотт Грэм | Основной Специалист по обработке и анализу данных
Другие участник:
- Эндрю Аджалува | Диспетчер программ
- Гэри Мур | Программист или писатель
Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.
Следующие шаги
Дополнительные примеры, учебники и инструменты, которые помогут вам создать собственную систему рекомендаций, см. в статье "Рекомендации Майкрософт", репозиторий GitHub.
См. статью "Создание систем рекомендаций с Машинное обучение Azure службой" в блоге Microsoft Azure.