Customer 360Customer 360

Концепция решения Solution Idea

Если вы хотите ознакомиться с этой статьей, дополнительные сведения (сведения о реализации, рекомендации по ценам, примеры кода и т. д.), сообщите нам о отзывах в GitHub!If you'd like to see us expand this article with more information (implementation details, pricing guidance, code examples, etc), let us know with GitHub Feedback!

Глубокое понимание интересов клиентов и шаблонов закупок является важнейшим компонентом любой операции бизнес-аналитики в розничной торговле.A deep understanding between customer interests and purchasing patterns is a critical component of any retail business intelligence operation. Это решение реализует процесс агрегирования данных клиента в профиле "360" и использует расширенные модели машинного обучения, поддерживающие надежность и вычислительную мощность Azure, чтобы обеспечить прогнозную аналитику для имитации клиентов.This solution implements a process of aggregating customer data into a "360-degree" profile, and uses advanced machine learning models backed by the reliability and processing power of Azure to provide predictive insights on simulated customers.

АрхитектураArchitecture

Схема архитектуры . Скачайте SVG этой архитектуры.Architecture diagram Download an SVG of this architecture.

ОписаниеDescription

Дополнительные сведения о построении этого решения см. в разделе Руководство по решению на сайте GitHub.For more details on how this solution is built, visit the solution guide in GitHub.

Типичная розничная бизнес-деятельность собирает данные клиентов через различные каналы, включая шаблоны веб-обзора, поведения при покупке, демографические данные и другие веб-сведения, основанные на сеансах.A typical retail business collects customer data through a variety of channels, including web-browsing patterns, purchase behaviors, demographics, and other session-based web data. Некоторые данные поступают от основных бизнес-операций, но другие данные должны быть извлечены и присоединены из внешних источников, таких как партнеры, производители, общедоступный домен и т. д.Some of the data originates from core business operations, but other data must be pulled and joined from external sources like partners, manufacturers, public domain, etc.

Многие компании используют только небольшую часть доступных данных, но для повышения рентабельности инвестиций компания должна интегрировать соответствующие данные из всех источников.Many businesses leverage only a small portion of the available data, but in order to maximize ROI, a business must integrate relevant data from all sources. Традиционно интеграция внешних разнородных источников данных в общий механизм обработки данных требует значительных усилий и ресурсов для настройки.Traditionally, the integration of external, heterogeneous data sources into a shared data processing engine has required significant effort and resources to set up. Это решение описывает простой и масштабируемый подход к интеграции аналитики и машинного обучения для прогнозирования действий по приобретению клиентов.This solution describes a simple, scalable approach to integrating analytics and machine learning to predict customer purchasing activity.

Решение профиля клиента 360 решает указанные выше проблемы, выполнив следующие действия.The Customer 360 Profile solution addresses the above problems by:

  • Единообразный доступ к данным из нескольких источников данных и минимизация перемещения данных и сложности системы для повышения производительности.Uniformly accessing data from multiple data sources while minimizing data movement and system complexity in order to boost performance.
  • Выполнение ETL и проектирование признаков, необходимое для использования прогнозной Машинное обучение модели.Performing ETL and feature engineering needed to use a predictive Machine Learning model.
  • Создание комплексного профиля клиента 360, дополненного прогнозной аналитикой, выполняемой в распределенной системе с помощью Microsoft R Server и Azure HDInsight.Creating a comprehensive customer 360 profile enriched by predictive analytics running across a distributed system backed by Microsoft R Server and Azure HDInsight.

Поток данныхData Flow

  1. Каналы генератора данных моделируют события клиента в концентратор событийA Data Generator pipes simulated customer events to an Event Hub
  2. Stream Analytics задание считывает данные из EventHub, выполняет агрегатыA Stream Analytics job reads from the EventHub, performs aggregations
  3. Stream Analytics сохраняет данные, сгруппированные по времени, в Azure Storage BlobStream Analytics persists time-grouped data to an Azure Storage Blob
  4. Задание Spark, выполняемое в HDInsight, объединяет последние данные обзора клиентов с историческими данными о покупках и демографических данных для создания консолидированного профиля пользователя.A Spark job running in HDInsight merges the latest customer browsing data with historical purchase and demographic data to build a consolidated user profile
  5. Второе задание Spark оценивает каждый клиентский профиль по модели машинного обучения для прогнозирования будущих шаблонов покупки (иными словами, является ли клиент, который, вероятно, закупает покупку в течение следующих 30 дней, и если да, в какой категории продуктов?)A second Spark job scores each customer profile against a machine learning model to predict future purchasing patterns (in other words, is a given customer likely to make a purchase in the next 30 days, and if so, in which product category?)
  6. Прогнозы и другие данные профиля отображаются и совместно используются в виде диаграмм и таблиц в Power BI в сетиPredictions and other profile data are visualized and shared as charts and tables in Power BI Online