Azure를 사용한 소매 제품 추천

Blob Storage
Event Hubs
HDInsight
Stream Analytics
Power BI

솔루션 아이디어

잠재적인 사용 사례, 대체 서비스, 구현 고려 사항 또는 가격 책정 지침과 같은 추가 정보를 사용 하 여이 문서를 확장 하는 것을 확인 하려면 GitHub 피드백을 통해 알려주세요.

고객 관심사와 구매 패턴을 자세히 이해 하는 것은 소매 비즈니스 인텔리전스 작업의 중요 한 구성 요소입니다. 이 솔루션은 고객 데이터를 전체 프로필로 집계 하는 프로세스를 구현 합니다. 고급 기계 학습 모델은 Azure의 안정성 및 처리 기능을 통해 시뮬레이션 된 고객에 대 한 예측 정보를 제공 합니다.

아키텍처

아키텍처 다이어그램이 아키텍처의 SVG 를 다운로드 합니다.

데이터 흐름

  1. 데이터 생성기는 시뮬레이션 된 고객 이벤트를 이벤트 허브로 파이프 합니다.
  2. Stream Analytics 작업은 이벤트 허브에서 읽고 집계를 수행 합니다.
  3. Stream Analytics Azure Storage Blob에 시간 그룹화 된 데이터를 유지 합니다.
  4. HDInsight에서 실행 되는 Spark 작업은 최신 고객 검색 데이터를 과거 구매 및 인구 통계 데이터와 병합 하 여 결합 된 사용자 프로필을 작성 합니다.
  5. 두 번째 Spark 작업은 기계 학습 모델에 대해 각 고객 프로필의 점수를 가집니다. 이 프로세스는 지정 된 고객이 향후 30 일 이내에 구매할 가능성이 있는지 여부를 결정 하는 향후 구매 패턴을 예측 합니다. 그렇다면 구매 하는 제품 범주를 확인할 수 있습니다.
  6. 예측 및 기타 프로필 데이터는 Power BI 온라인에서 시각화 되 고 차트 및 테이블로 공유 됩니다.

구성 요소

시나리오 배포

이 솔루션을 빌드하는 방법에 대 한 자세한 내용은 GitHub의 솔루션 가이드를 참조 하세요.

일반적인 소매 비즈니스는 다양 한 채널을 통해 고객 데이터를 수집 합니다. 이러한 채널에는 웹 검색 패턴, 구매 동작, 인구 통계 및 기타 세션 기반 웹 데이터가 포함 됩니다. 일부 데이터는 핵심 비즈니스 작업에서 발생 합니다. 그러나 파트너, 제조업체, 공용 도메인 등의 외부 원본에서 다른 데이터를 끌어오고 조인 해야 합니다.

많은 기업에서 사용 가능한 데이터의 일부만 활용 하지만 ROI를 최대화 하기 위해 비즈니스는 모든 원본의 관련 데이터를 통합 해야 합니다. 일반적으로 외부의 다른 유형의 데이터 원본을 공유 데이터 처리 엔진에 통합 하면 상당한 노력 및 설정 리소스가 필요 합니다. 이 솔루션은 분석 및 기계 학습을 통합 하 여 고객 구매 활동을 예측 하는 간단 하 고 확장 가능한 방법을 설명 합니다.

솔루션 기능

이 솔루션은 위의 문제를 해결 합니다.

  • 데이터 이동 및 시스템 복잡성을 최소화 하는 동시에 여러 데이터 원본에서 데이터에 일관 되 게 액세스 하 여 성능을 향상 시킵니다.
  • 예측 Machine Learning 모델을 사용 하는 데 필요한 ETL 및 기능 엔지니어링을 수행 합니다.
  • 분산 시스템에서 실행 되는 예측 분석에서 보강 하는 포괄적인 고객 360 프로필을 만듭니다. 이 분석은 Microsoft R Server 및 Azure HDInsight에서 지원 됩니다.

다음 단계