Určení životnosti zákazníků a četnosti změn pomocí služeb Azure AI

Azure Data Lake Storage
Azure Databricks
Azure Machine Learning
Azure Analysis Services

Tento scénář ukazuje řešení pro vytváření prediktivních modelů hodnoty životnosti zákazníka a četnost změn pomocí technologií Azure AI.

Architektura

Diagram architektury pro scénář k určení doby života a četnosti změn zákazníků pomocí služeb Azure AI

Stáhněte si soubor aplikace Visio s touto architekturou.

Tok dat

  1. Příjem a orchestrace: Ingestování historických dat, transakčních dat a dat třetích stran pro zákazníka z místních zdrojů dat. Použijte Azure Data Factory a uložte výsledky ve službě Azure Data Lake Storage.

  2. Zpracování dat: Pomocí Azure Databricks můžete vyzvednout a vyčistit nezpracovaná data ze služby Data Lake Storage. Uložte data ve stříbrné vrstvě ve službě Azure Data Lake Storage.

  3. Příprava funkcí: Pomocí Azure Databricks načtěte data ze stříbrné vrstvy Data Lake Storage. K obohacení dat použijte PySpark . Po přípravě využijte funkci přípravy k zajištění lepší reprezentace dat. Příprava funkcí může také zlepšit výkon algoritmu strojového učení.

  4. Trénování modelu: Při trénování modelu jsou daty úrovně Silver datovou sadou trénování modelu. MLflow můžete použít ke správě experimentů strojového učení. MLflow sleduje všechny metriky, které potřebujete k vyhodnocení experimentu strojového učení.

    Parametry MLflow ukládají parametry související s modelem, například trénování hyperparametrů. Metriky MLflow ukládají metriky výkonu modelu. Model strojového učení iterativním způsobem přetrénuje pomocí kanálů Azure Data Factory. Kanál opětovného trénování modelu získá aktualizovaná trénovací data ze služby Azure Data Lake Storage a model znovu natrénuje. Kanál opětovného trénování modelu se spustí v následujících podmínkách:

    • Když přesnost aktuálního modelu v produkčním prostředí klesne pod prahovou hodnotu, kterou sleduje MLflow.
    • Když dojde k aktivaci kalendáře na základě definovaných pravidel zákazníka.
    • Při zjištění posunu dat
  5. Registr strojového učení: Kanál služby Azure Data Factory registruje nejlepší model strojového učení ve službě Azure Machine Učení Service podle zvolených metrik. Model strojového učení se nasadí pomocí služby Azure Kubernetes Service.

  6. Fáze obsluhy: V obslužné fázi můžete pomocí nástrojů pro vytváření sestav pracovat s predikcemi modelu. Mezi tyto nástroje patří Power BI a Azure Analyzes Services.

Komponenty

  • Azure Analysis Services poskytuje datové modely na podnikové úrovni v cloudu.

  • Azure Data Factory poskytuje vrstvu integrace a transformace dat, která funguje napříč iniciativami digitální transformace.

  • Azure Databricks je platforma pro analýzu dat optimalizovaná pro cloudovou platformu Microsoft Azure.

  • Azure Machine Učení zahrnuje celou řadu prostředí pro sestavování, trénování a nasazování modelů strojového učení a podporu týmové spolupráce.

  • Azure SQL Database je databázový stroj, který zpracovává většinu funkcí správy bez vašeho zapojení. Azure SQL Database umožňuje zaměřit se na aktivity správy a optimalizace databáze specifické pro doménu pro vaši firmu.

  • MLflow je opensourcová platforma pro správu kompletního životního cyklu strojového učení.

Alternativy

  • Data Factory orchestruje pracovní postupy pro váš datový kanál. Pokud chcete načíst data jenom jednou nebo na vyžádání, použijte nástroje, jako je hromadné kopírování SQL Serveru a AzCopy, ke kopírování dat do služby Azure Blob Storage. Pak můžete data načíst přímo do Azure Synapse Analytics pomocí PolyBase.

  • Některé nástroje business intelligence nemusí podporovat službu Azure Analysis Services. Kurátorovaná data jsou přístupná přímo ze služby Azure SQL Database. Data se ukládají pomocí Azure Data Lake Storage a přistupují k němu pomocí úložiště Azure Databricks pro zpracování dat.

Podrobnosti scénáře

Hodnota životnosti zákazníka měří čistý zisk od zákazníka. Tato metrika zahrnuje zisk z celého vztahu zákazníka s vaší společností. Četnost změn nebo četnost změn měří počet jednotlivců nebo položek, které se přesouvají ze skupiny za určité období.

Tento scénář maloobchodního zákazníka klasifikuje zákazníky na základě marketingových a ekonomických opatření. Tento scénář také vytvoří segmentaci zákazníků na základě několika metrik. Trénuje klasifikátor s více třídami na nová data. Výsledný model vyhodnotuje dávky nových objednávek zákazníků prostřednictvím pravidelně naplánované úlohy poznámkového bloku Azure Databricks.

Toto řešení ukazuje, jak propojit následující technologie Azure AI:

  • K implementaci osvědčených postupů pro operace s daty použijte Azure Data Lake a Azure Databricks.
  • Pomocí Azure Databricks můžete provádět průzkumnou analýzu dat.
  • Pomocí MLflow můžete sledovat experimenty strojového učení.
  • Dávkové hodnocení modelů strojového učení v Azure Databricks
  • K modelování registrace a nasazení použijte azure Machine Učení.
  • K orchestraci kanálu MLOps použijte poznámkové bloky Azure Data Factory a Azure Databricks.

Potenciální případy použití

Toto řešení je ideální pro maloobchod. Je užitečné v následujících případech použití:

  • V marketingu určete, kolik útraty na získání zákazníka.
  • Pro produktové týmy můžete přizpůsobit produkty a služby svým nejlepším zákazníkům.
  • Pokud potřebujete zákaznickou podporu, rozhodněte se, kolik je potřeba utratit za služby, a zachovat zákazníka.
  • U obchodních zástupců se rozhodněte, jaké typy zákazníků se mají nejvíce věnovat pokusu o získání.

Důležité informace

Tyto aspekty implementují pilíře dobře architektuře Azure, což je sada hlavních principů, které je možné použít ke zlepšení kvality úlohy. Další informace naleznete v tématu Microsoft Azure Well-Architected Framework.

Dostupnost

Komponenty Azure nabízejí dostupnost prostřednictvím redundance a jak je uvedeno ve smlouvách o úrovni služeb (SLA):

Škálovatelnost

Tento scénář používá Azure Data Lake Storage k ukládání dat pro modely a předpovědi strojového učení. Azure Storage je škálovatelný. Může ukládat a obsluhovat mnoho exabajtů dat. Toto množství úložiště je dostupné s propustností měřenou v gigabitech za sekundu (GB/s). Zpracování se spouští s téměř konstantní latencí požadavků. Latence se měří na úrovni služby, účtu a souboru.

Tento scénář používá clustery Azure Databricks, které ve výchozím nastavení umožňují automatické škálování. Automatické škálování umožňuje Databricks během běhu dynamicky relokovat prostředky. S automatickým škálováním nemusíte cluster spouštět, aby odpovídal úloze, což usnadňuje dosažení vysokého využití clusteru.

Zabezpečení

Zabezpečení poskytuje záruky proti záměrným útokům a zneužití cenných dat a systémů. Další informace najdete v tématu Přehled pilíře zabezpečení.

Chraňte prostředky pomocí ovládacích prvků v síťovém provozu pocházejícím z Azure, mezi místními prostředky a hostovanými prostředky Azure a provozem do a z Azure. Prostředí Integration Runtime v místním prostředí Azure například bezpečně přesouvá data z místního úložiště dat do Azure.

Pro přístup k datům ve službě Azure Data Lake Storage použijte tajný kód s vymezeným oborem Azure Key Vault a Databricks.

Služby Azure se nasazují v zabezpečené virtuální síti nebo se k němu přistupují pomocí funkce Azure Private Link. V případě potřeby poskytuje zabezpečení na úrovni řádků podrobný přístup k jednotlivým uživatelům ve službě Azure Analysis Services nebo SQL Database.

Optimalizace nákladů

Optimalizace nákladů se zabývá způsoby, jak snížit zbytečné výdaje a zlepšit efektivitu provozu. Další informace najdete v tématu Přehled pilíře optimalizace nákladů.

Azure Databricks je prémiová nabídka Apache Sparku s přidruženými náklady.

Existují cenové úrovně Standard a Premium Databricks. Pro tento scénář stačí cenová úroveň Standard. Pokud vaše aplikace vyžaduje automatické škálování clusterů pro zpracování větších úloh nebo interaktivních řídicích panelů Databricks, možná budete potřebovat úroveň Premium.

Náklady související s tímto případem použití závisí na standardních cenách následujících služeb pro vaše využití:

Pokud chcete odhadnout náklady na produkty a konfigurace Azure, navštivte cenovou kalkulačku Azure.

Přispěvatelé

Tento článek spravuje Microsoft. Původně byla napsána následujícími přispěvateli.

Hlavní autor:

Další kroky