Az ügyfelek élettartamának és adatváltozásának meghatározása az Azure AI-szolgáltatásokkal

Data Lake Storage
Databricks
Machine Learning
Analysis Services

Ez a forgatókönyv egy olyan megoldást mutat be, amellyel prediktív modellek hozhatók létre az ügyfelek élettartamának értékéről és az adatváltozási arányról az Azure AI-technológiák használatával. Az ügyfél élettartamának értéke az ügyfél nettó nyereségét méri. Ez a metrika az ügyfél és a vállalat közötti teljes kapcsolatból származó profitot is tartalmazza. A lemorzsolódási vagy adatváltozási ráta egy adott időszakban a csoportból kifelé mozgó személyek vagy elemek számát méri.

Ez a kiskereskedelmi ügyfélforgatókönyv a marketing- és gazdasági intézkedések alapján sorolja be az ügyfeleket. Ez a forgatókönyv több metrikán alapuló ügyfélszegmentálást is létrehoz. Betanítja a többosztályos osztályozót az új adatokra. Az eredményként kapott modell egy rendszeresen ütemezett Azure Databricks-jegyzetfüzet-feladaton keresztül pontszámot ad az új ügyfélrendelések kötegeinek.

Ez a megoldás a következő Azure AI-technológiák összekapcsolásának módját mutatja be:

  • Az Azure Data Lake és az Azure Databricks használatával ajánlott eljárásokat valósíthat meg az adatműveletekhez.
  • Az Azure Databricks használatával feltáró jellegű adatelemzést hajthat végre.
  • Egy Sklearn gépi tanulási modell kötegelt kísérletes betanítása az Azure Databricksben.
  • Gépi tanulási kísérletek nyomon követéséhez használja az MLflow-t.
  • Kötegelt pontozási gépi tanulási modellek az Azure Databricksben.
  • Az Azure Machine Learning használatával modellezheti a regisztrációt és az üzembe helyezést.
  • Az MLOps-folyamat vezénylése Azure Data Factory és Azure Databricks-jegyzetfüzetek használatával.

Lehetséges használati esetek

Ez a megoldás ideális a kiskereskedelem számára. A következő használati esetekben hasznos:

  • A marketingben annak meghatározása, hogy mennyit kell költeni egy ügyfél beszerzésére.
  • A termékcsapatok számára, hogy a termékeket és szolgáltatásokat a legjobb ügyfeleiknek szabják testre.
  • Az ügyféltámogatás érdekében döntse el, hogy mennyit költsön a szolgáltatásra, és tartsa meg az ügyfelet.
  • Az értékesítési képviselők számára döntse el, hogy milyen típusú ügyfelek töltik a legtöbb időt a beszerzéssel.

Architektúra

Architektúradiagram az ügyfelek élettartamának és adatváltozásának az Azure AI-szolgáltatások használatával történő meghatározásához.

Töltse le az architektúra Visio-fájlját.

Adatfolyam

  1. Betöltés és vezénylés: Az ügyfél korábbi, tranzakciós és harmadik féltől származó adatainak betöltése helyszíni adatforrásokból. Használja Azure Data Factory, és tárolja az eredményeket Azure Data Lake Storage.

  2. Adatfeldolgozás: Az Azure Databricks használatával vegye fel és törölje a nyers adatokat a Data Lake Storage. Tárolja az adatokat az ezüst rétegben Azure Data Lake Storage.

  3. Szolgáltatásfejlesztés: Az Azure Databricks használatával adatokat tölthet be a Data Lake Storage ezüst rétegéből. A PySpark használatával bővítse az adatokat. Az előkészítést követően a funkciófejlesztéssel jobban ábrázolhatja az adatokat. A funkciófejlesztés a gépi tanulási algoritmus teljesítményét is javíthatja.

  4. Modellbetanítás: A modellbetanításban az ezüstszintű adatok a modell betanítási adatkészletei. Az MLflow használatával kezelheti a gépi tanulási kísérleteket. Az MLflow nyomon követi a gépi tanulási kísérlet kiértékeléséhez szükséges összes metrikát.

    Az MLflow-paraméterek modellhez kapcsolódó paramétereket, például betanítási hiperparamétereket tárolnak. Az MLflow-metrikák modellteljesítmény-metrikákat tárolnak. A gépi tanulási modell iteratívan újratanul Azure Data Factory folyamatokkal. A modell újratanítási folyamata frissíti a betanítási adatokat a Azure Data Lake Storage, és újratanítást ad a modellnek. A modell újratanítási folyamata a következő feltételekkel indul el:

    • Ha a jelenlegi modell pontossága az éles környezetben az MLflow által nyomon követett küszöbérték alá csökken.
    • Amikor a naptár eseményindítói az ügyfél által meghatározott szabályok alapján érnek el.
    • Adateltolódás észlelésekor.
  5. Gépi tanulási beállításjegyzék: Egy Azure Data Factory folyamat regisztrálja a legjobb gépi tanulási modellt az Azure Machine Learning Service-ben a kiválasztott metrikáknak megfelelően. A gépi tanulási modell üzembe helyezése a Azure Kubernetes Service használatával történik.

  6. Kiszolgálási fázis: A kiszolgálási fázisban jelentéskészítési eszközökkel dolgozhat a modell előrejelzéseivel. Ezek közé az eszközök közé tartozik a Power BI és az Azure Analyses Services.

Összetevők

  • Azure Analysis Services nagyvállalati szintű adatmodelleket biztosít a felhőben.

  • Azure Data Factory olyan adatintegrációs és átalakítási réteget biztosít, amely a digitális átalakítási kezdeményezéseken keresztül működik.

  • Az Azure Databricks a Microsoft Azure felhőszolgáltatási platformra optimalizált adatelemzési platform.

  • Az Azure Machine Learning számos olyan élményt tartalmaz, amelyek a gépi tanulási modellek létrehozásához, betanítása és üzembe helyezéséhez, valamint a csapatmunka elősegítéséhez szükségesek.

  • Azure SQL Database egy adatbázismotor, amely a legtöbb felügyeleti funkciót az Ön közreműködése nélkül kezeli. Azure SQL Database lehetővé teszi, hogy a vállalat tartományspecifikus adatbázis-felügyeleti és -optimalizálási tevékenységeire összpontosítson.

  • Az MLflow egy nyílt forráskódú platform a teljes körű gépi tanulási életciklus kezelésére.

Alternatív megoldások

  • A Data Factory vezényli az adatfolyam munkafolyamatait. Ha csak egyszer vagy igény szerint szeretne adatokat betölteni, használjon olyan eszközöket, mint a SQL Server tömeges másolás és az AzCopy az adatok Azure Blob Storage való másolásához. Ezután közvetlenül betöltheti az adatokat Azure Synapse Analyticsbe a PolyBase használatával.

  • Előfordulhat, hogy egyes üzletiintelligencia-eszközök nem támogatják a Azure Analysis Services. A válogatott adatok közvetlenül Azure SQL Database-ből érhetők el. Az adatok tárolása Azure Data Lake Storage használatával történik, és az Azure Databricks Storage használatával történik adatfeldolgozás céljából.

Megfontolandó szempontok

Rendelkezésre állás

Az Azure-összetevők redundancián keresztül és a szolgáltatásiszint-szerződésekben (SLA-kban) meghatározottak szerint kínálják a rendelkezésre állást:

Méretezhetőség

Ez a forgatókönyv Azure Data Lake Storage használ a gépi tanulási modellek és előrejelzések adatainak tárolására. Az Azure Storage méretezhető. Sok exabájtnyi adatot képes tárolni és kiszolgálni. Ez a tárterület gigabit/másodpercben (Gbps) mért átviteli sebességgel érhető el. A feldolgozás kérelemenként közel állandó késéssel fut. A késéseket a szolgáltatás, a fiók és a fájl szintjén méri a rendszer.

Ez a forgatókönyv Azure Databricks-fürtöket használ, amelyek alapértelmezés szerint engedélyezik az automatikus skálázást. Az automatikus skálázás lehetővé teszi, hogy a Databricks futásidőben dinamikusan újratelepítse az erőforrásokat. Az automatikus méretezéssel nem kell a számítási feladatnak megfelelő fürtöt elindítania, ami megkönnyíti a magas fürthasználat elérését.

Biztonság

Az eszközök védelme az Azure-ból származó hálózati forgalom, a helyszíni és az Azure által üzemeltetett erőforrások, valamint az Azure-ba érkező és onnan érkező forgalom vezérlésével. Az Azure saját üzemeltetésű integrációs modulja például biztonságosan áthelyezi az adatokat a helyszíni adattárból az Azure-ba.

Az Azure Key Vault és a Databricks hatókörön belüli titkos kód használatával férhet hozzá az adatokhoz Azure Data Lake Storage.

Az Azure-szolgáltatások biztonságos virtuális hálózaton vannak üzembe helyezve, vagy az Azure Private Link funkcióval érhetők el. Szükség esetén a sorszintű biztonság részletes hozzáférést biztosít Azure Analysis Services vagy SQL Database egyes felhasználói számára.

Költségoptimalizálás

Az Azure Databricks egy prémium szintű Apache Spark-ajánlat, amely társított költségekkel rendelkezik.

A Databricks standard és prémium tarifacsomagjai vannak. Ebben a forgatókönyvben a standard tarifacsomag elegendő. Ha az alkalmazásnak a nagyobb számítási feladatok vagy interaktív Databricks-irányítópultok kezeléséhez automatikus skálázási fürtökre van szüksége, akkor szükség lehet a prémium szintre.

Az ezzel a használati esettel kapcsolatos költségek a következő szolgáltatások általános díjszabásától függenek:

Az Azure-termékek és -konfigurációk költségeinek becsléséhez látogasson el az Azure díjkalkulátorára.

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerző:

Következő lépések