Ez a forgatókönyv egy olyan megoldást mutat be, amellyel prediktív modellek hozhatók létre az ügyfelek élettartamának értékéről és az adatváltozási arányról az Azure AI-technológiák használatával. Az ügyfél élettartamának értéke az ügyfél nettó nyereségét méri. Ez a metrika az ügyfél és a vállalat közötti teljes kapcsolatból származó profitot is tartalmazza. A lemorzsolódási vagy adatváltozási ráta egy adott időszakban a csoportból kifelé mozgó személyek vagy elemek számát méri.
Ez a kiskereskedelmi ügyfélforgatókönyv a marketing- és gazdasági intézkedések alapján sorolja be az ügyfeleket. Ez a forgatókönyv több metrikán alapuló ügyfélszegmentálást is létrehoz. Betanítja a többosztályos osztályozót az új adatokra. Az eredményként kapott modell egy rendszeresen ütemezett Azure Databricks-jegyzetfüzet-feladaton keresztül pontszámot ad az új ügyfélrendelések kötegeinek.
Ez a megoldás a következő Azure AI-technológiák összekapcsolásának módját mutatja be:
- Az Azure Data Lake és az Azure Databricks használatával ajánlott eljárásokat valósíthat meg az adatműveletekhez.
- Az Azure Databricks használatával feltáró jellegű adatelemzést hajthat végre.
- Egy Sklearn gépi tanulási modell kötegelt kísérletes betanítása az Azure Databricksben.
- Gépi tanulási kísérletek nyomon követéséhez használja az MLflow-t.
- Kötegelt pontozási gépi tanulási modellek az Azure Databricksben.
- Az Azure Machine Learning használatával modellezheti a regisztrációt és az üzembe helyezést.
- Az MLOps-folyamat vezénylése Azure Data Factory és Azure Databricks-jegyzetfüzetek használatával.
Lehetséges használati esetek
Ez a megoldás ideális a kiskereskedelem számára. A következő használati esetekben hasznos:
- A marketingben annak meghatározása, hogy mennyit kell költeni egy ügyfél beszerzésére.
- A termékcsapatok számára, hogy a termékeket és szolgáltatásokat a legjobb ügyfeleiknek szabják testre.
- Az ügyféltámogatás érdekében döntse el, hogy mennyit költsön a szolgáltatásra, és tartsa meg az ügyfelet.
- Az értékesítési képviselők számára döntse el, hogy milyen típusú ügyfelek töltik a legtöbb időt a beszerzéssel.
Architektúra

Töltse le az architektúra Visio-fájlját.
Adatfolyam
Betöltés és vezénylés: Az ügyfél korábbi, tranzakciós és harmadik féltől származó adatainak betöltése helyszíni adatforrásokból. Használja Azure Data Factory, és tárolja az eredményeket Azure Data Lake Storage.
Adatfeldolgozás: Az Azure Databricks használatával vegye fel és törölje a nyers adatokat a Data Lake Storage. Tárolja az adatokat az ezüst rétegben Azure Data Lake Storage.
Szolgáltatásfejlesztés: Az Azure Databricks használatával adatokat tölthet be a Data Lake Storage ezüst rétegéből. A PySpark használatával bővítse az adatokat. Az előkészítést követően a funkciófejlesztéssel jobban ábrázolhatja az adatokat. A funkciófejlesztés a gépi tanulási algoritmus teljesítményét is javíthatja.
Modellbetanítás: A modellbetanításban az ezüstszintű adatok a modell betanítási adatkészletei. Az MLflow használatával kezelheti a gépi tanulási kísérleteket. Az MLflow nyomon követi a gépi tanulási kísérlet kiértékeléséhez szükséges összes metrikát.
Az MLflow-paraméterek modellhez kapcsolódó paramétereket, például betanítási hiperparamétereket tárolnak. Az MLflow-metrikák modellteljesítmény-metrikákat tárolnak. A gépi tanulási modell iteratívan újratanul Azure Data Factory folyamatokkal. A modell újratanítási folyamata frissíti a betanítási adatokat a Azure Data Lake Storage, és újratanítást ad a modellnek. A modell újratanítási folyamata a következő feltételekkel indul el:
- Ha a jelenlegi modell pontossága az éles környezetben az MLflow által nyomon követett küszöbérték alá csökken.
- Amikor a naptár eseményindítói az ügyfél által meghatározott szabályok alapján érnek el.
- Adateltolódás észlelésekor.
Gépi tanulási beállításjegyzék: Egy Azure Data Factory folyamat regisztrálja a legjobb gépi tanulási modellt az Azure Machine Learning Service-ben a kiválasztott metrikáknak megfelelően. A gépi tanulási modell üzembe helyezése a Azure Kubernetes Service használatával történik.
Kiszolgálási fázis: A kiszolgálási fázisban jelentéskészítési eszközökkel dolgozhat a modell előrejelzéseivel. Ezek közé az eszközök közé tartozik a Power BI és az Azure Analyses Services.
Összetevők
Azure Analysis Services nagyvállalati szintű adatmodelleket biztosít a felhőben.
Azure Data Factory olyan adatintegrációs és átalakítási réteget biztosít, amely a digitális átalakítási kezdeményezéseken keresztül működik.
Az Azure Databricks a Microsoft Azure felhőszolgáltatási platformra optimalizált adatelemzési platform.
Az Azure Machine Learning számos olyan élményt tartalmaz, amelyek a gépi tanulási modellek létrehozásához, betanítása és üzembe helyezéséhez, valamint a csapatmunka elősegítéséhez szükségesek.
Azure SQL Database egy adatbázismotor, amely a legtöbb felügyeleti funkciót az Ön közreműködése nélkül kezeli. Azure SQL Database lehetővé teszi, hogy a vállalat tartományspecifikus adatbázis-felügyeleti és -optimalizálási tevékenységeire összpontosítson.
Az MLflow egy nyílt forráskódú platform a teljes körű gépi tanulási életciklus kezelésére.
Alternatív megoldások
A Data Factory vezényli az adatfolyam munkafolyamatait. Ha csak egyszer vagy igény szerint szeretne adatokat betölteni, használjon olyan eszközöket, mint a SQL Server tömeges másolás és az AzCopy az adatok Azure Blob Storage való másolásához. Ezután közvetlenül betöltheti az adatokat Azure Synapse Analyticsbe a PolyBase használatával.
Előfordulhat, hogy egyes üzletiintelligencia-eszközök nem támogatják a Azure Analysis Services. A válogatott adatok közvetlenül Azure SQL Database-ből érhetők el. Az adatok tárolása Azure Data Lake Storage használatával történik, és az Azure Databricks Storage használatával történik adatfeldolgozás céljából.
Megfontolandó szempontok
Rendelkezésre állás
Az Azure-összetevők redundancián keresztül és a szolgáltatásiszint-szerződésekben (SLA-kban) meghatározottak szerint kínálják a rendelkezésre állást:
- A Data Factory-folyamatokkal kapcsolatos információkért lásd a Data Factory SLA-ját.
- Az Azure Databricksről további információt az Azure Databricksben talál.
- Data Lake Storage redundancián keresztül biztosítja a rendelkezésre állást. Lásd: Azure Storage-redundancia.
Méretezhetőség
Ez a forgatókönyv Azure Data Lake Storage használ a gépi tanulási modellek és előrejelzések adatainak tárolására. Az Azure Storage méretezhető. Sok exabájtnyi adatot képes tárolni és kiszolgálni. Ez a tárterület gigabit/másodpercben (Gbps) mért átviteli sebességgel érhető el. A feldolgozás kérelemenként közel állandó késéssel fut. A késéseket a szolgáltatás, a fiók és a fájl szintjén méri a rendszer.
Ez a forgatókönyv Azure Databricks-fürtöket használ, amelyek alapértelmezés szerint engedélyezik az automatikus skálázást. Az automatikus skálázás lehetővé teszi, hogy a Databricks futásidőben dinamikusan újratelepítse az erőforrásokat. Az automatikus méretezéssel nem kell a számítási feladatnak megfelelő fürtöt elindítania, ami megkönnyíti a magas fürthasználat elérését.
Biztonság
Az eszközök védelme az Azure-ból származó hálózati forgalom, a helyszíni és az Azure által üzemeltetett erőforrások, valamint az Azure-ba érkező és onnan érkező forgalom vezérlésével. Az Azure saját üzemeltetésű integrációs modulja például biztonságosan áthelyezi az adatokat a helyszíni adattárból az Azure-ba.
Az Azure Key Vault és a Databricks hatókörön belüli titkos kód használatával férhet hozzá az adatokhoz Azure Data Lake Storage.
Az Azure-szolgáltatások biztonságos virtuális hálózaton vannak üzembe helyezve, vagy az Azure Private Link funkcióval érhetők el. Szükség esetén a sorszintű biztonság részletes hozzáférést biztosít Azure Analysis Services vagy SQL Database egyes felhasználói számára.
Költségoptimalizálás
Az Azure Databricks egy prémium szintű Apache Spark-ajánlat, amely társított költségekkel rendelkezik.
A Databricks standard és prémium tarifacsomagjai vannak. Ebben a forgatókönyvben a standard tarifacsomag elegendő. Ha az alkalmazásnak a nagyobb számítási feladatok vagy interaktív Databricks-irányítópultok kezeléséhez automatikus skálázási fürtökre van szüksége, akkor szükség lehet a prémium szintre.
Az ezzel a használati esettel kapcsolatos költségek a következő szolgáltatások általános díjszabásától függenek:
- Az Azure Databricks díjszabása
- Az Azure Data Factory díjszabása
- Azure Data Lake Storage díjszabása
- Az Azure Machine Learning díjszabása
Az Azure-termékek és -konfigurációk költségeinek becsléséhez látogasson el az Azure díjkalkulátorára.
Közreműködők
Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.
Fő szerző:
- Giulia Gallo | Vezető felhőmegoldás-tervező
Következő lépések
- Azure Machine Learning
- Az Azure Data Lake Storage Gen2 bemutatása
- Azure Databricks
- Azure Data Factory