Adattárházak és elemzések

Azure Data Lake Storage
Azure Cosmos DB
Azure Data Factory
Azure SQL Database
Azure Table Storage

Ez a példaforgatókönyv egy olyan adatfolyamot mutat be, amely több forrásból származó nagy mennyiségű adatot integrál egy egységes elemzési platformba az Azure-ban. Ez a konkrét forgatókönyv egy értékesítési és marketingmegoldáson alapul, de a tervezési minták számos olyan iparág esetében relevánsak, amelyek nagy adathalmazok, például az e-kereskedelem, a kiskereskedelem és az egészségügy fejlett elemzését igénylik.

Felépítés

Architecture for a data warehousing and analysis scenario in Azure

Töltse le az architektúra Visio-fájlját.

Adatfolyam

Az adatok a következő módon haladnak át a megoldáson:

  1. Minden adatforrás esetében a rendszer rendszeresen exportálja a frissítéseket az Azure Data Lake Storage átmeneti területére.
  2. Az Azure Data Factory növekményesen tölti be az Adatokat az Azure Data Lake Storage-ból az Azure Synapse Analytics átmeneti tábláiba. A folyamat során az adatok megtisztítva és átalakítva lesznek. A PolyBase képes párhuzamosítani a nagy adathalmazok folyamatát.
  3. Miután betöltött egy új adatköteget a raktárba, a rendszer frissít egy korábban létrehozott Azure Analysis Services-táblázatos modellt. Ez a szemantikai modell leegyszerűsíti az üzleti adatok és kapcsolatok elemzését.
  4. Az üzleti elemzők a Microsoft Power BI használatával elemzik a raktározott adatokat az Analysis Services szemantikai modelljén keresztül.

Összetevők

A vállalat számos különböző platformon rendelkezik adatforrásokkal:

  • Helyszíni SQL Server
  • Oracle helyszíni
  • Azure SQL Database
  • Azure Table Storage
  • Azure Cosmos DB

A rendszer az alábbi különböző adatforrásokból tölt be adatokat több Azure-összetevő használatával:

  • Az Azure Data Lake Storage a forrásadatok az Azure Synapse-be való betöltése előtt történő szakaszozására szolgál.
  • A Data Factory vezényli a szakaszos adatok átalakítását az Azure Synapse közös struktúrájába. A Data Factory a PolyBase-t használja az adatok Azure Synapse-ba való betöltésekor az átviteli sebesség maximalizálása érdekében.
  • Az Azure Synapse egy elosztott rendszer nagy adathalmazok tárolására és elemzésére. A nagy teljesítményű párhuzamos feldolgozás (MPP) használatával alkalmassá válik nagy teljesítményű elemzések futtatására. Az Azure Synapse a PolyBase használatával gyorsan betölthet adatokat az Azure Data Lake Storage-ból.
  • Az Analysis Services szemantikai modellt biztosít az adatokhoz. Emellett növelheti a rendszer teljesítményét az adatok elemzésekor.
  • A Power BI üzleti elemzési eszközökből álló csomagja az adatok elemzésére és az elemzések megosztására. A Power BI lekérdezhet egy Analysis Servicesben tárolt szemantikai modellt, vagy közvetlenül lekérdezheti az Azure Synapse-t.
  • A Microsoft Entra ID hitelesíti az Analysis Services-kiszolgálóhoz a Power BI-on keresztül csatlakozó felhasználókat. A Data Factory a Microsoft Entra ID-t is használhatja az Azure Synapse-beli hitelesítéshez egy szolgáltatásnévvel vagy az Azure-erőforrások felügyelt identitásával.

Alternatívák

Forgatókönyv részletei

Ez a példa egy olyan értékesítési és marketingvállalatot mutat be, amely ösztönző programokat hoz létre. Ezek a programok megjutalmazzák az ügyfeleket, a beszállítókat, az értékesítőket és az alkalmazottakat. Az adatok alapvető fontosságúak ezekhez a programokhoz, és a vállalat javítani szeretné az Azure-nal végzett adatelemzésen keresztül szerzett megállapításokat.

A vállalatnak modern megközelítésre van szüksége az adatok elemzéséhez, hogy a döntéseket a megfelelő adatokkal hozza meg a megfelelő időben. A vállalat céljai a következők:

  • Különböző típusú adatforrások kombinálása felhőalapú platformmá.
  • A forrásadatok átalakítása általános osztályozássá és struktúrává, hogy az adatok egységesek és könnyen összehasonlíthatóak legyenek.
  • Adatok betöltése rendkívül párhuzamos megközelítéssel, amely ösztönző programok ezreit támogathatja, a helyszíni infrastruktúra üzembe helyezésének és karbantartásának magas költségei nélkül.
  • Jelentősen csökkenti az adatok gyűjtéséhez és átalakításához szükséges időt, így az adatok elemzésére összpontosíthat.

Lehetséges használati esetek

Ez a megközelítés a következőket is lehetővé teszi:

  • Hozzon létre egy adattárházat, amely az adatok egyetlen igazságforrása.
  • Relációs adatforrások integrálása más strukturálatlan adatkészletekkel.
  • Az egyszerűbb adatelemzéshez szemantikai modellezést és hatékony vizualizációs eszközöket használhat.

Considerations

Ezek a szempontok implementálják az Azure Well-Architected Framework alappilléreit, amely a számítási feladatok minőségének javítására használható vezérelvek halmaza. További információ: Microsoft Azure Well-Architected Framework.

Az architektúra technológiáit azért választották ki, mert megfeleltek a vállalat skálázhatóságára és rendelkezésre állására vonatkozó követelményeinek, és segítették őket a költségek szabályozásában.

Költségoptimalizálás

A költségoptimalizálás a szükségtelen kiadások csökkentésének és a működési hatékonyság javításának módjairól szól. További információ: A költségoptimalizálási pillér áttekintése.

Tekintse át az adatraktározási forgatókönyvek díjszabási mintáját az Azure díjkalkulátorán keresztül. Módosítsa az értékeket, hogy lássa, a követelmények hogyan befolyásolják a költségeket.

  • Az Azure Synapse lehetővé teszi a számítási és tárolási szintek egymástól függetlenül történő skálázását. A számítási erőforrások óránként kerülnek felszámításra, és igény szerint skálázhatja vagy szüneteltetheti ezeket az erőforrásokat. A tárolási erőforrásokat terabájtonként számlázzák, így a költségek növekedni fognak, amikor több adatot vesz fel.
  • A Data Factory költségei a számítási feladatban végrehajtott olvasási/írási műveletek, monitorozási műveletek és vezénylési tevékenységek számán alapulnak. A Data Factory költségei minden további adatfolyammal és az egyes által feldolgozott adatok mennyiségével növekednek.
  • Az Analysis Services fejlesztői, alapszintű és standard szinteken érhető el. A példányok ára a lekérdezésfeldolgozó egységek (QPU-k) és a rendelkezésre álló memória alapján van megadva. A költségek csökkentése érdekében minimalizálja a futtatott lekérdezések számát, a feldolgozott adatok számát és a futtatás gyakoriságát.
  • A Power BI különböző terméklehetőségekkel rendelkezik a különböző követelményekhez. A Power BI Embedded azure-alapú lehetőséget biztosít a Power BI-funkciók alkalmazásokba való beágyazásához. A fenti díjszabási minta egy Power BI Embedded-példányt tartalmaz.

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködő írta.

Fő szerző:

A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.

További lépések