Logikai adattárház Azure Synapse kiszolgáló nélküli SQL-készletekkel

Azure Cosmos DB
Azure Data Factory
Azure Data Lake
Azure Synapse Analytics
Power BI

Megoldási ötletek

Ez a cikk egy megoldási ötlet. Ha azt szeretné, hogy további információkkal bővítsük a tartalmat, például a lehetséges használati eseteket, az alternatív szolgáltatásokat, a megvalósítási szempontokat vagy a díjszabással kapcsolatos útmutatást, tudassa velünk a GitHub visszajelzésével.

A logikai adattárház (LDW) minta egy egyszerű virtualizált relációs réteget helyez el a data lake-ben vagy adatbázisban tárolt adatokra. Ez a virtualizálási réteg adatáthelyezés nélkül biztosít adattárház-hozzáférést. Ez a megoldás kombinálhatja az online tranzakciófeldolgozási (OLTP-) adatokat a data lake-ekből származó elemzési adatokkal az üzleti intelligencia (BI) és az elemzési számítási feladatok kiszolgálásának alacsony összetettsége és kis késésű módja érdekében.

Az Apache Spark™ az Apache Software Foundation védjegye a Egyesült Államok és/vagy más országokban/régiókban. Az Apache Software Foundation nem támogatja ezt a jelölést.

Architektúra

A lépések leírása szerint balról jobbra haladó adatáramlást ábrázoló ábra.

Töltse le a cikk összes diagramját bemutató PowerPoint-fájlt .

Adatfolyam

  1. Azure Data Factory a forrásrendszerekből származó adatokat integrálja a vállalati adattóba.

  2. Az eszköz- és érzékelőadatok a peremeszközökről is streamelnek a felhőbe Azure IoT Hub keresztül. Az Azure Stream Analytics feldolgozza az adatokat, és elküldi azokat a vállalati data lake-nek.

  3. Azure Synapse kiszolgáló nélküli SQL-készletek olyan LDW-t határoznak meg, amely a Azure Synapse munkaterület kiszolgáló nélküli SQL-készletének igény szerinti végpontján keresztül elérhető logikai táblákat és nézeteket tartalmaz.

  4. Azure Synapse Link az Azure Cosmos DB-hez valós idejű tranzakciós adatokat kér le a Azure Synapse kiszolgáló nélküli SQL-készleteken keresztül. Ezek az adatok a nagyvállalati data lake-ből származó ritka elérésű kötegelt és gyakori elérésű streamelési adatokkal csatlakoznak a logikai nézetek létrehozásához.

  5. A jelentéskészítési, BI- és egyéb elemzési alkalmazások a Azure Synapse munkaterület kiszolgáló nélküli SQL-végpontjának használatával férnek hozzá az LDW-adatokhoz és -nézetekhez.

    Megjegyzés

    A Azure Synapse munkaterület kiszolgáló nélküli SQL-végpontja bármely olyan eszközről vagy szolgáltatásból elérhető, amely támogatja a táblázatos adatfolyam -kapcsolatokat SQL Server.

Összetevők

Forgatókönyv részletei

Ha egy LDW-t Azure Synapse kiszolgáló nélküli SQL-készletekkel használ, egyetlen T-SQL-lekérdezésben vagy -nézetdefinícióban összekapcsolhatja a ritka elérésű kötegelt adatokat, a gyakori elérésű streamelési adatokat és az élő tranzakciós adatokat.

Ezzel a megoldással elkerülheti az adatok összetett, költséges és késésre hajlamos kinyerési, átalakítási és betöltési (ETL) folyamatokon keresztül történő áthelyezését. Az LDW-koncepció hasonló a data lakehouse-hoz, de a Azure Synapse Analyticsszel rendelkező LDW támogatja a hibrid tranzakciók/elemzési feldolgozás (HTAP) használatát. A HTAP Azure Synapse kiszolgáló nélküli SQL-készleteket használ az Azure Cosmos DB-ben tárolt OLTP-adatok lekérdezéséhez.

A Azure Synapse Analytics LDW kiszolgáló nélküli SQL-készleteken alapul, amelyek az összes Azure Synapse munkaterületen elérhetők. Az OPENROWSET függvény továbbfejlesztett verziója lehetővé teszi, hogy a kiszolgáló nélküli SQL-készletek hozzáférjenek Data Lake Storage adataihoz.

Ez az adathozzáférés lehetővé teszi relációs adatbázis-objektumok, például táblák és nézetek létrehozását a logikai entitásokat, például termékeket, ügyfeleket és értékesítési tranzakciókat képviselő adatfájlok gyűjteményeivel kapcsolatban. A szabványos SQL Server végponttal csatlakozó BI-eszközök dimenziókként és ténytáblákként használhatják ezeket a logikai entitásokat.

Az LDW koncepciótervének egymás melletti összehasonlítását bemutató ábra az LDW implementációja mellett, Azure Synapse Analytics kiszolgáló nélküli SQL-készlettel.

Az Azure Cosmos DB-hez készült Azure Synapse Linken keresztül elérhető tranzakciós adattárak, például az Azure Cosmos DB kiterjesztik ezeket a képességeket. Az OLTP-adatok HTAP-architektúra használatával való elérése azonnali frissítéseket biztosít anélkül, hogy zavarnák az élő tranzakciókat.

Diagram, amely a külső adatok jelentéskészítési rétegbe való áramlását mutatja Azure Synapse Analytics kiszolgáló nélküli SQL-készlet használatával.

Minden Azure Synapse munkaterület tartalmaz egy igény szerinti SQL-végpontot. A végpont lehetővé teszi SQL Server rendszergazdáknak és fejlesztőknek, hogy ismerős környezeteket használjanak a kiszolgáló nélküli SQL-készletek Azure Synapse LDW-k használatához.

Az alábbi képernyőképen egy Azure Synapse kiszolgáló nélküli SQL-készlethez csatlakoztatott SQL Server Management Studio (SSMS) látható.

Képernyőkép a Azure Synapse SQL Server végponthoz csatlakoztatott SSMS-ről.

Azure Synapse kiszolgáló nélküli SQL-készletek a következő fájlformátumokat támogatják:

  • Tagolt szöveg, például CSV, TSV és TXT
  • JSON
  • Parquet

Azure Synapse kiszolgáló nélküli SQL-készletek a Delta Lake formátumot is támogatják. Ez a támogatás olyan mintákat tesz lehetővé, mint a sparkos bővítés, az SQL-hez, ahol az Apache Spark-szolgáltatások™, például az Azure Databricks vagy az Apache Spark-készletek Azure Synapse mérnökadatokban válogatott adatkészleteket hoznak létre a data lake-ben. Ahelyett, hogy ezeket az adathalmazokat fizikai adattárházba kellene betöltenie, definiálhat egy LDW-t a data lake-en keresztül, hogy biztosítsa a modell/kiszolgáló réteget a jelentéskészítéshez.

Diagram, amely a külső adatok jelentéskészítési rétegbe való áramlását mutatja Azure Synapse Analytics kiszolgáló nélküli SQL-készlettel.

A Azure Synapse kiszolgáló nélküli SQL-készletekkel rendelkező LDW a Data Lakehouse-minta implementációja. Alternatív megoldás a Databricks SQL használata LDW implementálásához. A Databricks SQL azonban nem rendelkezik a Cosmos DB-hez készült Azure Synapse Link HTAP-képességével.

Lehetséges használati esetek

Ez a minta a következő esetekben hasznos:

  • Adatraktár-kiszolgáló réteg a BI-hoz és más elemzési használati esetekhez.
  • A nyers adatok alkalmi feltárása egy adattóban.
  • Költséghatékony adatstreamelés olyan data lake-be, amelyhez nincs szükség saját számítási erőforrásokra az adatok írásához. Egy logikai adatbázistábla, nézet vagy alkalmi T-SQL-lekérdezés azonnal hozzáférhet az adatokhoz a data lake-ből.
  • Azonnali hozzáférés az Azure Cosmos DB tranzakciós adataihoz valós idejű összesítési folyamatok létrehozásához vagy a data lake-ben tárolt elemzési adatokhoz való csatlakozáshoz.

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerző:

A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.

Következő lépések