Co je Azure Synapse Link pro Azure Cosmos DB?

PLATÍ pro: rozhraní API pro rozhraní API Azure Cosmos DB SQL pro MongoDB

Odkaz na Azure synapse pro Azure Cosmos DB je cloudová funkce hybridního transakčního a analytického zpracování (HTAP), která umožňuje spouštět analýzy téměř v reálném čase nad provozními daty v Azure Cosmos DB. Propojení Azure synapse vytvoří úzkou plynulou integraci mezi Azure Cosmos DB a Azure synapse Analytics.

Pomocí Azure Cosmos DBho analytického úložiště, plně izolovaného úložiště sloupců, neumožňuje propojení Azure synapse žádné analýzy extrakce a transformace (ETL) ve službě Azure synapse Analytics proti vaším provozním datům ve velkém měřítku. Obchodní analytici, datové inženýri a odborníci přes data teď můžou pomocí synapse Sparku nebo synapse SQL pracovat téměř v reálném čase business intelligence, analýz a kanálů strojového učení. Je toho možné dosáhnout bez dopadu na výkon transakčních úloh v Azure Cosmos DB.

Na následujícím obrázku vidíte integraci Azure Synapseu s využitím Azure Cosmos DB a Azure synapse Analytics:

Diagram architektury pro integraci Azure synapse Analytics s Azure Cosmos DB

Výhodnější

Aby bylo možné analyzovat velké provozní datové sady a zároveň minimalizovat dopad na výkon důležitých transakčních úloh, tradičně jsou provozní data v Azure Cosmos DB extrahována a zpracována pomocí kanálů extrakce, transformace a načítání (ETL). Kanály ETL vyžadují mnoho vrstev přesunu dat, což má za následek mnohem náročnou provozní složitost a dopad na výkon vašich transakčních úloh. Zároveň se tím zvyšuje latence, která analyzuje provozní data od času počátku.

V porovnání s tradičními řešeními založenými na ETL nabízí Azure synapse odkaz na Azure Cosmos DB několik výhod, jako jsou:

Snížení složitosti bez úloh ETL ke správě

Azure synapse Link umožňuje přímý přístup k Azure Cosmos DB analytickému úložišti pomocí Azure synapse Analytics bez složitého přesunu dat. Jakékoli aktualizace provozních dat jsou viditelné v analytickém úložišti téměř v reálném čase bez úloh ETL nebo změny kanálu. Pomocí analytického úložiště z Azure synapse Analytics můžete spustit rozsáhlou škálu analýz bez další transformace dat.

Přehledy o provozních datech téměř v reálném čase

Pomocí odkazu Azure synapse teď můžete získat přehled o provozních datech téměř v reálném čase. Systémy založené na ETL mají za následek vyšší latenci při analýze provozních dat, a to kvůli mnoha vrstvám potřebných k extrakci, transformaci a načítání provozních dat. Díky nativní integraci Azure Cosmos DB analytického úložiště s Azure synapse Analytics můžete analyzovat provozní data téměř v reálném čase a umožnit tak nové obchodní scénáře.

Žádný dopad na provozní úlohy

Pomocí služby Azure synapse Link můžete spouštět analytické dotazy proti Azure Cosmos DB analytickému úložišti (samostatné úložiště sloupců), zatímco transakce jsou zpracovávány pomocí zřízené propustnosti pro transakční úlohy (transakční úložiště založené na řádku). Analytické úlohy se obsluhují nezávisle na transakčním provozu, a to bez využívání jakékoli propustnosti zřízené pro vaše provozní data.

Optimalizováno pro úlohy s velkými objemy analýz

Azure Cosmos DB analytické úložiště je optimalizované pro zajištění škálovatelnosti, pružnosti a výkonu pro analytické úlohy bez jakékoli závislosti na výpočetních časech. Technologie úložiště je samoobslužně spravovaná pro optimalizaci vašich úloh analýzy. Díky integrované podpoře Azure synapse Analytics poskytuje přístup k této vrstvě úložiště jednoduchost a vysoký výkon.

Cenově výhodné

S odkazem na Azure synapse můžete získat cenově optimalizované a plně spravované řešení pro provozní analýzu. Eliminuje nadbytečné vrstvy úložiště a výpočetních prostředků vyžadovaných v tradičních kanálech ETL pro analýzu provozních dat.

Azure Cosmos DB analytické úložiště sleduje cenový model založený na spotřebě, který je založený na operacích úložiště dat a analytické operace čtení a zápisu a na provedených dotazech. Nevyžaduje, abyste zřídili žádnou propustnost, stejně jako v současnosti za transakční úlohy. Přístup k datům s vysoce elastickými výpočetními moduly z Azure synapse Analytics přináší celkové náklady na spuštění úložiště a výpočetní výkon.

Analýza pro místně dostupná, globálně distribuovaná, vícenásobná zápisy ve více oblastech

Analytické dotazy můžete efektivně spouštět proti nejbližší místní kopii dat v Azure Cosmos DB. Azure Cosmos DB poskytuje nejmodernější možnosti pro spouštění globálně distribuovaných analytických úloh spolu s transakčními úlohami aktivním aktivním způsobem.

Povolení scénářů HTAP pro vaše provozní data

Odkaz synapse spojuje Azure Cosmos DB analytické úložiště s podporou Azure synapse Analytics runtime. Tato integrace umožňuje vytvářet cloudová nativní HTAP řešení (hybridní transakční a analytické zpracování), která generují přehledy na základě aktualizací v reálném čase pro vaše provozní data prostřednictvím velkých datových sad. Odemkne nové obchodní scénáře, aby vyvolala výstrahy na základě živých trendů, sestavování téměř v reálném čase a podnikového prostředí na základě chování uživatele.

Azure Cosmos DB analytické úložiště

Azure Cosmos DB analytické úložiště je uživatelsky orientovanou reprezentace vašich provozních dat v Azure Cosmos DB. Tento analytický obchod je vhodný pro rychlé a nákladově efektivní dotazy na velké sady provozních dat bez kopírování dat a vlivu na výkon transakčních úloh.

Analytické úložiště automaticky v reálném čase přebírá rychlé vkládání, aktualizace a odstraňování v transakčních úlohách, jako plně spravovaná funkce (Automatická synchronizace) Azure Cosmos DB. Není vyžadován žádný kanál změn ani ETL.

Pokud máte globálně distribuovaný Azure Cosmos DB účet, po povolení analytického úložiště pro kontejner bude k dispozici ve všech oblastech pro daný účet. Další informace o analytickém úložišti najdete v článku Azure Cosmos DB analytické úložiště – přehled .

Integrace se službou Azure synapse Analytics

S odkazem na synapse se teď můžete přímo připojit k vašim Azure Cosmos DBm kontejnerům z Azure synapse Analytics a přistupovat k analytickému úložišti bez oddělených konektorů. Služba Azure synapse Analytics aktuálně podporuje synapse propojení s Synapse Apache Spark a neserverovým fondem SQL.

Data z Azure Cosmos DBho analytického úložiště můžete zadávat současně s interoperabilitou různých analytických časů, které Azure synapse Analytics podporuje. K analýze provozních dat nejsou potřeba žádné další transformace dat. Data analytického úložiště můžete dotazovat a analyzovat pomocí:

  • Synapse Apache Spark s plnou podporou pro Scala, Python, SparkSQL a C#. Synapse Spark je centrální na datové strojírenství a scénáře pro datové vědy

  • Fond SQL bez serveru s jazykem T-SQL a podporou pro známé nástroje BI (například Power BI Premium atd.)

Poznámka

Z Azure synapse Analytics máte přístup k analytickým i transakčním úložištím v kontejneru Azure Cosmos DB. Pokud ale chcete spouštět rozsáhlé analýzy nebo kontrolovat vaše provozní data, doporučujeme použít analytické úložiště, abyste se vyhnuli dopadu na transakční úlohy.

Poznámka

Analýzy s nízkou latencí můžete spouštět v oblasti Azure připojením kontejneru Azure Cosmos DB k synapse modulu runtime v této oblasti.

Tato integrace umožňuje pro různé uživatele následující scénáře HTAP:

  • Inženýr BI, který chce modelovat a publikovat Power BI sestavu pro přístup k živým provozním datům v Azure Cosmos DB přímo prostřednictvím synapse SQL.

  • Analytik dat, který chce z provozních dat v kontejneru Azure Cosmos DB odvodit přehledy pomocí dotazování pomocí synapse SQL, číst data ve velkém měřítku a kombinovat tato zjištění s ostatními zdroji dat.

  • Odborník na data, který chce používat synapse Spark k nalezení funkce pro zlepšení modelu a výuku tohoto modelu bez provádění komplexních datových technik. Můžou také zapisovat výsledky modelu po odvození do Azure Cosmos DB pro bodování dat v reálném čase pomocí Sparku synapse.

  • Inženýr dat, který chce zpřístupnit data pro příjemce tím, že vytvoří tabulky SQL nebo Spark přes kontejnery Azure Cosmos DB bez manuálních procesů ETL.

Další informace o podpoře Azure synapse Analytics runtime pro Azure Cosmos DB najdete v tématu Azure synapse Analytics pro Cosmos DB podporu.

Odkaz na synapse se doporučuje v následujících případech:

  • Pokud jste zákazníkem Azure Cosmos DB a chcete provozovat analýzy, BI a strojové učení přes vaše provozní data. V takových případech odkaz synapse poskytuje pokročilejší analytické prostředí, aniž by to ovlivnilo zřízenou propustnost transakčního úložiště. Například:

    • Pokud používáte analýzy nebo BI na vašich Azure Cosmos DB provozních datech přímo pomocí samostatných konektorů ještě dnes, nebo

    • Pokud spouštíte procesy ETL k extrakci provozních dat do samostatného analytického systému.

V takových případech odkaz synapse poskytuje pokročilejší analytické prostředí, aniž by to ovlivnilo zřízenou propustnost transakčního úložiště.

Odkaz synapse se nedoporučuje, pokud hledáte tradiční požadavky na datový sklad, jako je vysoká souběžnost, Správa úloh a trvalost agregací napříč různými zdroji dat. Další informace najdete v tématu běžné scénáře, které mohou být napájeny pomocí služby Azure synapse Link pro Azure Cosmos DB.

Omezení

  • Azure Synapse Link pro Azure Cosmos DB podporuje rozhraní SQL API a rozhraní API služby Azure Cosmos DB pro MongoDB. Pro rozhraní Gremlin API, rozhraní API Cassandra a rozhraní API pro tabulky se nepodporuje.

  • Analytické úložiště se dá povolit jenom pro nové kontejnery. Pokud chcete použít analytické úložiště pro existující kontejnery, migrujte data z existujících kontejnerů do nových kontejnerů pomocí nástrojů pro migraci Azure Cosmos DB. Můžete povolit synapse odkaz na nové a existující účty Azure Cosmos DB.

  • U kontejnerů se zapnutým analytickým úložištěm se v současnosti nepodporuje automatické zálohování a obnovování vašich dat v analytickém úložišti. Když je na databázovém účtu povoleno propojení synapse, Azure Cosmos DB bude pokračovat v automatickém ukládání záloh vašich dat do transakčního úložiště (pouze) kontejnerů v naplánovaných intervalech zálohování, jako vždycky. Je důležité si uvědomit, že když se na nový účet obnoví kontejner se zapnutým analytickým úložištěm, kontejner se obnoví jenom v transakčním úložišti a není povolený žádný analytický obchod.

  • Přístup k úložišti Azure Cosmos DB Analytics s zřízeným synapse SQL není momentálně k dispozici.

Zabezpečení

Synapse Link vám umožní spouštět analýzy téměř v reálném čase v rámci důležitých dat v Azure Cosmos DB. Je důležité zajistit, aby byla důležitá obchodní data bezpečně ukládána napříč transakčními i analytickými obchody. Odkaz na službu Azure synapse pro Azure Cosmos DB je navržený tak, aby splňoval tyto požadavky na zabezpečení prostřednictvím následujících funkcí:

  • Izolace sítě pomocí soukromých koncových bodů – k datům v transakčních a analytických úložištích můžete řídit síťový přístup nezávisle. Izolace sítě se provádí pomocí samostatných spravovaných privátních koncových bodů pro každé úložiště v rámci spravovaných virtuálních sítí v pracovních prostorech Azure synapse. Další informace najdete v článku postup Konfigurace privátních koncových bodů pro analytické úložiště .

  • Šifrování dat pomocí klíčů spravovaných zákazníkem – data můžete bez problémů šifrovat napříč transakčními a analytickými úložišti, a to pomocí automatického a transparentního klíče spravovaného zákazníky. Další informace najdete v článku postup konfigurace klíčů spravovaných zákazníkem .

  • Zabezpečená správa klíčů – přístup k datům v analytickém úložišti z synapse a synapse serverů SQL bez serveru vyžaduje správu Azure Cosmos DB klíčů v rámci pracovních prostorů synapse Analytics. Místo používání Azure Cosmos DB klíčů účtu, které jsou vložené v úlohách Sparku nebo ve skriptech SQL, poskytuje propojení Azure synapse bezpečnější možnosti.

Ceny

Model fakturace propojení Azure synapse zahrnuje náklady vzniklé pomocí Azure Cosmos DBho analytického úložiště a modulu runtime synapse. Další informace najdete v článcích o cenách služby Azure Cosmos DB Analytics Store a cenách Azure synapse Analytics .

Další kroky

Další informace najdete v následujících dokumentech: