Co je Azure Synapse Link pro Azure Cosmos DB?
platí pro:
SQL api
Azure Cosmos DB api pro MongoDB
odkaz na Azure Synapse pro Azure Cosmos DB je cloudová funkce hybridního transakčního a analytického zpracování (HTAP), která umožňuje spouštět analýzy téměř v reálném čase nad provozními daty v Azure Cosmos DB. propojení azure Synapse vytvoří úzkou plynulou integraci mezi Azure Cosmos DB a Azure Synapse Analytics.
pomocí Azure Cosmos DBho analytického úložiště, plně izolovaného úložiště sloupců, neumožňuje propojení azure Synapse žádné analýzy extrakce a transformace (ETL) ve službě azure Synapse analytics proti vaším provozním datům ve velkém měřítku. obchodní analytiky, datové inženýri a odborníci přes data teď můžou Synapse Spark nebo SQL Synapse využít ke spouštění business intelligencech, analýz a kanálů strojového učení v reálném čase. Je toho možné dosáhnout bez dopadu na výkon transakčních úloh v Azure Cosmos DB.
na následujícím obrázku vidíte integraci azure Synapseu s využitím Azure Cosmos DB a azure Synapse Analytics:
Výhodnější
aby bylo možné analyzovat velké provozní datové sady a zároveň minimalizovat dopad na výkon důležitých transakčních úloh, tradičně jsou provozní data v Azure Cosmos DB extrahována a zpracována pomocí kanálů extrakce, transformace a načítání (ETL). Kanály ETL vyžadují mnoho vrstev přesunu dat, což má za následek mnohem náročnou provozní složitost a dopad na výkon vašich transakčních úloh. Zároveň se tím zvyšuje latence, která analyzuje provozní data od času počátku.
v porovnání s tradičními řešeními založenými na ETL nabízí Azure Synapse odkaz na Azure Cosmos DB několik výhod, jako jsou:
Snížení složitosti bez úloh ETL ke správě
azure Synapse Link umožňuje přímý přístup k Azure Cosmos DB analytickému úložišti pomocí Azure Synapse Analytics bez složitého přesunu dat. Jakékoli aktualizace provozních dat jsou viditelné v analytickém úložišti téměř v reálném čase bez úloh ETL nebo změny kanálu. Pomocí analytického úložiště z Azure synapse Analytics můžete spustit rozsáhlou škálu analýz bez další transformace dat.
Přehledy o provozních datech téměř v reálném čase
Pomocí odkazu Azure synapse teď můžete získat přehled o provozních datech téměř v reálném čase. Systémy založené na ETL mají za následek vyšší latenci při analýze provozních dat, a to kvůli mnoha vrstvám potřebných k extrakci, transformaci a načítání provozních dat. díky nativní integraci Azure Cosmos DB analytického úložiště s Azure Synapse Analytics můžete analyzovat provozní data téměř v reálném čase a umožnit tak nové obchodní scénáře.
Žádný dopad na provozní úlohy
pomocí služby Azure Synapse Link můžete spouštět analytické dotazy proti Azure Cosmos DB analytickému úložišti (samostatné úložiště sloupců), zatímco transakce jsou zpracovávány pomocí zřízené propustnosti pro transakční úlohy (transakční úložiště založené na řádku). Analytické úlohy se obsluhují nezávisle na transakčním provozu, a to bez využívání jakékoli propustnosti zřízené pro vaše provozní data.
Optimalizováno pro úlohy s velkými objemy analýz
Azure Cosmos DB analytické úložiště je optimalizované pro zajištění škálovatelnosti, pružnosti a výkonu pro analytické úlohy bez jakékoli závislosti na výpočetních časech. Technologie úložiště je samoobslužně spravovaná pro optimalizaci vašich úloh analýzy. Díky integrované podpoře Azure synapse Analytics poskytuje přístup k této vrstvě úložiště jednoduchost a vysoký výkon.
Cenově výhodné
S odkazem na Azure synapse můžete získat cenově optimalizované a plně spravované řešení pro provozní analýzu. Eliminuje nadbytečné vrstvy úložiště a výpočetních prostředků vyžadovaných v tradičních kanálech ETL pro analýzu provozních dat.
Azure Cosmos DB analytické úložiště sleduje cenový model založený na spotřebě, který je založený na operacích úložiště dat a analytické operace čtení a zápisu a na provedených dotazech. Nevyžaduje, abyste zřídili žádnou propustnost, stejně jako v současnosti za transakční úlohy. Přístup k datům s vysoce elastickými výpočetními moduly z Azure synapse Analytics přináší celkové náklady na spuštění úložiště a výpočetní výkon.
Analýza pro místně dostupná, globálně distribuovaná, vícenásobná zápisy ve více oblastech
analytické dotazy můžete efektivně spouštět proti nejbližší místní kopii dat v Azure Cosmos DB. Azure Cosmos DB poskytuje nejmodernější možnosti pro spouštění globálně distribuovaných analytických úloh spolu s transakčními úlohami aktivním aktivním způsobem.
Povolení scénářů HTAP pro vaše provozní data
odkaz Synapse spojuje Azure Cosmos DB analytické úložiště s podporou Azure Synapse analytics runtime. Tato integrace umožňuje vytvářet cloudová nativní HTAP řešení (hybridní transakční a analytické zpracování), která generují přehledy na základě aktualizací v reálném čase pro vaše provozní data prostřednictvím velkých datových sad. Odemkne nové obchodní scénáře, aby vyvolala výstrahy na základě živých trendů, sestavování téměř v reálném čase a podnikového prostředí na základě chování uživatele.
Azure Cosmos DB analytické úložiště
Azure Cosmos DB analytické úložiště je uživatelsky orientovanou reprezentace vašich provozních dat v Azure Cosmos DB. Tento analytický obchod je vhodný pro rychlé a nákladově efektivní dotazy na velké sady provozních dat bez kopírování dat a vlivu na výkon transakčních úloh.
analytické úložiště automaticky v reálném čase přebírá rychlé vkládání, aktualizace a odstraňování v transakčních úlohách, jako plně spravovaná funkce (automatická synchronizace) Azure Cosmos DB. Není vyžadován žádný kanál změn ani ETL.
pokud máte globálně distribuovaný Azure Cosmos DB účet, po povolení analytického úložiště pro kontejner bude k dispozici ve všech oblastech pro daný účet. další informace o analytickém úložišti najdete v článku Azure Cosmos DB analytické úložiště – přehled .
Integrace se službou Azure synapse Analytics
s odkazem na Synapse se teď můžete přímo připojit k vašim Azure Cosmos DBm kontejnerům z Azure Synapse Analytics a přistupovat k analytickému úložišti bez oddělených konektorů. Azure Synapse Analytics aktuálně podporuje Synapse propojení s Synapse Apache Spark a SQLm fondem bez serveru.
data z Azure Cosmos DBho analytického úložiště můžete zadávat současně s interoperabilitou různých analytických časů, které Azure Synapse analytics podporuje. K analýze provozních dat nejsou potřeba žádné další transformace dat. Data analytického úložiště můžete dotazovat a analyzovat pomocí:
Synapse Apache Spark s plnou podporou pro Scala, Python, SparkSQL a C#. Synapse Spark je centrální na datové strojírenství a scénáře pro datové vědy
fond SQL bez serveru s využitím jazyka T-SQL a podpory známých nástrojů BI (například Power BI Premium atd.)
Poznámka
z Azure Synapse Analytics máte přístup k analytickým i transakčním úložištím v kontejneru Azure Cosmos DB. Pokud ale chcete spouštět rozsáhlé analýzy nebo kontrolovat vaše provozní data, doporučujeme použít analytické úložiště, abyste se vyhnuli dopadu na transakční úlohy.
Poznámka
analýzy s nízkou latencí můžete spouštět v oblasti Azure připojením kontejneru Azure Cosmos DB k Synapse modulu runtime v této oblasti.
Tato integrace umožňuje pro různé uživatele následující scénáře HTAP:
inženýr BI, který chce modelovat a publikovat Power BI sestavu pro přístup k živým provozním datům v Azure Cosmos DB přímo prostřednictvím Synapse SQL.
analytik dat, který chce z provozních dat v kontejneru Azure Cosmos DB odvodit přehledy pomocí dotazování s využitím Synapse SQL, přečtěte si data ve velkém měřítku a zkombinujte je s ostatními zdroji dat.
Odborník na data, který chce používat synapse Spark k nalezení funkce pro zlepšení modelu a výuku tohoto modelu bez provádění komplexních datových technik. můžou také zapisovat výsledky modelu po odvození do Azure Cosmos DB pro bodování dat v reálném čase pomocí sparku Synapse.
inženýr dat, který chce zpřístupnit data pro příjemce tím, že vytvoří tabulky SQL nebo Spark přes Azure Cosmos DB kontejnery bez ručních procesů ETL.
další informace o podpoře azure Synapse analytics runtime pro Azure Cosmos DB najdete v tématu azure Synapse analytics pro Cosmos DB podporu.
kdy použít pro Azure Cosmos DB odkaz na Azure Synapse?
Odkaz na synapse se doporučuje v následujících případech:
pokud jste zákazníkem Azure Cosmos DB a chcete provozovat analýzy, BI a strojové učení přes vaše provozní data. V takových případech odkaz synapse poskytuje pokročilejší analytické prostředí, aniž by to ovlivnilo zřízenou propustnost transakčního úložiště. Například:
pokud používáte analýzy nebo BI na vašich Azure Cosmos DB provozních datech přímo pomocí samostatných konektorů ještě dnes, nebo
Pokud spouštíte procesy ETL k extrakci provozních dat do samostatného analytického systému.
V takových případech odkaz synapse poskytuje pokročilejší analytické prostředí, aniž by to ovlivnilo zřízenou propustnost transakčního úložiště.
Odkaz synapse se nedoporučuje, pokud hledáte tradiční požadavky na datový sklad, jako je vysoká souběžnost, Správa úloh a trvalost agregací napříč různými zdroji dat. další informace najdete v tématu běžné scénáře, které mohou být napájeny pomocí služby Azure Synapse Link pro Azure Cosmos DB.
Omezení
Azure Synapse Link pro Azure Cosmos DB podporuje rozhraní SQL API a rozhraní API služby Azure Cosmos DB pro MongoDB. Pro rozhraní Gremlin API, rozhraní API Cassandra a rozhraní API pro tabulky se nepodporuje.
odkaz Synapse se dá povolit pro nové kontejnery pro účty rozhraní api SQL api i MongoDB, ale existující kontejnery se podporují jenom pro SQL api.
Zálohování a obnovení dat v analytickém úložišti není momentálně podporováno. toto omezení se aplikuje na režimy pravidelného i průběžného zálohování a nemá vliv na Cosmos DB data transakčního úložiště.
V rámci stejného databázového účtu se podporuje koexistence synapse odkazů a režimu pravidelného zálohování. Zálohování dat v transakčním režimu můžete provádět normálně. Pokud používáte
transactional TTLstejné nebo větší, než jeanalytical TTL, můžete obnovit transakční data a znovu vytvořit analytické úložiště.Koexistence propojení synapse a režimu nepřetržitého zálohování ve stejném databázovém účtu se nepodporují. Pokud povolíte režim nepřetržité zálohování, nebudete moct synapse odkaz zapnout, a naopak.
přístup k Azure Cosmos DB analytics storu s vyhrazeným fondem SQL Azure Synapse se v tuto chvíli nepodporuje.
Odkaz na Azure synapse a režim periodického zálohování můžou existovat ve stejném databázovém účtu. Data analytického úložiště nejsou ale součástí záloh a obnovení. když je povolený odkaz Synapse, Azure Cosmos DB bude automaticky vytvářet zálohy vašich dat v transakčním úložišti v naplánovaném intervalu zálohování.
RBAC a spravovaná identita se aktuálně nepodporují.
Zabezpečení
Synapse Link vám umožní spouštět analýzy téměř v reálném čase v rámci důležitých dat v Azure Cosmos DB. Je důležité zajistit, aby byla důležitá obchodní data bezpečně ukládána napříč transakčními i analytickými obchody. odkaz na službu Azure Synapse pro Azure Cosmos DB je navržený tak, aby splňoval tyto požadavky na zabezpečení prostřednictvím následujících funkcí:
Izolace sítě pomocí soukromých koncových bodů – k datům v transakčních a analytických úložištích můžete řídit síťový přístup nezávisle. Izolace sítě se provádí pomocí samostatných spravovaných privátních koncových bodů pro každé úložiště v rámci spravovaných virtuálních sítí v pracovních prostorech Azure synapse. Další informace najdete v článku postup Konfigurace privátních koncových bodů pro analytické úložiště .
Šifrování dat pomocí klíčů spravovaných zákazníkem – data můžete bez problémů šifrovat napříč transakčními a analytickými úložišti, a to pomocí automatického a transparentního klíče spravovaného zákazníky. Azure Synapse Link podporuje konfiguraci klíčů spravovaných zákazníkem jenom pomocí spravované identity účtu Azure Cosmos DB. Před povolením odkazu Azure synapse] (konfigurace-synapse-Link. MD # Enable-synapse-Link) na svém účtu musíte nakonfigurovat spravovanou identitu svého účtu v zásadách přístupu Azure Key Vault. další informace najdete v článku postup konfigurace klíčů spravovaných zákazníkem pomocí článku spravované identity účtů Azure Cosmos DB .
zabezpečená správa klíčů – přístup k datům v analytickém úložišti z Synapsech a Synapse serverů SQL Spark vyžaduje správu Azure Cosmos DB klíčů v rámci pracovních prostorů Synapse Analytics. místo používání Azure Cosmos DB klíčů účtu vloženého v úlohách sparku nebo ve SQLch skriptech poskytuje Azure Synapse linku bezpečnější možnosti:
pokud používáte Synapse fondy SQL bez serveru, můžete dotazovat se na Azure Cosmos DB analytické úložiště pomocí předběžného vytváření SQL přihlašovacích údajů ukládajících klíče účtu a jejich odkazování ve
OPENROWSETfunkci. další informace najdete v článku dotazování s SQLm fondem bez serveru v článku s odkazem na Azure Synapse .při použití Synapse Spark můžete ukládat klíče účtu v propojených objektech služby, které ukazují na databázi Azure Cosmos DB a odkazovat na ně v konfiguraci sparku za běhu. další informace najdete v tématu kopírování dat do vyhrazeného SQL fondu pomocí Apache Spark článku.
Ceny
model fakturace propojení Azure Synapse zahrnuje náklady vzniklé pomocí Azure Cosmos DBho analytického úložiště a modulu runtime Synapse. další informace najdete v článcích o cenách služby Azure Cosmos DB Analytics store a cenách Azure Synapse Analytics .
Další kroky
Další informace najdete v následujících dokumentech:
Podívejte se na modul Naučte se s návrhem hybridního transakčního a analytického zpracování pomocí Azure synapse Analytics .
Nejčastější dotazy k Azure Synapse Linku pro Azure Cosmos DB