Wat is Azure Synapse Link voor Azure Cosmos DB?

VAN toepassing op: SQL api Azure Cosmos DB API voor MongoDb

Azure Synapse Link for Azure Cosmos DB is een cloudeigen HTAP-functie (hybrid transactional and analytical processing) waarmee u bijna realtime analyses kunt uitvoeren op operationele gegevens in Azure Cosmos DB. Azure Synapse Link zorgt voor een naadloze integratie tussen Azure Cosmos DB en Azure Synapse Analytics.

Met Azure Cosmos DBanalytische opslag, een volledig geïsoleerde kolomopslag, maakt Azure Synapse Link geen ETL-analyses (Extract-Transform-Load) mogelijk in Azure Synapse Analytics ten opzichte van uw operationele gegevens op schaal. Bedrijfsanalisten, data engineers en gegevenswetenschappers kunnen nu Synapse Spark of Synapse SQL door elkaar gebruiken om bijna realtime business intelligence-, analyse- en machine learning-pijplijnen uit te voeren. U kunt dit doen zonder dat dit van invloed is op de prestaties van uw transactionele werkbelastingen op Azure Cosmos DB.

In de volgende afbeelding ziet u de Azure Synapse Link-integratie met Azure Cosmos DB en Azure Synapse Analytics:

Architectuurdiagram voor Azure Synapse Analytics integratie met Azure Cosmos DB

Voordelen

Om grote operationele gegevenssets te analyseren en tegelijkertijd de impact op de prestaties van essentiële transactionele workloads te minimaliseren, worden de operationele gegevens in Azure Cosmos DB traditioneel geëxtraheerd en verwerkt door ETL-pijplijnen (Extract-Transform-Load). ETL-pijplijnen vereisen veel lagen van gegevensver movement, wat resulteert in veel operationele complexiteit en invloed op de prestaties van uw transactionele workloads. Het verhoogt ook de latentie voor het analyseren van de operationele gegevens vanaf het tijdstip van oorsprong.

In vergelijking met de traditionele ETL-oplossingen biedt Azure Synapse Link for Azure Cosmos DB verschillende voordelen, zoals:

Minder complexiteit met geen ETL-taken om te beheren

Azure Synapse Link kunt u rechtstreeks toegang krijgen tot Azure Cosmos DB analytische opslag met behulp Azure Synapse Analytics zonder complexe gegevens verplaatsen. Updates van de operationele gegevens zijn in bijna realtime zichtbaar in de analytische opslag zonder ETL- of wijzigingenfeedtaken. U kunt grootschalige analyses uitvoeren op analytische opslag, Azure Synapse Analytics, zonder aanvullende gegevenstransformatie.

Bijna realtime inzichten in uw operationele gegevens

U kunt nu in bijna realtime uitgebreide inzichten krijgen in uw operationele gegevens met behulp van Azure Synapse Link. ETL-systemen hebben vaak een hogere latentie voor het analyseren van uw operationele gegevens, omdat er veel lagen nodig zijn om de operationele gegevens te extraheren, transformeren en laden. Met de systeemeigen integratie van Azure Cosmos DB analytische opslag met Azure Synapse Analytics kunt u operationele gegevens in bijna realtime analyseren voor nieuwe bedrijfsscenario's.

Geen invloed op operationele workloads

Met Azure Synapse Link kunt u analytische query's uitvoeren op een analytische opslag van Azure Cosmos DB (een afzonderlijk kolomopslag) terwijl de transactionele bewerkingen worden verwerkt met behulp van ingerichte doorvoer voor de transactionele workload (een transactionele opslag op rijbasis). De analytische workload wordt onafhankelijk van het transactionele workloadverkeer bediend zonder gebruik te maken van de doorvoer die is ingericht voor uw operationele gegevens.

Geoptimaliseerd voor grootschalige analyseworkloads

Azure Cosmos DB analytische opslag is geoptimaliseerd om schaalbaarheid, elasticiteit en prestaties te bieden voor analytische workloads zonder afhankelijk te zijn van de rekenrun times. De opslagtechnologie wordt zelf beheerd om uw analyseworkloads te optimaliseren. Met ingebouwde ondersteuning in Azure Synapse Analytics biedt toegang tot deze opslaglaag eenvoud en hoge prestaties.

Rendabel

Met Azure Synapse Link kunt u een voor kosten geoptimaliseerde, volledig beheerde oplossing voor operationele analyse krijgen. Het elimineert de extra opslag- en rekenlagen die nodig zijn in traditionele ETL-pijplijnen voor het analyseren van operationele gegevens.

Azure Cosmos DB analytische opslag volgt een prijsmodel op basis van verbruik, dat is gebaseerd op gegevensopslag en analytische lees-/schrijfbewerkingen en query's die worden uitgevoerd. U hoeft geen doorvoer in terichten, zoals u dat nu doet voor de transactionele workloads. Door toegang te krijgen tot uw gegevens met zeer elastische berekeningsen engines Azure Synapse Analytics maakt u de totale kosten van het uitvoeren van opslag en rekenkracht zeer efficiënt.

Analyse voor lokaal beschikbare, wereldwijd gedistribueerde schrijf- en schrijf schrijf uit meerdere regio's

U kunt analytische query's effectief uitvoeren op de dichtstbijzijnde regionale kopie van de gegevens in Azure Cosmos DB. Azure Cosmos DB biedt de meest moderne mogelijkheid om de wereldwijd gedistribueerde analytische workloads samen met transactionele workloads op een actief/actief-manier uit te voeren.

HTAP-scenario's voor uw operationele gegevens inschakelen

Synapse Link brengt de analytische opslag Azure Cosmos DB samen met Azure Synapse analytics runtime-ondersteuning. Met deze integratie kunt u cloudeigen HTAP-oplossingen (hybride transactionele/analytische verwerking) bouwen die inzichten genereren op basis van realtime updates van uw operationele gegevens over grote gegevenssets. Het ontgrendelt nieuwe bedrijfsscenario's om waarschuwingen te geven op basis van live trends, dashboards in bijna realtime te bouwen en zakelijke ervaringen te maken op basis van gebruikersgedrag.

Azure Cosmos DB-opslag

Azure Cosmos DB analytische opslag is een kolomgeoriënteerde weergave van uw operationele gegevens in Azure Cosmos DB. Deze analytische opslag is geschikt voor snelle, rendabele query's op grote operationele gegevenssets, zonder gegevens te kopiëren en de prestaties van uw transactionele workloads te beïnvloeden.

Analytische opslag haalt automatisch invoegingen, updates en verwijderingen in bijna realtime op in uw transactionele workloads, als een volledig beheerde mogelijkheid ('automatische synchronisatie') van Azure Cosmos DB. Er is geen wijzigingsfeed of ETL vereist.

Als u een wereldwijd gedistribueerd account Azure Cosmos DB opslagaccount hebt, is het account na het inschakelen van analytische opslag voor een container beschikbaar in alle regio's voor dat account. Zie het artikel Overzicht van analytische opslag voor Azure Cosmos DB analytische opslag voor meer informatie over de analytische opslag.

Integratie met Azure Synapse Analytics

Met Synapse Link kunt u nu rechtstreeks verbinding maken met uw Azure Cosmos DB-containers vanuit Azure Synapse Analytics en toegang krijgen tot de analytische opslag zonder afzonderlijke connectors. Azure Synapse Analytics ondersteunt momenteel Synapse Link synapse-Apache Spark en serverloze SQL pool.

U kunt de gegevens opvragen uit Azure Cosmos DB analytische opslag tegelijk, met interop tussen verschillende analyserun times die worden ondersteund door Azure Synapse Analytics. Er zijn geen aanvullende gegevenstransformaties vereist voor het analyseren van de operationele gegevens. U kunt de analytische opslaggegevens opvragen en analyseren met behulp van:

  • Synapse Apache Spark volledige ondersteuning voor Scala, Python, SparkSQL en C#. Synapse Spark staat centraal in data engineering scenario's voor gegevenswetenschap

  • Serverloze SQL met T-SQL taal en ondersteuning voor bekende BI-hulpprogramma's (bijvoorbeeld Power BI Premium, enzovoort)

Notitie

Vanuit Azure Synapse Analytics hebt u toegang tot zowel analytische als transactionele winkels in Azure Cosmos DB container. Als u echter grootschalige analyses of scans wilt uitvoeren op uw operationele gegevens, raden we u aan analytische opslag te gebruiken om prestatie-impact op transactionele workloads te voorkomen.

Notitie

U kunt analyses met lage latentie uitvoeren in een Azure-regio door uw Azure Cosmos DB container te verbinden met Synapse-runtime in die regio.

Deze integratie maakt de volgende HTAP-scenario's mogelijk voor verschillende gebruikers:

  • Een BI-engineer die een Power BI-rapport wil modelleren en publiceren voor toegang tot de live operationele gegevens in Azure Cosmos DB rechtstreeks via Synapse SQL.

  • Een gegevensanalist die inzichten wil afleiden uit de operationele gegevens in een Azure Cosmos DB-container door er query's op uit te voeren met Synapse SQL, de gegevens op schaal te lezen en deze bevindingen te combineren met andere gegevensbronnen.

  • Een data scientist die Synapse Spark wil gebruiken om een functie te vinden om het model te verbeteren en dat model te trainen zonder complexe data engineering. Ze kunnen ook de resultaten van het model na de deference naar Azure Cosmos DB voor realtime scoren van de gegevens via Spark Synapse.

  • Een data engineer die gegevens toegankelijk wil maken voor consumenten door SQL- of Spark-tabellen te maken via Azure Cosmos DB containers zonder handmatige ETL-processen.

Zie Voor meer informatie Azure Synapse Analytics ondersteuning voor runtime voor Azure Cosmos DB, Azure Synapse Analytics voor Cosmos DB ondersteuning.

Synapse Link wordt aanbevolen in de volgende gevallen:

  • Als u een Azure Cosmos DB bent en u analyses, BI en machine learning uw operationele gegevens wilt uitvoeren. In dergelijke gevallen biedt Synapse Link een meer geïntegreerde analyse-ervaring zonder dat dit van invloed is op de inrichtende doorvoer van uw transactionele opslag. Bijvoorbeeld:

    • Als u analyses of BI op uw Azure Cosmos DB operationele gegevens rechtstreeks met behulp van afzonderlijke connectors vandaag, of

    • Als u ETL-processen gebruikt om operationele gegevens te extraheren in een afzonderlijk analysesysteem.

In dergelijke gevallen biedt Synapse Link een meer geïntegreerde analyse-ervaring zonder dat dit van invloed is op de inrichtende doorvoer van uw transactionele opslag.

Synapse Link wordt niet aanbevolen als u op zoek bent naar traditionele vereisten voor datawarehouses, zoals hoge gelijktijdigheid, workloadbeheer en persistentie van statistische gegevensbronnen. Zie voor meer informatie algemene scenario's die kunnen worden ingeschakeld met Azure Synapse Link voor Azure Cosmos DB.

Beperkingen

  • Azure Synapse Link voor Azure Cosmos DB wordt ondersteund voor SQL API en Azure Cosmos DB voor MongoDB-API. Het wordt niet ondersteund voor Gremlin API, Cassandra-API en Table-API.

  • Synapse Link kunnen worden ingeschakeld voor nieuwe containers voor zowel SQL API- als MongoDB-API-accounts, maar bestaande containers worden alleen ondersteund voor SQL API.

  • Back-up en herstel van uw gegevens in de analytische opslag wordt op dit moment niet ondersteund. Deze beperking wordt toegepast op periodieke en continue back-upmodi en heeft geen invloed op uw Cosmos DB transactionele opslaggegevens.

  • Synapse Link en periodieke back-upmodus naast elkaar in hetzelfde databaseaccount worden ondersteund. U kunt normaal back-ups maken van uw transactionele gegevens. Als u gelijk transactional TTL aan of groter dan uw gebruikt, kunt u uw transactionele gegevens herstellen analytical TTL en uw analytische opslag opnieuw maken.

  • Synapse Link en continue back-upmodus naast elkaar in hetzelfde databaseaccount worden niet ondersteund. Als u de modus voor continue back-ups inschakelen, kunt u de Synapse Link inschakelen en vice versa.

  • Toegang tot Azure Cosmos DB Analytics Store met Azure Synapse Dedicated SQL Pool wordt momenteel niet ondersteund.

  • Azure Synapse koppelings- en periodieke back-upmodus kunnen naast elkaar bestaan in hetzelfde databaseaccount. Analytische opslaggegevens zijn echter niet opgenomen in back-ups en herstel. Wanneer Synapse Link is ingeschakeld, Azure Cosmos DB automatisch back-ups van uw gegevens in de transactionele opslag maken met een gepland back-upinterval.

  • RBAC en beheerde identiteit worden momenteel niet ondersteund.

Beveiliging

Synapse Link kunt u bijna realtime analyses uitvoeren voor uw bedrijfskritische gegevens in Azure Cosmos DB. Het is essentieel om ervoor te zorgen dat kritieke bedrijfsgegevens veilig worden opgeslagen in zowel transactionele als analytische opslag. Azure Synapse Link for Azure Cosmos DB is ontworpen om te voldoen aan deze beveiligingsvereisten via de volgende functies:

  • Netwerkisolatie met behulp van privé-eindpunten: u kunt de netwerktoegang tot de gegevens in de transactionele en analytische opslag onafhankelijk van elkaar bepalen. Netwerkisolatie wordt uitgevoerd met behulp van afzonderlijke beheerde privé-eindpunten voor elke winkel, binnen beheerde virtuele netwerken in Azure Synapse werkruimten. Zie het artikel Privé-eindpunten configureren voor analytische opslag voor meer informatie.

  • Gegevensversleuteling met door de klant beheerde sleutels: u kunt de gegevens naadloos op een automatische en transparante manier versleutelen in transactionele en analytische opslag met dezelfde door de klant beheerde sleutels. Azure Synapse Link biedt alleen ondersteuning voor het configureren van door de klant beheerde sleutels met behulp Azure Cosmos DB beheerde identiteit van uw account. U moet de beheerde identiteit van uw account configureren in uw Azure Key Vault-toegangsbeleid voordat u Azure Synapse Link](configure-synapse-link.md#enable-synapse-link) in uw account inschakelen. Zie het artikel Door de klant beheerde sleutels configureren met behulp van Azure Cosmos DB-accounts voor meer informatie.

  • Beveiligd sleutelbeheer: voor toegang tot de gegevens in analytische opslag vanuit serverloze SQL-pools van Synapse Spark en Synapse is het beheer van Azure Cosmos DB-sleutels in Synapse Analytics werkruimten vereist. In plaats van de Azure Cosmos DB-accountsleutels inline te gebruiken in Spark-taken of SQL scripts, biedt Azure Synapse Link veiligere mogelijkheden:

    • Wanneer u serverloze synapse-SQL-pools gebruikt, kunt u een query uitvoeren op de analytische opslag van Azure Cosmos DB door vooraf SQL-referenties te maken voor het opslaan van de accountsleutels en deze in de functie te OPENROWSET verwijzen. Zie Het artikel Query's uitvoeren met een serverloze SQL pool in Azure Synapse Link voor meer informatie.

    • Wanneer u Synapse Spark gebruikt, kunt u de accountsleutels opslaan in gekoppelde serviceobjecten die verwijzen naar een Azure Cosmos DB-database en hier tijdens runtime naar verwijzen in de Spark-configuratie. Zie het artikel Copy data into a dedicated SQL pool using Apache Spark (Gegevens kopiëren naar een SQL pool met behulp Apache Spark meer informatie.

Prijzen

Het factureringsmodel van Azure Synapse Link omvat de kosten die worden gemaakt met behulp van Azure Cosmos DB analytische opslag en de Synapse-runtime. Zie de artikelen Prijzen voor analytische Azure Cosmos DB en Azure Synapse Analytics voor meer informatie.

Volgende stappen

Zie de volgende documenten voor meer informatie: