Vad är Azure Synapse Link för Azure Cosmos DB?

GÄLLER för: SQL API Azure Cosmos DB API för MongoDB

Azure Synapse Link för Azure Cosmos DB är en molnbaserad funktion för transaktions- och analysbearbetning (HTAP) som gör att du kan köra analys i nästan realtid över driftdata i Azure Cosmos DB. Azure Synapse Link skapar en nära sömlös integrering mellan Azure Cosmos DB och Azure Synapse Analytics.

Med Azure Cosmos DBanalysarkiv , ett helt isolerat kolumnarkiv, möjliggör Azure Synapse Link ingen ETL-analys (Extract-Transform-Load) i Azure Synapse Analytics mot dina driftdata i stor skala. Affärsanalytiker, datatekniker och dataexperter kan nu använda Synapse Spark eller Synapse SQL synonymt för att köra pipelines för business intelligence, analys och maskininlärning i nära realtid. Du kan åstadkomma detta utan att påverka prestanda för dina transaktionsarbetsbelastningar på Azure Cosmos DB.

Följande bild visar integreringen Azure Synapse Link med Azure Cosmos DB och Azure Synapse Analytics:

Arkitekturdiagram för Azure Synapse Analytics integrering med Azure Cosmos DB

Fördelar

För att analysera stora driftdatamängder samtidigt som effekten på prestandan för verksamhetskritiska transaktionsarbetsbelastningar minimeras, extraheras och bearbetas driftdata i Azure Cosmos DB av ETL-pipelines (Extract-Transform-Load). ETL-pipelines kräver många lager av dataförflyttning, vilket resulterar i mycket driftskomplexitet och prestandapåverkan på dina transaktionsarbetsbelastningar. Det ökar också svarstiden för att analysera driftdata från ursprungstiden.

Jämfört med traditionella ETL-baserade lösningar erbjuder Azure Synapse Link för Azure Cosmos DB flera fördelar, till exempel:

Minskad komplexitet utan ETL-jobb att hantera

Azure Synapse Link kan du direkt komma åt Azure Cosmos DB analysarkiv med Azure Synapse Analytics utan komplex dataförflyttning. Alla uppdateringar som görs i driftdata visas i analysarkivet nästan i realtid utan ETL- eller ändringsflödesjobb. Du kan köra storskalig analys mot analysarkiv från Azure Synapse Analytics utan ytterligare datatransformering.

Insikter i nära realtid om dina driftdata

Nu kan du få omfattande insikter om dina driftdata nästan i realtid med hjälp av Azure Synapse Link. ETL-baserade system tenderar att ha högre svarstid för att analysera dina driftdata, på grund av många lager som behövs för att extrahera, transformera och läsa in driftdata. Med intern integrering av Azure Cosmos DB analysarkiv med Azure Synapse Analytics kan du analysera driftdata i nära realtid och aktivera nya affärsscenarier.

Ingen inverkan på operativa arbetsbelastningar

Med Azure Synapse Link kan du köra analysfrågor mot ett Azure Cosmos DB-analysarkiv (ett separat kolumnarkiv) medan transaktionella åtgärder bearbetas med etablerat dataflöde för transaktionsarbetsbelastningen (ett radbaserat transaktionsarkiv). Den analytiska arbetsbelastningen betjänas oberoende av transaktionsarbetsbelastningens trafik utan att förbruka något dataflöde som etablerats för dina driftdata.

Optimerad för storskaliga analysarbetsbelastningar

Azure Cosmos DB analysarkiv är optimerat för att ge skalbarhet, elasticitet och prestanda för analytiska arbetsbelastningar utan beroende av beräkningskörningstiderna. Lagringstekniken är själv hanterad för att optimera dina analysarbetsbelastningar. Med inbyggt stöd i Azure Synapse Analytics ger åtkomst till det här lagringslagret enkelhet och höga prestanda.

Kostnadseffektiv

Med Azure Synapse Link kan du få en kostnadsoptimerad, fullständigt hanterad lösning för driftsanalys. Det eliminerar de extra lager av lagring och beräkning som krävs i traditionella ETL-pipelines för analys av driftdata.

Azure Cosmos DB analysarkiv följer en förbrukningsbaserad prismodell som baseras på datalagring och analytiska läs-/skrivåtgärder och frågor som körs . Det kräver inte att du etablerar något dataflöde, som du gör i dag för transaktionsarbetsbelastningarna. Åtkomst till dina data med mycket elastiska beräkningsmotorer från Azure Synapse Analytics gör den totala kostnaden för att köra lagring och beräkning mycket effektiv.

Analys för lokalt tillgängliga, globalt distribuerade skrivningar för flera regioner

Du kan köra analysfrågor effektivt mot den närmaste regionala kopian av data i Azure Cosmos DB. Azure Cosmos DB den senaste funktionen för att köra globalt distribuerade analytiska arbetsbelastningar tillsammans med transaktionsarbetsbelastningar på ett aktivt-aktivt sätt.

Aktivera HTAP-scenarier för dina driftdata

Synapse Link samman Azure Cosmos DB analysarkiv med stöd Azure Synapse för analyskörning. Med den här integreringen kan du skapa molnbaserade HTAP-lösningar (hybridtransaktionsbaserad/analytisk bearbetning) som genererar insikter baserat på realtidsuppdateringar av dina driftdata över stora datamängder. Det låser upp nya affärsscenarier för att skapa aviseringar baserat på livetrender, skapa instrumentpaneler i nära realtid och affärsupplevelser baserat på användarbeteende.

Azure Cosmos DB analysarkiv

Azure Cosmos DB analysarkiv är en kolumnorienterad representation av dina driftdata i Azure Cosmos DB. Det här analysarkivet lämpar sig för snabba och kostnadseffektiva frågor om stora driftdatamängder, utan att kopiera data och påverka prestanda för dina transaktionsarbetsbelastningar.

Analysarkiv hämtar automatiskt infogningar, uppdateringar och borttagningar i transaktionsarbetsbelastningar i nära realtid som en fullständigt hanterad funktion ("automatisk synkronisering") av Azure Cosmos DB. Ingen ändringsfeed eller ETL krävs.

Om du har ett globalt Azure Cosmos DB-konto blir det tillgängligt i alla regioner för det kontot när du aktiverar analysarkiv för en container. Mer information om analysarkivet finns i översiktsartikeln Azure Cosmos DB analysarkiv.

Integrering med Azure Synapse Analytics

Med Synapse Link kan du nu ansluta direkt till dina Azure Cosmos DB containrar från Azure Synapse Analytics och komma åt analysarkivet utan separata anslutningsappar. Azure Synapse Analytics stöder för närvarande Synapse Link med Synapse Apache Spark och serverlös SQL pool .

Du kan fråga efter data från Azure Cosmos DB analysarkiv samtidigt, med interop över olika analyskörningstider som stöds av Azure Synapse Analytics. Inga ytterligare datatransformationer krävs för att analysera driftdata. Du kan köra frågor mot och analysera analysarkivdata med hjälp av:

  • Synapse Apache Spark med fullständigt stöd för Scala, Python, SparkSQL och C#. Synapse Spark är centralt för datateknik- och datavetenskapsscenarier

  • Serverlös SQL med T-SQL och stöd för välbekanta BI-verktyg (till exempel Power BI Premium osv.)

Anteckning

Från Azure Synapse Analytics kan du komma åt både analys- och transaktionslager i din Azure Cosmos DB container. Men om du vill köra storskaliga analyser eller genomsökningar på dina driftdata rekommenderar vi att du använder analysarkiv för att undvika prestandapåverkan på transaktionsarbetsbelastningar.

Anteckning

Du kan köra analys med kort svarstid i en Azure-region genom att ansluta din Azure Cosmos DB till Synapse-körningen i den regionen.

Den här integreringen möjliggör följande HTAP-scenarier för olika användare:

  • En BI-tekniker som vill modellera och publicera en Power BI-rapport för att få åtkomst till driftdata i Azure Cosmos DB direkt via Synapse SQL.

  • En dataanalytiker som vill härleda insikter från driftdata i en Azure Cosmos DB-container genom att fråga den med Synapse SQL, läsa data i stor skala och kombinera dessa resultat med andra datakällor.

  • En dataexpert som vill använda Synapse Spark för att hitta en funktion för att förbättra sin modell och träna modellen utan att göra komplex datateknik. De kan också skriva resultatet av modellinferensen till Azure Cosmos DB för realtidsbedömning av data via Spark Synapse.

  • En datatekniker som vill göra data tillgängliga för konsumenter genom att skapa SQL eller Spark-tabeller över Azure Cosmos DB-containrar utan manuella ETL-processer.

Mer information om hur Azure Synapse Analytics stöd för Azure Cosmos DB finns i Azure Synapse Analytics för Cosmos DB support.

Synapse Link rekommenderas i följande fall:

  • Om du är Azure Cosmos DB kund och vill köra analys, BI och maskininlärning över dina driftdata. I sådana fall ger Synapse Link en mer integrerad analysupplevelse utan att påverka transaktionslagrets etablerade dataflöde. Exempel:

    • Om du kör analys eller BI på din Azure Cosmos DB data direkt via separata anslutningsappar idag, eller

    • Om du kör ETL-processer för att extrahera driftdata till ett separat analyssystem.

I sådana fall ger Synapse Link en mer integrerad analysupplevelse utan att påverka transaktionslagrets etablerade dataflöde.

Synapse Link rekommenderas inte om du letar efter traditionella informationslagerkrav som hög samtidighet, arbetsbelastningshantering och beständighet för aggregeringar över flera datakällor. Mer information finns i vanliga scenarier som kan drivas med Azure Synapse Link för Azure Cosmos DB.

Begränsningar

  • Azure Synapse Link for Azure Cosmos DB stöds för SQL API och Azure Cosmos DB API for MongoDB. Det stöds inte för Gremlin API, API för Cassandra och Tabell-API.

  • Synapse Link kan aktiveras på nya containrar för både SQL API- och MongoDB API-konton, men befintliga containrar stöds endast för SQL API.

  • Säkerhetskopiering och återställning av data i analysarkiv stöds inte just nu. Den här begränsningen tillämpas på både periodiska och kontinuerliga säkerhetskopieringslägen och påverkar inte Cosmos DB lagra data i transaktionslagret.

  • Synapse Link och periodisk samexistens i säkerhetskopieringsläge i samma databaskonto stöds. Du kan göra säkerhetskopior av dina transaktionsdata normalt. Om du använder transactional TTL samma eller större än , kan du återställa dina analytical TTL transaktionsdata och återskapa analysarkivet.

  • Synapse Link och kontinuerlig säkerhetskopiering i samexistens i samma databaskonto stöds inte. Om du aktiverar kontinuerligt säkerhetskopieringsläge kan du inte aktivera Synapse Link och vice versa.

  • Åtkomst till Azure Cosmos DB Analytics Store med Azure Synapse Dedikerad SQL pool stöds inte för närvarande.

  • Azure Synapse Link och periodiskt säkerhetskopieringsläge kan samexistera i samma databaskonto. Analysarkivdata ingår dock inte i säkerhetskopior och återställningar. När Synapse Link är aktiverat fortsätter Azure Cosmos DB automatiskt att göra säkerhetskopior av dina data i transaktionslagret vid ett schemalagt säkerhetskopieringsintervall.

  • RBAC och hanterad identitet stöds inte för närvarande.

Säkerhet

Synapse Link kan du köra analyser nästan i realtid över dina verksamhetskritiska data i Azure Cosmos DB. Det är viktigt att se till att kritiska affärsdata lagras på ett säkert sätt i både transaktionslager och analyslager. Azure Synapse Link för Azure Cosmos DB har utformats för att uppfylla dessa säkerhetskrav med hjälp av följande funktioner:

  • Nätverksisolering med privata slutpunkter – Du kan styra nätverksåtkomsten till data i transaktions- och analysarkiven oberoende av varandra. Nätverksisolering görs med hjälp av separata hanterade privata slutpunkter för varje butik i hanterade virtuella nätverk i Azure Synapse arbetsytor. Mer information finns i artikeln Konfigurera privata slutpunkter för analysarkiv.

  • Datakryptering med kund hanterade nycklar – Du kan smidigt kryptera data i transaktions- och analysarkiv med samma kund hanterade nycklar på ett automatiskt och transparent sätt. Azure Synapse Link stöder endast konfigurering av kund-hanterade nycklar Azure Cosmos DB ditt kontos hanterade identitet. Du måste konfigurera kontots hanterade identitet i din Azure Key Vault-åtkomstprincip innan du aktiverar Azure Synapse Link](configure-synapse-link.md#enable-synapse-link) på ditt konto. Mer information finns i artikeln Configure customer-managed keys using Azure Cosmos DB accounts'managed identities (Konfigurera kund hanterade nycklar med hjälp Azure Cosmos DB hanterade identiteter).

  • Säker nyckelhantering – Åtkomst till data i analysarkiv från Synapse Spark- och Synapse-serverlösa SQL-pooler kräver hantering av Azure Cosmos DB nycklar inom Synapse Analytics arbetsytor. I stället för att Azure Cosmos DB infogade kontonycklar i Spark-jobb eller SQL-skript ger Azure Synapse Link säkrare funktioner:

    • När du använder Synapse-serverlösa SQL-pooler kan du fråga Azure Cosmos DB-analysarkivet genom att skapa SQL-autentiseringsuppgifter som lagrar kontonycklarna och refererar till dem i OPENROWSET funktionen. Mer information finns i artikeln Fråga med en serverlös SQL i Azure Synapse Link.

    • När du använder Synapse Spark kan du lagra kontonycklarna i länkade tjänstobjekt som pekar på en Azure Cosmos DB-databas och referera till detta i Spark-konfigurationen vid körning. Mer information finns i artikeln Kopiera data till en SQL dedikerad pool med Apache Spark datapool.

Prissättning

Faktureringsmodellen för Azure Synapse Link innehåller kostnader som uppstår vid användning av Azure Cosmos DB-analysarkivet och Synapse-körningen. Mer information finns i prisartiklarna Azure Cosmos DB analysarkiv och Azure Synapse Analytics prisartiklar.

Nästa steg

Mer information finns i följande dokument: