Co to jest usługa Azure Synapse Link dla usługi Azure Cosmos DB?

DOTYCZY: SQL API Azure Cosmos DB API for MongoDB

Azure Synapse Link dla usługi Azure Cosmos DB to natywna w chmurze funkcja hybrydowego przetwarzania transakcji i analitycznego (HTAP, Cloud Synapse Link) umożliwiająca uruchamianie analizy w czasie rzeczywistym nad danymi operacyjnymi w usłudze Azure Cosmos DB. Usługa Azure Synapse Link zapewnia ścisłą, bezproblemową integrację między usługą Azure Cosmos DB i Azure Synapse Analytics.

Korzystanie z magazynu analitycznego usługi Azure Cosmos DB, w pełni odizolego magazynu kolumny, usługa Azure Synapse Link nie udostępnia analizy Extract-Transform-Load (ETL) w usłudze Azure Synapse Analytics w danych operacyjnych na skalę. Analitycy biznesowi, inżynierowie danych i śledzenia danych mogą teraz korzystać z funkcji Synapse Spark lub Synapse SQL zamiennie do uruchamiania w pobliżu analizy biznesowej w czasie rzeczywistym, analizy i maszynowych potoków uczenia. Możesz to osiągnąć bez wpływu na wydajność obciążeń transakcji na platformie Azure Cosmos DB.

Na poniższej ilustracji przedstawiono integrację usługi Azure Synapse Link z usługą Azure Cosmos DB i Azure Synapse Analytics:

Architecture diagram for Azure Synapse Analytics integration with Azure Cosmos DB

Aby analizować duże zestawy danych operacyjnych, minimalizując wpływ na wydajność kluczowych obciążeń transakcji , tradycyjne, dane operacyjne w usłudze Azure Cosmos DB są wyodrębnianie i przetwarzane przez potoki wyodrębniania-przekształcania (ETL, Extract-Transform-Load). Potoki z wartością czasu wygaśnięcia wymagają wielu warstw ruchu danych, co zwiększa złożoność operacyjną i wpływa na wydajność obciążeń transakcji. Zwiększa to także opóźnienie w celu analizowania danych operacyjnych od czasu pochodzenia.

W porównaniu z tradycyjnymi rozwiązaniami opartymi na etlu usługa Azure Synapse Link dla usługi Azure Cosmos DB oferuje kilka zalet, takich jak:

Ograniczona złożoność z zarządzaniem zadaniami bez etla

Usługa Azure Synapse Link umożliwia bezpośredni dostęp do magazynu analitycznego usługi Azure Cosmos DB przy użyciu usługi Azure Synapse Analytics bez złożonego ruchu danych. Wszelkie aktualizacje danych operacyjnych są widoczne w magazynie analitycznym w niedalekiej czasie rzeczywistym bez czasu wygaśnięcia lub zmieniania zadań kanału informacyjnego. Możesz korzystać z analizy na dużą skalę dla magazynu analitycznego z usługi Azure Synapse Analytics, bez dodatkowych przekształceń danych.

Niemal szczegółowe informacje o danych operacyjnych w czasie rzeczywistym

Teraz możesz uzyskać szczegółowe informacje na temat danych operacyjnych w niedalekiej czasie rzeczywistym przy użyciu usługi Azure Synapse Link. Systemy oparte na adresie ETL zwykle mają większe opóźnienia w analizie danych operacyjnych ze względu na wiele warstw potrzebnych do wyodrębniania, przekształcania i ładowania danych operacyjnych. Dzięki natywnej integracji usługi Azure Cosmos db analytical store z usługą Azure Synapse Analytics możesz analizować dane operacyjne w czasie rzeczywistym, umożliwiając korzystanie z nowych scenariuszy biznesowych.

Brak wpływu na obciążenia pracą operacyjną

Za pomocą usługi Azure Synapse Link możesz uruchamiać zapytania analityczne dla magazynu analitycznego usługi Azure Cosmos DB (oddzielnego magazynu kolumn), podczas gdy operacje transakcji są przetwarzane przy użyciu przepływności aprowizowanej dla obciążenia transakcji (opartego na wierszach magazynu transakcji). Obciążenie pracą analityczne jest obsługiwane niezależnie od ruchu obciążenia transakcji bez zużywania jakiejkolwiek przepływności obsługiwanej dla danych operacyjnych.

Zoptymalizowane pod kątem obciążeń analiz na dużą skalę

Magazyn Cosmos azure Cosmos db został zoptymalizowany w celu zapewnienia skalowalności, elastyczności i wydajności dla obciążeń analitycznych bez żadnej zależności od czasu wykonywania obliczeń. Technologia magazynowania jest zarządzana samodzielnie w celu optymalizowania obciążeń analiz. Dzięki wbudowanej obsłudze w usłudze Azure Synapse Analytics dostęp do tej warstwy magazynu zapewnia prostotę i wysoką wydajność.

Ekonomiczne

Usługa Azure Synapse Link pozwala uzyskać zoptymalizowane pod kątem kosztów, w pełni zarządzane rozwiązanie do analizy operacyjnej. Eliminuje to dodatkowe warstwy magazynowania i obliczenia wymagane w tradycyjnych potokach ETL do analizowania danych operacyjnych.

Baza Cosmos Azure Cosmos db zgodnie z modelem cen opartym na użyciu, który jest oparty na magazynie danych oraz operacjach zapisu i odczytu analitycznego oraz wykonywanych zapytaniach. Nie wymaga to zapewnienia obsługi jakiejkolwiek przepływności, tak jak robisz to obecnie w przypadku obciążeń transakcji. Uzyskiwanie dostępu do danych za pomocą wysoce elastycznych aparatów obliczeniowych z usługi Azure Synapse Analytics zapewnia całkowity koszt uruchomionego magazynu i jest bardzo wydajny.

Analiza dostępna lokalnie, globalna usługa zapisu dla wielu regionów

Możesz efektywnie uruchamiać zapytania analityczne dla najbliższej regionalnego kopii danych na platformie Azure Cosmos DB. Baza danych usługi Azure Cosmos zapewnia najnowodnową funkcję uruchamiania globalnie rozłożonych obciążeń analitycznych wraz z obciążeniami transakcji w sposób aktywny.

Włączanie scenariuszy HTAP dla danych operacyjnych

Aplikacja Synapse Link zapewnia dostęp do magazynu analitycznego Azure Cosmos DB z obsługą środowiska uruchomieniowego Azure Synapse analytics. Ta integracja umożliwia tworzenie natywnych rozwiązań HTAP (hybrydowego przetwarzania transakcji/analitycznego) w chmurze, które generują szczegółowe informacje na podstawie aktualizacji danych operacyjnych w czasie rzeczywistym na dużych zestawach danych. Odblokowuje ona nowe scenariusze biznesowe w celu podsyłania alertów na podstawie trendów na żywo, tworzenia niemal pulpitów nawigacyjnych w czasie rzeczywistym i możliwości biznesowych na podstawie zachowań użytkowników.

Magazyn Cosmos bazy danych Azure

Magazyn Cosmos Azure Cosmos DB to odzwierciedlenie danych operacyjnych w usłudze Azure Cosmos DB. Ten magazyn analityczny nadaje się do szybkiego i ekonomicznego wykonywania zapytań w dużych operacyjnych zestawach danych, bez kopiowania danych i wpływania na wydajność obciążeń transakcji.

Magazyn analityczny automatycznie pobiera wstawianie, aktualizacje i usunięcia o wysokiej częstotliwości w obciążeniach transakcji w czasie rzeczywistym jako w pełni zarządzaną funkcję ("autosynchronizowanie") usługi Azure Cosmos DB. Nie jest wymagany kanał zmiany ani adres ETL.

Jeśli masz globalną usługę Azure Cosmos DB, po włączeniu magazynu analitycznego dla kontenera będzie on dostępny we wszystkich regionach dla tego konta. Aby uzyskać więcej informacji na temat magazynu analitycznego, zobacz artykuł Cosmos omówienie magazynu db analytical.

Za pomocą linku Synapse Link możesz teraz bezpośrednio łączyć się z kontenerami bazy danych usługi Azure Cosmos z usługi Azure Synapse Analytics i uzyskać dostęp do magazynu analitycznego bez oddzielnych łączników. Usługa Azure Synapse Analytics obsługuje obecnie link Synapse Link z usługą Synapse Spark i pulą narzędzi bez SQL serwera.

Można jednocześnie uruchamiać zapytania dotyczące danych z magazynu analitycznego usługi Azure Cosmos DB, korzystając z zapytań z różnych czasów wykonywania analiz obsługiwanych przez usługę Azure Synapse Analytics. Do analizowania danych operacyjnych nie są wymagane żadne dodatkowe przekształcenia danych. Można kwerendować i analizować dane magazynu analitycznego przy użyciu:

  • Program Synapse Spark z pełną obsługą scala, Python, SparkSQL i C#. Proces Synapse Spark jest centralnym elementem scenariuszy inżynierskich i analizy danych

  • Pula SQL bez serwera z językiem T-SQL i obsługą znanych narzędzi analizy danych (na przykład Power BI Premium itp.).

Uwaga

Z usługi Azure Synapse Analytics możesz uzyskać dostęp zarówno do magazynów analitycznych, jak i magazynów transakcji w kontenerze bazy danych usługi Azure Cosmos DB. Jeśli jednak chcesz prowadzić analizy na dużą skalę lub skany na podstawie danych operacyjnych, zalecamy używanie magazynu analitycznego w celu uniknięcia wpływu wydajności na obciążenia transakcji.

Uwaga

Możesz uruchamiać analizy z małymi opóźnieniami w regionie platformy Azure, łącząc kontener bazy danych usługi Azure Cosmos z środowiskiem uruchomieniowym Synapse w tym regionie.

Ta integracja umożliwia różnym użytkownikom korzystanie z następujących scenariuszy z funkcjami HTAP:

  • Inżynier usługi bi, który chce modelować i publikować raport programu Power BI w celu uzyskania dostępu do danych operacyjnych na platformie Azure Cosmos DB bezpośrednio za pośrednictwem usługi Synapse SQL.

  • Analityk danych, który chce uzyskać szczegółowe informacje z danych operacyjnych w kontenerze bazy danych usługi Azure Cosmos, przeszukając je za pomocą zapytania Synapse SQL, odczytał te dane na skalę i łącząc te ustalenia z innymi źródłami danych.

  • Schowek danych, który chce korzystać z technologii Synapse Spark w celu znalezienia funkcji w celu ulepszenia swojego modelu i wyszkodowania tego modelu bez wykonywania skomplikowanych inżynierów danych. Mogą również pisać wyniki wpisu modelu w usłudze Azure Cosmos DB, aby uzyskać wyniki w czasie rzeczywistym na podstawie danych za pośrednictwem przebiegu przebiegu w czasie.

  • Inżynier danych, który chce, aby dane były dostępne dla klientów indywidualnych, przez utworzenie tabel danych SQL spark na platformie Azure Cosmos kontenerów bazy danych bez ręcznych procesów ETL.

Aby uzyskać więcej informacji na temat obsługi środowiska uruchomieniowego Azure Synapse Analytics dla bazy danych Azure Cosmos DB, zobacz Azure Synapse Analytics,aby uzyskać Cosmos obsługi bazy danych.

Link Synapse Link jest zalecany w następujących przypadkach:

  • Jeśli jesteś klientem usługi Azure Cosmos DB i chcesz prowadzić analizy, analizy biznesowe oraz uczenie maszynowe za pomocą danych operacyjnych. W takich przypadkach link Synapse Link zapewnia bardziej zintegrowane środowisko analizy bez wpływu na przepływność obsługi administracyjnej Twojego magazynu transakcji. Na przykład:

    • Jeśli obecnie korzystasz z analizy lub analizy biznesowej w usłudze Azure Cosmos DB danych operacyjnych bezpośrednio przy użyciu oddzielnych łączników lub

    • Jeśli przetwarzasz procesy ETL w celu wyodrębnienia danych operacyjnych do oddzielnego systemu analizy.

W takich przypadkach link Synapse Link zapewnia bardziej zintegrowane środowisko analizy bez wpływu na przepływność obsługi administracyjnej Twojego magazynu transakcji.

Link Synapse Link nie jest zalecany, jeśli szukasz tradycyjnych wymagań dotyczących magazynów danych, takich jak wysoka współbieżność, zarządzanie obciążeniem pracą i utrzymywanie wartości zagregowanych w wielu źródłach danych. Aby uzyskać więcej informacji, zobacz typowe scenariusze,które mogą być obsługiwane za pomocą usługi Azure Synapse Link dla usługi Azure Cosmos DB.

Ograniczenia

  • Usługa Azure Synapse Link dla usługi Azure Cosmos DB jest obsługiwana dla interfejsu API SQL i interfejsu API bazy danych Azure Cosmos dla bazy danych MongoDB. Nie jest obsługiwane w przypadku interfejsu API Gremlin, interfejsu API Cassandra ani interfejsu API tabeli.

  • Uzyskiwanie dostępu do magazynu analizy bazy danych Azure Cosmos za pomocą dedykowanej SQL Azure Synapse nie jest obecnie obsługiwane.

  • Włączanie linku Synapse Link Cosmos kontenerów DB jest obsługiwane tylko SQL acconts interfejsu API. Link Synapse Link można włączyć w nowych kontenerach zarówno dla nowego SQL API, jak i kont API MongoDB.

  • Wykonywanie i przywracanie kopii zapasowych danych w magazynie analitycznym nie jest obecnie obsługiwane. Możesz ponownie utworzyć dane magazynu analitycznego w niektórych scenariuszach, jak podano poniżej:

    • Azure Synapse Link i okresowa kopia zapasowa mogą współistnieć w tym samym koncie bazy danych. W tym trybie dane przechowywania transakcji będą automatycznie tworzone z kopii zapasowej. Jednak dane magazynu analitycznego nie są uwzględniane w kopiach zapasowych i przywracaniech. Jeśli używasz na kontenerze wartości równej lub większej niż Twój, możesz w pełni odtworzyć dane magazynu analitycznego, włączając magazyn analityczny na transactional TTLanalytical TTL przywróconym kontenerze. Pamiętaj, że obecnie możesz ponownie utworzyć magazyn analityczny tylko na przywróconych kontenerach na SQL API.
    • Współistnienie linku Synapse Link i ciągłej kopii zapasowej (point=przywracanie w czasie) nie jest obsługiwane dla tego samego konta bazy danych. Po włączeniu trybu ciągłej kopii zapasowej nie można włączyć linku Synapse Link i odwrotnie.
  • RBAC nie jest obsługiwany w przypadku wykonywania zapytań przy użyciu zapytania Synapse SQL niebędące serwerem.

Zabezpieczenia

Link Synapse Link umożliwia uruchomienie analizy w czasie rzeczywistym na kluczowych danych w usłudze Azure Cosmos DB. Należy koniecznie upewnić się, że krytyczne dane biznesowe są bezpiecznie przechowywane zarówno w sklepach transakcji, jak i w sklepach analitycznych. Baza danych Azure Synapse Link dla usługi Azure Cosmos db ma na celu pomóc w spełnić te wymagania dotyczące zabezpieczeń za pomocą następujących funkcji:

  • Izolacji sieci przy użyciu prywatnych punktów końcowych — możesz niezależnie kontrolować dostęp sieciowy do danych w sklepach transakcji i sklepach analitycznych. Izolacji sieci odbywa się przy użyciu oddzielnych zarządzanych prywatnych punktów końcowych dla każdego magazynu w obrębie zarządzanych sieci wirtualnych w obszarach roboczych Azure Synapse. Aby dowiedzieć się więcej, zobacz artykuł Konfigurowanie prywatnych punktów końcowych dla magazynu analitycznego.

  • Szyfrowanie danych przy użyciu kluczy zarządzanych przez klienta — możesz bezproblemowo szyfrować dane w magazynach transakcji i sklepach analitycznych przy użyciu tych samych kluczy zarządzanych przez klienta w automatyczny i przejrzysty sposób. Usługa Azure Synapse Link obsługuje tylko konfigurowanie kluczy zarządzanych przez klienta przy użyciu Cosmos usługi Azure Cosmos db tożsamości zarządzanej. Przed włączeniem usługi Azure Synapse Link](configure-synapse-link.md#enable-synapse-link) na koncie musisz skonfigurować tożsamość zarządzaną konta w zasadach dostępu do magazynu kluczy platformy Azure. Aby dowiedzieć się więcej, zobacz artykuł Konfigurowanie kluczy zarządzanych przez klienta przy użyciu usługi Azure Cosmos tożsamości zarządzanych kont bazy danych.

  • Bezpieczne zarządzanie kluczami — dostęp do danych w magazynie analitycznym za pomocą skrótów Synapse Spark i Synapse bez serwera SQL pul wymaga zarządzania kluczami bazy danych platformy Azure Cosmos w obszarach roboczych analizy Synapse Analytics. Zamiast używać kluczy konta usługi Azure Cosmos DB w zadaniach przebiegu w czasie lub skryptach SQL, usługa Azure Synapse Link zapewnia bezpieczniejsze funkcje:

    • W przypadku używania pul SQL synapse bez serwera można utworzyć zapytanie do magazynu analitycznego usługi Azure Cosmos DB, wstępnie tworząc poświadczenia usługi SQL przechowujące klucze kont i odwołując się do nich w OPENROWSET funkcji. Aby dowiedzieć się więcej, zobacz artykuł Zapytanie przy użyciu puli danych bez SQL Azure Synapse Link.

    • W przypadku korzystania z technologii Synapse Spark klucze kont można przechowywać w połączonych obiektach usług, które wskazują bazę danych usługi Azure Cosmos DB i odwołują się do tej bazy danych w konfiguracji przebiegu w czasie w czasie wykonywania. Aby dowiedzieć się więcej, zobacz artykuł Kopiowanie danych do dedykowanej puli SQL przy użyciu oprogramowania Spark.

Ceny

Model rozliczeń usługi Azure Synapse Link zawiera koszty poniesione w wyniku używania magazynu analitycznego Usługi Azure Cosmos DB i środowiska uruchomieniowego Synapse. Aby dowiedzieć się więcej, zobacz artykuły Cosmos analizy bazy danych Azure iAnalizy Azure Synapse Analytics.

Następne kroki

Aby dowiedzieć się więcej, zobacz następujące dokumenty: