Co to jest link usługa Azure Synapse Link dla usługi Azure Cosmos DB?

DOTYCZY: Nosql Mongodb Gremlin

Usługa Azure Synapse Link dla usługi Azure Cosmos DB to natywna dla chmury funkcja hybrydowego przetwarzania transakcyjnego i analitycznego (HTAP), która umożliwia analizę niemal w czasie rzeczywistym danych operacyjnych przechowywanych w usłudze Azure Cosmos DB. Usługa Azure Synapse Link tworzy ścisłą i bezproblemową integrację między usługą Azure Cosmos DB i usługą Azure Synapse Analytics.

Magazyn analityczny usługi Azure Cosmos DB, w pełni izolowany magazyn kolumn, może być używany z usługą Azure Synapse Link w celu włączenia analizy wyodrębniania i przekształcania-ładowania (ETL) w usłudze Azure Synapse Analytics względem danych operacyjnych na dużą skalę. Analitycy biznesowi, inżynierowie danych i analitycy danych mogą teraz używać usługi Synapse Spark lub Synapse SQL zamiennie do uruchamiania potoków analizy biznesowej, analizy i uczenia maszynowego niemal w czasie rzeczywistym. Możesz analizować dane w czasie rzeczywistym bez wpływu na wydajność obciążeń transakcyjnych w usłudze Azure Cosmos DB.

Na poniższej ilustracji przedstawiono integrację usługi Azure Synapse Link z usługami Azure Cosmos DB i Azure Synapse Analytics:

Architecture diagram for Azure Synapse Analytics integration with Azure Cosmos DB

Aby analizować duże operacyjne zestawy danych przy jednoczesnym zminimalizowaniu wpływu na wydajność obciążeń transakcyjnych o znaczeniu krytycznym, klienci usługi Azure Cosmos DB tradycyjnie eksportują dane operacyjne. Te operacje są wykonywane przez potoki Extract-Transform-Load (ETL), które wymagają wielu warstw zarządzania danymi i zadaniami, co skutkuje złożonością operacyjną i wpływem wydajności na obciążenia transakcyjne. Zwiększa również opóźnienie analizowania danych operacyjnych z czasu pochodzenia.

W porównaniu z tradycyjnymi rozwiązaniami opartymi na protokole ETL usługa Azure Synapse Link dla usługi Azure Cosmos DB oferuje kilka zalet, takich jak:

Zmniejszenie złożoności bez zadań ETL do zarządzania

Usługa Azure Synapse Link umożliwia bezpośredni dostęp do magazynu analitycznego usługi Azure Cosmos DB przy użyciu usługi Azure Synapse Analytics bez złożonego przenoszenia danych. Wszystkie aktualizacje wprowadzone w danych operacyjnych są widoczne w magazynie analitycznym niemal w czasie rzeczywistym bez zadań ETL ani zestawienia zmian. Możesz uruchamiać analizę na dużą skalę względem magazynu analitycznego z poziomu usługi Azure Synapse Analytics bez dodatkowej transformacji danych.

Niemal w czasie rzeczywistym wgląd w dane operacyjne

Teraz możesz uzyskać szczegółowe informacje na temat danych operacyjnych niemal w czasie rzeczywistym przy użyciu usługi Azure Synapse Link. Systemy oparte na protokole ETL zwykle mają większe opóźnienie do analizowania danych operacyjnych, ze względu na wiele warstw potrzebnych do wyodrębniania, przekształcania i ładowania danych operacyjnych. Dzięki natywnej integracji magazynu analitycznego usługi Azure Cosmos DB z usługą Azure Synapse Analytics można analizować dane operacyjne niemal w czasie rzeczywistym, co umożliwia korzystanie z nowych scenariuszy biznesowych.

Brak naruszenia wydajności obciążeń operacyjnych

Za pomocą usługi Azure Synapse Link można uruchamiać zapytania analityczne względem magazynu analitycznego usługi Azure Cosmos DB, czyli reprezentacji danych w magazynie kolumn. Zapytania można uruchamiać, gdy operacje transakcyjne są przetwarzane przy użyciu aprowizowanej przepływności dla obciążenia transakcyjnego, w magazynie transakcyjnym opartym na wierszach usługi Azure Cosmos DB. Obciążenie analityczne jest niezależne od ruchu obciążeń transakcyjnych, a nie zużywa przepływności przydzielonej dla danych operacyjnych.

Zoptymalizowane pod kątem obciążeń analitycznych na dużą skalę

Magazyn analityczny usługi Azure Cosmos DB jest zoptymalizowany pod kątem skalowalności, elastyczności i wydajności obciążeń analitycznych bez zależności od czasu wykonywania obliczeń. Technologia magazynowania jest zarządzana samodzielnie w celu zoptymalizowania obciążeń analitycznych. Dzięki wbudowanej obsłudze usługi Azure Synapse Analytics uzyskiwanie dostępu do tej warstwy magazynu zapewnia prostotę i wysoką wydajność.

Niski koszt

Za pomocą usługi Azure Synapse Link można uzyskać zoptymalizowane pod kątem kosztów, w pełni zarządzane rozwiązanie do analizy operacyjnej. Eliminuje to dodatkowe warstwy magazynowania i obliczeń wymagane w tradycyjnych potokach ETL do analizowania danych operacyjnych.

Magazyn analityczny usługi Azure Cosmos DB jest zgodny z modelem cenowym opartym na użyciu, który jest oparty na magazynie danych i wykonywanych analitycznych operacjach odczytu/zapisu i zapytaniach. Nie wymaga przydzielenia żadnej przepływności, tak jak obecnie w przypadku obciążeń transakcyjnych. Uzyskiwanie dostępu do danych za pomocą wysoce elastycznych aparatów obliczeniowych z usługi Azure Synapse Analytics sprawia, że całkowity koszt działania magazynu i obliczeń jest wydajny.

Analiza lokalnie dostępnych, globalnie rozproszonych zapisów w wielu regionach

Zapytania analityczne można skutecznie uruchamiać względem najbliższej regionalnej kopii danych w usłudze Azure Cosmos DB. Usługa Azure Cosmos DB zapewnia najnowocześniejsze możliwości uruchamiania globalnie rozproszonych obciążeń analitycznych wraz z obciążeniami transakcyjnymi w sposób aktywny-aktywny.

Włączanie scenariuszy HTAP dla danych operacyjnych

Usługa Azure Synapse Link łączy magazyn analityczny usługi Azure Cosmos DB z obsługą środowiska uruchomieniowego usługi Azure Synapse Analytics. Ta integracja umożliwia tworzenie natywnych rozwiązań HTAP w chmurze, które generują szczegółowe informacje na podstawie aktualizacji w czasie rzeczywistym do danych operacyjnych na dużych zestawach danych. Umożliwia ona odblokowanie nowych scenariuszy biznesowych w celu zgłaszania alertów na podstawie trendów na żywo, tworzenia pulpitów nawigacyjnych niemal w czasie rzeczywistym i środowisk biznesowych na podstawie zachowania użytkownika.

Magazyn analityczny usługi Azure Cosmos DB

Magazyn analityczny usługi Azure Cosmos DB to zorientowana na kolumnę reprezentacja danych operacyjnych w usłudze Azure Cosmos DB. Ten magazyn analityczny jest odpowiedni do szybkich, ekonomicznych zapytań dotyczących dużych zestawów danych operacyjnych. Ten magazyn może wykonywać zapytania dotyczące danych bez kopiowania danych i wpływać na wydajność obciążeń transakcyjnych.

Magazyn analityczny automatycznie pobiera operacje wstawiania o wysokiej częstotliwości, aktualizacji, usuwania w obciążeniach transakcyjnych niemal w czasie rzeczywistym jako w pełni zarządzana funkcja ("automatyczna synchronizacja") usługi Azure Cosmos DB. Nie jest wymagane żadne zestawienie zmian ani ETL.

Jeśli masz globalnie rozproszone konto usługi Azure Cosmos DB, po włączeniu magazynu analitycznego dla kontenera będzie ono dostępne we wszystkich regionach dla tego konta. Aby uzyskać więcej informacji na temat magazynu analitycznego, zobacz artykuł Omówienie magazynu analitycznego usługi Azure Cosmos DB.

Usługa Azure Synapse Link umożliwia teraz bezpośrednie łączenie się z kontenerami usługi Azure Cosmos DB z usługi Azure Synapse Analytics i uzyskiwanie dostępu do magazynu analitycznego bez oddzielnych łączników. Usługa Azure Synapse Analytics obecnie obsługuje usługę Azure Synapse Link z usługą Synapse Apache Spark i bezserwerową pulą SQL.

Możesz wysyłać zapytania dotyczące danych z magazynu analitycznego usługi Azure Cosmos DB jednocześnie, korzystając z różnych czasów wykonywania analiz obsługiwanych przez usługę Azure Synapse Analytics. Do analizowania danych operacyjnych nie są wymagane żadne dodatkowe przekształcenia danych. Możesz wykonywać zapytania i analizować dane magazynu analitycznego przy użyciu następujących metod:

  • Usługa Synapse Apache Spark z pełną obsługą języków Scala, Python, SparkSQL i C#. Usługa Synapse Spark jest centralna dla scenariuszy inżynierii danych i nauki o danych

  • Bezserwerowa pula SQL z językiem T-SQL i obsługa znanych narzędzi analizy biznesowej (na przykład Power BI Premium itp.)

Uwaga

Z poziomu usługi Azure Synapse Analytics możesz uzyskać dostęp do magazynów analitycznych i transakcyjnych w kontenerze usługi Azure Cosmos DB. Jeśli jednak chcesz uruchomić analizę na dużą skalę lub skanowanie danych operacyjnych, zalecamy użycie magazynu analitycznego w celu uniknięcia wpływu na wydajność obciążeń transakcyjnych.

Uwaga

Analizę można uruchamiać z małym opóźnieniem w regionie świadczenia usługi Azure, łącząc kontener usługi Azure Cosmos DB ze środowiskiem uruchomieniowym usługi Synapse w tym regionie.

Ta integracja umożliwia wykonywanie następujących scenariuszy HTAP dla różnych użytkowników:

  • Inżynier analizy biznesowej, który chce modelować i publikować raport usługi Power BI w celu uzyskania dostępu do danych operacyjnych na żywo w usłudze Azure Cosmos DB bezpośrednio za pośrednictwem usługi Synapse SQL.

  • Analitycy danych, który chce uzyskać szczegółowe informacje na podstawie danych operacyjnych w kontenerze usługi Azure Cosmos DB, wykonując zapytanie względem niego za pomocą usługi Synapse SQL, odczytuje dane na dużą skalę i łączy te wyniki z innymi źródłami danych.

  • Badacze dancyh, który chce użyć usługi Synapse Spark, aby znaleźć funkcję w celu ulepszenia modelu i wytrenowania tego modelu bez wykonywania złożonych inżynierii danych. Mogą również zapisywać wyniki wnioskowania po modelu w usłudze Azure Cosmos DB w celu oceniania danych w czasie rzeczywistym za pośrednictwem usługi Spark Synapse.

  • Inżynierowie danych, który chce udostępnić dane użytkownikom, tworząc tabele SQL lub Spark w kontenerach usługi Azure Cosmos DB bez ręcznych procesów ETL.

Aby uzyskać więcej informacji na temat obsługi środowiska uruchomieniowego usługi Azure Synapse Analytics dla usługi Azure Cosmos DB, zobacz Azure Synapse Analytics for Azure Cosmos DB support (Obsługa usługi Azure Synapse Analytics dla usługi Azure Cosmos DB).

Usługa Azure Synapse Link jest zalecana, jeśli jesteś klientem usługi Azure Cosmos DB i chcesz uruchamiać analizy, analizy biznesowej i uczenia maszynowego na danych operacyjnych. Przykład:

  • Jeśli korzystasz z analizy lub analizy biznesowej na danych operacyjnych usługi Azure Cosmos DB bezpośrednio przy użyciu oddzielnych łączników lub

  • Jeśli używasz procesów ETL w celu wyodrębnienia danych operacyjnych do oddzielnego systemu analitycznego.

W takich przypadkach usługa Azure Synapse Link zapewnia bardziej zintegrowane środowisko analityczne bez wpływu na aprowizowaną przepływność magazynu transakcyjnego.

Usługa Azure Synapse Link nie jest zalecana, jeśli szukasz tradycyjnych wymagań dotyczących magazynu danych. Te wymagania mogą obejmować wysoką współbieżność, zarządzanie obciążeniami i trwałość agregacji w wielu źródłach danych. Aby uzyskać więcej informacji, zobacz typowe scenariusze, które mogą być obsługiwane za pomocą usługi Azure Synapse Link dla usługi Azure Cosmos DB.

Ograniczenia

  • Usługa Azure Synapse Link dla usługi Azure Cosmos DB jest obsługiwana w przypadku interfejsów API NoSQL i MongoDB. Nie jest obsługiwany w przypadku interfejsów API Cassandra lub Table i pozostaje w wersji zapoznawczej interfejsu API języka Gremlin.

  • Uzyskiwanie dostępu do magazynu analitycznego usługi Azure Cosmos DB za pomocą dedykowanej puli SQL usługi Azure Synapse nie jest obecnie obsługiwane.

  • Mimo że kopie zapasowe danych magazynu analitycznego nie są tworzone i dlatego nie można ich przywrócić, możesz ponownie skompilować magazyn analityczny, ponownie publikując usługę Azure Synapse Link w przywróconym kontenerze. Aby uzyskać więcej informacji, zapoznaj się z dokumentacją magazynu analitycznego.

  • Funkcja włączania usługi Synapse Link na kontach bazy danych z włączonym ciągłym tworzeniem kopii zapasowej jest teraz dostępna. Jednak odwrotna sytuacja, aby włączyć ciągłą kopię zapasową na kontach bazy danych z obsługą usługi Synapse Link, nadal nie jest jeszcze obsługiwana.

  • Szczegółowa kontrola dostępu oparta na rolach nie jest obsługiwana podczas wykonywania zapytań z usługi Synapse. Użytkownicy, którzy mają dostęp do obszaru roboczego usługi Synapse i mają dostęp do konta usługi Azure Cosmos DB, mogą uzyskiwać dostęp do wszystkich kontenerów w ramach tego konta. Obecnie nie obsługujemy bardziej szczegółowego dostępu do kontenerów.

  • Obecnie obszary robocze usługi Azure Synapse nie obsługują połączonych usług przy użyciu usługi Managed Identity. Zawsze używaj MasterKey opcji .

  • Obecnie konta zapisu w wielu regionach nie są zalecane w środowiskach produkcyjnych.

Zabezpieczenia

Usługa Azure Synapse Link umożliwia uruchamianie analizy niemal w czasie rzeczywistym na danych o znaczeniu krytycznym w usłudze Azure Cosmos DB. Ważne jest, aby mieć pewność, że krytyczne dane biznesowe są bezpiecznie przechowywane zarówno w magazynach transakcyjnych, jak i analitycznych. Usługa Azure Synapse Link dla usługi Azure Cosmos DB została zaprojektowana w celu spełnienia tych wymagań dotyczących zabezpieczeń za pomocą następujących funkcji:

  • Izolacja sieci przy użyciu prywatnych punktów końcowych — można niezależnie kontrolować dostęp sieciowy do danych w magazynach transakcyjnych i analitycznych. Izolacja sieci odbywa się przy użyciu oddzielnych zarządzanych prywatnych punktów końcowych dla każdego magazynu w zarządzanych sieciach wirtualnych w obszarach roboczych usługi Azure Synapse. Aby dowiedzieć się więcej, zobacz artykuł Konfigurowanie prywatnych punktów końcowych dla magazynu analitycznego.

  • Szyfrowanie danych przy użyciu kluczy zarządzanych przez klienta — można bezproblemowo szyfrować dane w magazynach transakcyjnych i analitycznych przy użyciu tych samych kluczy zarządzanych przez klienta w sposób automatyczny i przezroczysty. Usługa Azure Synapse Link obsługuje tylko konfigurowanie kluczy zarządzanych przez klienta przy użyciu tożsamości zarządzanej konta usługi Azure Cosmos DB. Przed włączeniem usługi Azure Synapse Link na koncie należy skonfigurować tożsamość zarządzaną konta w zasadach dostępu usługi Azure Key Vault. Aby dowiedzieć się więcej, zobacz artykuł Konfigurowanie kluczy zarządzanych przez klienta przy użyciu tożsamości zarządzanych kont usługi Azure Cosmos DB.

  • Bezpieczne zarządzanie kluczami — uzyskiwanie dostępu do danych w magazynie analitycznym z pul SQL bezserwerowych usług Synapse Spark i Synapse wymaga zarządzania kluczami usługi Azure Cosmos DB w obszarach roboczych usługi Synapse Analytics. Zamiast używać wbudowanych kluczy konta usługi Azure Cosmos DB w zadaniach platformy Spark lub skryptach SQL, usługa Azure Synapse Link zapewnia bezpieczniejsze możliwości:

Kalkulacja cen

Model rozliczeniowy usługi Azure Synapse Link obejmuje koszty poniesione przy użyciu magazynu analitycznego usługi Azure Cosmos DB i środowiska uruchomieniowego usługi Synapse. Aby dowiedzieć się więcej, zobacz cennik magazynu analitycznego usługi Azure Cosmos DB i cennik usługi Azure Synapse Analytics .

Następne kroki

Aby dowiedzieć się więcej, zobacz następujące dokumenty: