Co to jest dublowanie w sieci szkieletowej?

Artykuł
04/26/2024

Jako rozwiązanie replikacji danych dublowanie w sieci szkieletowej to rozwiązanie o niskich kosztach i małych opóźnieniach, które umożliwia łączenie danych z różnych systemów w jedną platformę analizy. Istniejące zasoby danych można stale replikować bezpośrednio do usługi OneLake usługi Fabric, w tym danych z usług Azure SQL Database, Azure Cosmos DB i Snowflake.

Dzięki najbardziej aktualnym danym w formacie z możliwością wykonywania zapytań w usłudze OneLake możesz teraz używać wszystkich różnych usług w usłudze Fabric, takich jak uruchamianie analiz za pomocą platformy Spark, wykonywanie notesów, inżynierii danych, wizualizowanie za pośrednictwem raportów usługi Power BI i nie tylko.

Dublowanie w sieci szkieletowej umożliwia użytkownikom korzystanie z wysoce zintegrowanego, kompleksowego i łatwego w użyciu produktu, który został zaprojektowany w celu uproszczenia potrzeb analitycznych. Opracowane pod kątem otwartości i współpracy między firmą Microsoft oraz rozwiązania technologiczne, które mogą odczytywać format tabeli usługi Delta Lake typu open source, dublowanie jest rozwiązaniem o niskich kosztach i małych opóźnieniach, które umożliwia utworzenie repliki danych w usłudze OneLake, które może być używane dla wszystkich potrzeb analitycznych.

Tabele delty mogą być następnie używane wszędzie w sieci szkieletowej, co umożliwia użytkownikom przyspieszenie podróży do sieci szkieletowej.

Ważne

Ta funkcja jest dostępna w wersji zapoznawczej.

Dlaczego warto używać funkcji dublowania w sieci szkieletowej?

Obecnie wiele organizacji ma krytyczne dane operacyjne lub analityczne siedzące w silosach.

Uzyskiwanie dostępu do tych danych i praca z nimi wymaga obecnie złożonych potoków ETL (Wyodrębnij transformację ładowania), procesów biznesowych i silosów decyzyjnych, tworząc:

Ograniczony i ograniczony dostęp do ważnych, ciągle zmieniających się danych
Tarcie między ludźmi, procesem i technologią
Długie czasy oczekiwania na tworzenie potoków danych i procesów w celu krytycznego znaczenia danych
Brak swobody korzystania z narzędzi potrzebnych do wygodnego analizowania i udostępniania szczegółowych informacji
Brak właściwej podstawy, aby ludzie dzielili się danymi i współpracowali nad nimi
Brak typowych, otwartych formatów danych dla wszystkich scenariuszy analitycznych — analizy biznesowej, sztucznej inteligencji, integracji, inżynierii, a nawet aplikacji

Dublowanie w sieci szkieletowej zapewnia łatwe środowisko umożliwiające przyspieszenie czasu uzyskiwania szczegółowych informacji i decyzji oraz podział silosów danych między rozwiązaniami technologicznymi:

Niemal w czasie rzeczywistym replikacja danych do usługi SaaS data-lake z wbudowaną analizą dla analizy biznesowej i sztucznej inteligencji

Platforma Microsoft Fabric jest oparta na oparciu o oprogramowanie jako usługę (SaaS), która ma prostotę i integrację na zupełnie nowym poziomie. Aby dowiedzieć się więcej o usłudze Microsoft Fabric, zobacz Co to jest microsoft fabric?

Dublowanie tworzy trzy elementy w obszarze roboczym usługi Fabric:

Dublowanie zarządza replikacją danych do usługi OneLake i konwersją na Parquet w formacie gotowym do analizy. Umożliwia to wykonywanie scenariuszy podrzędnych, takich jak inżynieria danych, nauka o danych i nie tylko.
Punkt końcowy analizy SQL
Domyślny model semantyczny

Oprócz Edytor Power Query SQL usługi Microsoft Fabric istnieje szeroki ekosystem narzędzi, w tym SQL Server Management Studio, Azure Data Studio, a nawet GitHubCopilot.

Udostępnianie umożliwia łatwość kontroli dostępu i zarządzania, aby upewnić się, że możesz kontrolować dostęp do poufnych informacji. Udostępnianie umożliwia również bezpieczne i zdemokratyzowane podejmowanie decyzji w całej organizacji.

Jak mogę włączyć dublowanie w mojej dzierżawie?

Administratorzy usługi Power BI mogą włączać lub wyłączać dublowanie dla całej organizacji lub dla określonych grup zabezpieczeń przy użyciu ustawienia znalezionego w portalu administracyjnym usługi Power BI. Elementy dublowania są następnie wyświetlane w opcjach Utwórz . Aby uzyskać więcej informacji, zobacz Włączanie dublowania w dzierżawie usługi Microsoft Fabric.

Obecnie następujące zewnętrzne bazy danych są dostępne w wersji zapoznawczej.

Platforma	Replikacja niemal w czasie rzeczywistym	Kompleksowy samouczek
Dublowane bazy danych usługi Microsoft Fabric z usługi Azure Cosmos DB	Tak	Samouczek: Azure Cosmos DB
Dublowane bazy danych usługi Microsoft Fabric z usługi Azure SQL Database	Tak	Samouczek: Azure SQL Database
Dublowane bazy danych usługi Microsoft Fabric z usługi Snowflake	Tak	Samouczek: Snowflake

Jak działa replikacja dublowania niemal w czasie rzeczywistym?

Dublowanie jest włączone przez utworzenie bezpiecznego połączenia ze źródłem danych operacyjnych. Decydujesz, czy replikować całą bazę danych, czy poszczególne tabele, a dublowanie automatycznie zachowa synchronizację danych. Po skonfigurowaniu dane będą stale replikowane do usługi OneLake na potrzeby użycia analiz.

Poniżej przedstawiono podstawowe założenia dublowania:

Włączanie dublowania w sieci szkieletowej jest proste i intuicyjne, bez konieczności tworzenia złożonych potoków ETL, przydzielania innych zasobów obliczeniowych i zarządzania przenoszeniem danych.
Dublowanie w sieci szkieletowej to w pełni zarządzana usługa, więc nie musisz martwić się o hostowanie, konserwowanie i zarządzanie replikacją dublowanego połączenia.

Udostępnianie zapewnia łatwość kontroli dostępu i zarządzania, a mechanizmy zabezpieczeń, takie jak zabezpieczenia na poziomie wiersza i zabezpieczenia na poziomie obiektu (OLS), a także zapewniają kontrolę dostępu do poufnych informacji. Udostępnianie umożliwia również bezpieczne i zdemokratyzowane podejmowanie decyzji w całej organizacji.

Dzięki udostępnianiu użytkownicy udzielają innym użytkownikom lub grupie użytkowników dostępu do dublowanej bazy danych bez udzielania dostępu do obszaru roboczego i pozostałych elementów. Gdy ktoś udostępnia dublowaną bazę danych, udziela również dostępu do punktu końcowego analizy SQL i skojarzonego domyślnego modelu semantycznego.

Uzyskaj dostęp do okna dialogowego Udostępnianie za pomocą przycisku Udostępnij obok nazwy dublowanej bazy danych w widoku Obszar roboczy . Udostępnione dublowane bazy danych można znaleźć za pośrednictwem centrum danych OneLake lub sekcji Udostępnione mi w usłudze Microsoft Fabric.

Aby uzyskać więcej informacji, zobacz Udostępnianie magazynu i zarządzanie uprawnieniami.

Zapytania obejmujące wiele baz danych

Dzięki danych z dublowanej bazy danych przechowywanej w usłudze OneLake można zapisywać zapytania obejmujące wiele baz danych, łącząc dane z dublowanych baz danych, magazynów i punktów końcowych analizy SQL usługi Lakehouse w jednym zapytaniu T-SQL. Aby uzyskać więcej informacji, zobacz Pisanie zapytania obejmującego wiele baz danych.

Można na przykład odwołać się do tabeli z dublowanych baz danych i magazynów przy użyciu trzyczęściowego nazewnictwa. W poniższym przykładzie użyj trzyczęściowej nazwy, aby odwołać się do ContosoSalesTable w magazynie ContosoWarehouse. Z innych baz danych lub magazynów pierwsza część standardowej trójczęściowej konwencji nazewnictwa SQL to nazwa dublowanej bazy danych.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

inżynierowie danych z dublowanych danych bazy danych

Usługa Microsoft Fabric oferuje różne możliwości inżynierii danych, aby zapewnić łatwy dostęp do danych, dobrze zorganizowany i wysokiej jakości. Z poziomu inżynierowie danych sieci szkieletowej można wykonywać następujące czynności:

Tworzenie danych i zarządzanie nimi na platformie Spark przy użyciu usługi Lakehouse
Projektowanie potoków w celu skopiowania danych do usługi Lakehouse
Przesyłanie zadania wsadowego/przesyłania strumieniowego do klastra Spark przy użyciu definicji zadań platformy Spark
Używanie notesów do pisania kodu na potrzeby pozyskiwania, przygotowywania i przekształcania danych

Nauka o danych z dublowanych danych bazy danych

Usługa Microsoft Fabric oferuje usługę Synapse Nauka o danych, aby umożliwić użytkownikom wykonywanie kompletnych przepływów pracy nauki o danych na potrzeby wzbogacania danych i szczegółowych informacji biznesowych. Możesz ukończyć szeroką gamę działań w całym procesie nauki o danych, od eksploracji danych, przygotowywania i czyszczenia po eksperymenty, modelowanie, ocenianie modeli i obsługę analiz predykcyjnych do raportów analizy biznesowej.

Użytkownicy usługi Microsoft Fabric mogą uzyskiwać dostęp do obciążeń Nauka o danych. Z tego miejsca mogą odnajdywać różne odpowiednie zasoby i uzyskiwać do nich dostęp. Mogą na przykład tworzyć eksperymenty, modele i notesy uczenia maszynowego. Mogą również importować istniejące notesy na stronie głównej Nauka o danych.

Co to jest dublowanie w sieci szkieletowej?

Dlaczego warto używać funkcji dublowania w sieci szkieletowej?

Jak mogę włączyć dublowanie w mojej dzierżawie?

Jak działa replikacja dublowania niemal w czasie rzeczywistym?

Zapytania obejmujące wiele baz danych

inżynierowie danych z dublowanych danych bazy danych

Nauka o danych z dublowanych danych bazy danych

Opinia

Opinia

Dodatkowe zasoby

Co to jest dublowanie w sieci szkieletowej?

Dlaczego warto używać funkcji dublowania w sieci szkieletowej?

Jak mogę włączyć dublowanie w mojej dzierżawie?

Jak działa replikacja dublowania niemal w czasie rzeczywistym?

Udostępnianie

Zapytania obejmujące wiele baz danych

inżynierowie danych z dublowanych danych bazy danych

Nauka o danych z dublowanych danych bazy danych

Powiązana zawartość

Opinia

Opinia

Dodatkowe zasoby