Konfigurowanie magazynu przepływu danych do korzystania z usługi Azure Data Lake Gen 2

Dane używane w usłudze Power BI są domyślnie przechowywane w magazynie wewnętrznym udostępnianym przez usługę Power BI. Dzięki integracji przepływów danych i usługi Azure Data Lake Storage Gen 2 (ADLS Gen2) możesz przechowywać przepływy danych na koncie usługi Azure Data Lake Storage Gen2 w organizacji. Ta funkcja zasadniczo umożliwia "przenoszenie własnego magazynu" do przepływów danych usługi Power BI i nawiązywanie połączenia na poziomie dzierżawy lub obszaru roboczego.

Powody korzystania z obszaru roboczego usługi ADLS Gen 2 lub połączenia dzierżawy

Po dołączeniu przepływu danych usługa Power BI konfiguruje i zapisuje odwołanie, dzięki czemu można teraz odczytywać i zapisywać dane we własnej usłudze ADLS Gen 2. Usługa Power BI przechowuje dane w formacie wspólnego modelu danych (CDM), który przechwytuje metadane dotyczące danych oprócz rzeczywistych danych generowanych przez sam przepływ danych. Ta funkcja odblokowuje wiele zaawansowanych funkcji i umożliwia korzystanie z danych i skojarzonych metadanych w formacie CDM, aby teraz obsługiwać rozszerzalność, automatyzację, monitorowanie i tworzenie kopii zapasowych. Po udostępnieniu tych danych i udostępnieniu ich we własnym środowisku można demokratyzować szczegółowe informacje i dane utworzone w organizacji. Umożliwia również tworzenie dalszych rozwiązań z szeroką gamą złożoności. Twoje rozwiązania mogą być oparte na rozwiązaniu CDM, niestandardowych aplikacjach i rozwiązaniach na platformie Power Platform, platformie Azure i tych, które są dostępne za pośrednictwem ekosystemów partnerów i niezależnych dostawców oprogramowania (ISV). Możesz też utworzyć aplikację do odczytu pliku CSV. Inżynierowie danych, analitycy danych i analitycy mogą teraz pracować z typowym zestawem danych wyselekcjonowanych w usłudze ADLS Gen 2 i używać ich ponownie.

Istnieją dwa sposoby konfigurowania magazynu usługi ADLS Gen 2 do użycia: możesz użyć konta usługi ADLS Gen 2 przypisanego przez dzierżawę lub użyć własnego magazynu usługi ADLS Gen 2 na poziomie obszaru roboczego.

Wymagania wstępne

  • Aby przenieść własne konto usługi ADLS Gen 2, musisz mieć uprawnienia właściciela w warstwie konta magazynu. Uprawnienia na poziomie grupy zasobów lub subskrypcji nie będą działać. Jeśli jesteś administratorem, nadal musisz przypisać sobie uprawnienie Właściciel. Obecnie nie obsługuje kont magazynu usługi ADLS Gen2 za zaporą.

  • Konto magazynu musi zostać utworzone przy użyciu włączonej hierarchicznej przestrzeni nazw (HNS).

  • Konto magazynu musi zostać utworzone w tej samej dzierżawie usługi Microsoft Entra co dzierżawa usługi Power BI.

  • Użytkownik musi mieć rolę właściciela danych obiektu blob usługi Storage, rolę Czytelnik danych obiektu blob usługi Storage i rolę właściciela na poziomie konta magazynu (zakres powinien być tym zasobem i nie dziedziczony). Synchronizacja wszystkich zastosowanych zmian roli może potrwać kilka minut i musi zostać zsynchronizowana przed wykonaniem poniższych kroków w usługa Power BI.

  • Region dzierżawy obszaru roboczego usługi Power BI powinien być taki sam jak region konta magazynu.

  • Protokół TLS (Transport Layer Security) w wersji 1.2 (lub nowszej) jest wymagany do zabezpieczenia punktów końcowych. Przeglądarki internetowe i inne aplikacje klienckie korzystające z protokołu TLS w wersjach wcześniejszych niż TLS 1.2 nie będą mogły nawiązać połączenia.

  • Dołączanie przepływu danych z usługą ADLS Gen 2 za uwierzytelnianiem wieloskładnikowym (MFA) nie jest obsługiwane.

  • Na koniec możesz nawiązać połączenie z dowolną usługą ADLS Gen 2 z portalu Administracja, ale jeśli łączysz się bezpośrednio z obszarem roboczym, musisz najpierw upewnić się, że nie ma przepływów danych w obszarze roboczym przed nawiązaniem połączenia.

Uwaga

Usługa Bring Your Own Storage (Azure Data Lake Gen 2) nie jest dostępna w usługa Power BI dla klientów GCC dla instytucji rządowych USA. Aby uzyskać więcej informacji na temat dostępnych funkcji, a które nie, zobacz Dostępność funkcji usługi Power BI dla klientów rządowych USA.

W poniższej tabeli opisano uprawnienia usługi ADLS i usługi Power BI wymagane dla usług ADLS Gen 2 i Power BI:

Akcja Uprawnienia usługi ADLS Minimalne uprawnienia usługi Power BI
Połączenie usługi ADLS Gen 2 do dzierżawy usługi Power BI Właściciel Administrator usługi Power BI
Połączenie usługi ADLS Gen 2 do obszaru roboczego Właściciel Administratora obszaru roboczego
Tworzenie przepływów danych usługi Power BI zapisywanych z powrotem na połączonym koncie usługi ADLS Nie dotyczy Współautor obszaru roboczego
Korzystanie z przepływu danych usługi Power BI Nie dotyczy Przeglądarka obszarów roboczych

Połączenie do usługi Azure Data Lake Gen 2 na poziomie obszaru roboczego

Przejdź do obszaru roboczego, który nie ma przepływów danych. Wybierz pozycję Ustawienia obszaru roboczego. Wybierz kartę Azure Połączenie ions, a następnie wybierz sekcję Magazyn.

Screenshot of the Workspace settings pane on the Azure connections tab.

Opcja Użyj domyślnego połączenia platformy Azure jest widoczna, jeśli administrator skonfigurował już konto usługi ADLS Gen 2 przypisane do dzierżawy. Dostępne są dwie opcje:

  • Użyj konta usługi ADLS Gen2 skonfigurowanego przez dzierżawę, wybierając pole wyboru Użyj domyślnego połączenia platformy Azure lub
  • Wybierz pozycję Połączenie na platformę Azure, aby wskazać nowe konto usługi Azure Storage.

Po wybraniu Połączenie na platformę Azure usługa Power BI pobiera listę subskrypcji platformy Azure, do których masz dostęp. Wypełnij listy rozwijane. Następnie wybierz prawidłową subskrypcję platformy Azure, grupę zasobów i konto magazynu z włączoną opcją hierarchicznej przestrzeni nazw, która jest flagą usługi ADLS Gen2. Konto osobiste używane do nawiązywania połączenia z platformą Azure jest używane tylko raz, aby ustawić początkowe połączenie i przyznać usługa Power BI prawa konta do odczytu i zapisu danych, po czym oryginalne konto użytkownika nie jest już potrzebne do aktywnego połączenia.

Screenshot of the Settings window after choosing Connecting to Azure.

Po wybraniu wybranej pozycji wybierz pozycję Zapisz i teraz pomyślnie połączono obszar roboczy z własnym kontem usługi ADLS Gen2. Usługa Power BI automatycznie konfiguruje konto magazynu z wymaganymi uprawnieniami i konfiguruje system plików usługi Power BI, w którym będą zapisywane dane. Na tym etapie wszystkie dane przepływu danych w tym obszarze roboczym będą zapisywane bezpośrednio w tym systemie plików, które mogą być używane z innymi usługami platformy Azure. Masz teraz jedno źródło dla wszystkich danych organizacyjnych lub działów.

Konfiguracja połączeń platformy Azure

Konfigurowanie połączeń platformy Azure to opcjonalne ustawienie zawierające więcej właściwości, które można opcjonalnie ustawić:

  • Magazyn na poziomie dzierżawy, który umożliwia ustawienie domyślne i/lub
  • Magazyn na poziomie obszaru roboczego, który umożliwia określenie połączenia na obszar roboczy

Opcjonalnie możesz skonfigurować magazyn na poziomie dzierżawy, jeśli chcesz użyć tylko scentralizowanego magazynu typu data lake lub chcesz, aby ten magazyn był opcją domyślną. Nie uruchamiamy się automatycznie przy użyciu wartości domyślnej, aby umożliwić elastyczność konfiguracji, dlatego masz elastyczność konfigurowania obszarów roboczych korzystających z tego połączenia zgodnie z potrzebami. Jeśli skonfigurujesz konto usługi ADLS Gen 2 przypisanej do dzierżawy, nadal musisz skonfigurować każdy obszar roboczy tak, aby używał tej opcji domyślnej.

Opcjonalnie możesz również skonfigurować uprawnienia magazynu na poziomie obszaru roboczego jako osobną opcję, która zapewnia pełną elastyczność ustawiania określonego konta usługi ADLS Gen 2 w obszarze roboczym według obszaru roboczego.

Podsumowując, jeśli uprawnienia magazynu na poziomie dzierżawy i magazynu na poziomie obszaru roboczego są dozwolone, administratorzy obszaru roboczego mogą opcjonalnie używać domyślnego połączenia usługi ADLS lub zdecydować się na skonfigurowanie innego konta magazynu niezależnie od domyślnego. Jeśli magazyn dzierżawy nie jest ustawiony, administratorzy obszaru roboczego mogą opcjonalnie konfigurować konta usługi ADLS w obszarze roboczym według obszaru roboczego. Jeśli na koniec wybrano magazyn na poziomie dzierżawy, a magazyn na poziomie obszaru roboczego nie jest dozwolony, administratorzy obszarów roboczych mogą opcjonalnie skonfigurować przepływy danych do korzystania z tego połączenia.

Struktura i format połączeń obszaru roboczego usługi ADLS Gen 2

Na koncie magazynu usługi ADLS Gen 2 wszystkie przepływy danych są przechowywane w kontenerze powerbi systemu plików.

Struktura kontenera powerbi wygląda następująco: <workspace name>/<dataflow name>/model.jsoni <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots><workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Lokalizacja, w której przepływy danych przechowują dane w hierarchii folderów dla usługi ADLS Gen 2, jest taka sama, czy obszar roboczy znajduje się w pojemności udostępnionej, czy w pojemności Premium.

W poniższym przykładzie użyto tabeli Orders (Zamówienia) przykładu Northwind Odata.

Screenshot of the file explorer showing an example using the Orders table of the Northwind Odata sample.

Na powyższym obrazie:

  • Plik model.json jest najnowszą wersją przepływu danych.
  • Plik model.json.snapshots to wszystkie poprzednie wersje przepływu danych. Ta historia jest przydatna, jeśli potrzebujesz poprzedniej wersji mashupu lub ustawień przyrostowych.
  • Nazwa tabeli to folder zawierający dane wynikowe po zakończeniu odświeżania przepływu danych.

Zapisujemy tylko na tym koncie magazynu i obecnie nie usuwamy danych. Więc nawet po odłączeniu nie usuwamy z konta usługi ADLS, więc wszystkie pliki wymienione na powyższej liście są nadal przechowywane.

Uwaga

Przepływy danych umożliwiają łączenie lub odwoływanie się do tabel w innych przepływach danych. W takich przepływach danych plik model.json może odwoływać się do innego pliku model.json innego przepływu danych w tym samym lub innym obszarze roboczym.

Przenoszenie plików między/w ramach kont magazynu usługi ADLS Gen 2

Po przeniesieniu przepływu danych z jednego konta magazynu usługi ADLS Gen2 do innego należy upewnić się, że ścieżki w pliku model.json są aktualizowane w celu odzwierciedlenia nowej lokalizacji. Dzieje się tak, ponieważ plik model.json zawiera ścieżkę do przepływu danych i ścieżkę do danych. Jeśli nie zaktualizujesz ścieżek, przepływ danych nie będzie mógł odnaleźć danych i spowoduje błędy uprawnień. Aby zaktualizować ścieżki, możesz wykonać następujące czynności:

  • Otwórz plik model.json w edytorze tekstów.
  • Znajdź adres URL konta magazynu i zastąp go nowym adresem URL konta magazynu.
  • Zapisz plik.
  • Zastąp istniejący plik model.json na koncie magazynu usługi ADLS Gen2.

Rozszerzalność połączeń obszaru roboczego usługi ADLS Gen 2

Jeśli łączysz usługę ADLS Gen 2 z usługą Power BI, możesz wykonać tę akcję na poziomie obszaru roboczego lub dzierżawy. Upewnij się, że masz odpowiedni poziom dostępu. Dowiedz się więcej w temacie Wymagania wstępne.

Struktura magazynu jest zgodna z formatem usługi Common Data Model. Dowiedz się więcej o strukturze magazynu i usłudze CDM, odwiedzając stronę Co to jest struktura magazynu dla analitycznych przepływów danych i Użyj modelu Common Data Model do optymalizacji usługi Azure Data Lake Storage Gen2.

Po poprawnym skonfigurowaniu dane i metadane znajdują się w twojej kontrolce. Wiele aplikacji zdaje sobie sprawę z modelu CDM, a dane można rozszerzyć przy użyciu platform Azure, PowerApps i PowerAutomate. Możesz również używać ekosystemów innych firm, zgodnych z formatem lub odczytując nieprzetworzone dane.

Odłączanie usługi Azure Data Lake Gen 2 od obszaru roboczego lub dzierżawy

Aby usunąć połączenie na poziomie obszaru roboczego, należy najpierw upewnić się, że wszystkie przepływy danych w obszarze roboczym zostaną usunięte. Po usunięciu wszystkich przepływów danych wybierz pozycję Rozłącz w ustawieniach obszaru roboczego. To samo dotyczy dzierżawy, ale należy najpierw upewnić się, że wszystkie obszary robocze zostały również odłączone od konta magazynu dzierżawy, zanim będzie można odłączyć się na poziomie dzierżawy.

Wyłączanie usługi Azure Data Lake Gen 2

W portalu Administracja w obszarze Przepływy danych możesz wyłączyć dostęp dla użytkowników, aby użyć tej funkcji i uniemożliwić administratorom obszarów roboczych korzystanie z własnej usługi Azure Storage.

Przywracanie z usługi Azure Data Lake Gen 2

Po skonfigurowaniu magazynu przepływu danych do korzystania z usługi Azure Data Lake Gen 2 nie ma możliwości automatycznego przywracania. Proces powrotu do magazynu zarządzanego przez usługę Power BI jest ręczny.

Aby przywrócić migrację utworzoną w usłudze Gen 2, musisz usunąć przepływy danych i utworzyć je ponownie w tym samym obszarze roboczym. Następnie, ponieważ nie usuwamy danych z usługi ADLS Gen 2, przejdź do samego zasobu i wyczyścimy dane. Ta akcja obejmowałaby następujące kroki.

  1. Wyeksportuj kopię przepływu danych z usługi Power BI. Możesz też skopiować plik model.json. Plik model.json jest przechowywany w usłudze ADLS.

  2. Usuń przepływy danych.

  3. Odłącz usługę ADLS.

  4. Utwórz ponownie przepływy danych przy użyciu importu. Przed zaimportowaniem należy usunąć dane odświeżania przyrostowego (jeśli ma to zastosowanie). Tę akcję można wykonać, usuwając odpowiednie partycje w pliku model.json.

  5. Skonfiguruj zasady odświeżania/ponownego tworzenia odświeżania przyrostowego.

Połączenie do danych przy użyciu łącznika usługi ADLS Gen 2

Zakres tego dokumentu zawiera opis połączeń przepływów danych usługi ADLS Gen 2, a nie łącznika usługi Power BI ADLS Gen 2. Praca z łącznikiem usługi ADLS Gen 2 jest oddzielnym, prawdopodobnie addytywne, scenariuszem. Łącznik usługi ADLS po prostu używa usługi ADLS jako źródła danych. Dlatego użycie usługi Power Query Online do wykonywania zapytań względem tych danych nie musi być w formacie CDM, może to być dowolny format danych, jakiego chce klient. Aby uzyskać więcej informacji, zobacz Azure Data Lake Storage Gen2.

Następujące artykuły zawierają więcej informacji na temat przepływów danych i usługi Power BI: