Konfigurácia úložiska toku údajov na používanie úložiska Azure Data Lake Gen2

Údaje používané so službou Power BI sa predvolene ukladajú do interného úložiska, ktoré poskytuje služba Power BI. S integráciou tokov údajov služby Azure Data Lake Storage Gen2 (ADLS Gen2) môžete ukladať svoje toky údajov v konte Azure Data Lake Storage Gen2 vo svojej organizácii. To vám v podstate umožňuje "priniesť vlastné úložisko" do tokov údajov služby Power BI a vytvoriť pripojenie na úrovni nájomníka alebo pracovného priestoru.

Dôvody použitia pracovného priestoru ADLS Gen 2 alebo pripojenia nájomníka

Po pripojení toku údajov power BI nakonfiguruje a uloží odkaz, aby ste teraz mohli čítať a zapisovať údaje do vlastného ADLS Gen 2. Power BI ukladá údaje vo formáte CDM, ktorý okrem skutočných údajov generovaných samotným tokom údajov zachytáva metaúdaje o vašich údajoch. To odomkne mnoho výkonných funkcií a umožňuje vašim údajom a súvisiacim metaúdajom vo formáte CDM teraz slúžiť extensibility, automatizácii, monitorovaniu a scenárom zálohovania. Sprístupnením a široko dostupnými údajmi vo vašom vlastnom prostredí vám umožňuje demokratizovať prehľady a údaje vytvorené v rámci organizácie. Odomkne tiež možnosť vytvárať ďalšie riešenia, ktoré sú buď cdm vedomé (ako sú vlastné aplikácie a riešenia v Power Platform, Azure a tie, ktoré sú k dispozícii prostredníctvom partnerských a ISV ekosystémov) alebo jednoducho dokážu čítať CSV. Vaši dátoví inžinieri, dátoví vedci a analytici môžu teraz pracovať, používať a opätovne používať spoločný súbor údajov, ktorý je kurátorom V ADLS Gen 2.

Existujú dva spôsoby konfigurácie ukladacieho priestoru ADLS Gen 2: môžete použiť konto ADLS Gen 2 priradené nájomníkovi alebo si môžete priniesť vlastný ukladací priestor ADLS Gen 2 na úrovni pracovného priestoru.

Požiadavky

  • Ak chcete priniesť vlastné konto ADLS Gen 2, musíte mať povolenia vlastníka vo vrstve ukladacieho konta. Povolenia na úrovni skupiny zdrojov alebo predplatného nebudú fungovať. Ak ste správcom, musíte si priradiť povolenie vlastníka. V súčasnosti nepodporuje úložné kontá ADLS Gen2 za bránou firewall.

  • Konto úložiska sa musí vytvoriť s povolenou možnosťou Hierarchický priestor názvov (HNS).

  • Konto ukladacieho priestoru musí byť vytvorené v rovnakom Azure Active Directory nájomníkom ako nájomník služby Power BI.

  • Na zabezpečenie koncových bodov je potrebná verzia TLS (Transport Layer Security) verzie 1.2 (alebo vyššej). Webové prehliadače a iné klientske aplikácie, ktoré používajú verzie TLS staršie ako TLS 1.2, sa nebudú môcť pripojiť.

  • Pripojenie toku údajov k ADLS Gen 2 za viacfaktorovou autentifikáciou (MFA) nie je podporované.

  • Nakoniec sa môžete pripojiť k ľubovoľnému ADLS Gen 2 z portálu správcu, ale ak sa pripojíte priamo k pracovnému priestoru, musíte najprv pred pripojením zabezpečiť, aby v pracovnom priestore neboli žiadne toky údajov.

Nasledujúca tabuľka popisuje povolenia pre ADLS a Power BI požadované pre ADLS Gen 2 a Power BI:

Akcia Povolenia ADLS Minimálne povolenia služby Power BI
Pripojenie ADLS Gen 2 nájomník služby Power BI Vlastník Správca služby Power BI
Pripojenie ADLS Gen 2 do pracovného priestoru Vlastník Správca pracovného priestoru
Vytvorenie tokov údajov služby Power BI späť do pripojeného konta ADLS Prispievateľ pracovného priestoru
Spotreba toku údajov služby Power BI Čitateľ pracovného priestoru

Pripojenie k azure data lake gen 2 na úrovni pracovného priestoru

Prejdite do pracovného priestoru, ktorý nemá žiadne toky údajov. Vyberte položku Nastavenie pracovného priestoru. Vyberte kartu Pripojenia Azure a potom vyberte časť Úložisko.

Pripojenie k službe Azure

Možnosť Použiť predvolené pripojenie Azure je viditeľná, ak správca už nakonfiguroval konto ADLS Gen 2 priradené nájomníkovi. Máte dve možnosti:

  • Pomocou konta nakonfigurovaného nájomníkom ADLS Gen 2 vyberte pole s názvom Použiť predvolené pripojenie Azure alebo
  • Výberom položky Pripojenie do služby Azure ukážte na nové konto Azure Storage.

Keď vyberiete možnosť Pripojenie azure, Power BI načíta zoznam predplatných Azure, ku ktorým máte prístup. Vyplňte rozbaľovacie časti a vyberte platné predplatné Azure, skupinu zdrojov a konto ukladacieho priestoru, ktoré má povolenú hierarchickú možnosť priestoru názvov, čo je príznak ADLS Gen2.

podrobnosti o predplatnom

Po výbere vyberte položku Uložiť a teraz ste úspešne pripojili pracovný priestor k vlastnému kontu ADLS Gen2. Power BI automaticky nakonfiguruje konto ukladacieho priestoru s požadovanými povoleniami a nastaví súborový systém služby Power BI, do ktorých sa budú údaje zapisovať. V tomto momente sa všetky údaje toku údajov v danom pracovnom priestore zapíšu priamo do tohto systému súborov, ktorý sa dá použiť s inými službami Azure, čím sa vytvorí jeden zdroj pre všetky vaše údaje organizácie alebo oddelenia.

Pochopenie konfigurácie

Konfigurácia pripojení Azure je voliteľné nastavenie s ďalšími vlastnosťami, ktoré je možné voliteľne nastaviť:

  • Ukladacie priestory na úrovni nájomníka, ktoré vám umožňujú nastaviť predvolené nastavenie a/alebo
  • Ukladací priestor na úrovni pracovného priestoru, ktorý umožňuje určiť pripojenie na pracovný priestor

Ukladací priestor na úrovni nájomníka môžete voliteľne nakonfigurovať, ak chcete použiť iba centralizované údajové jazero, alebo chcete, aby to bola predvolená možnosť. Automaticky nezačneme používať predvolené nastavenie, aby sme umožnili flexibilitu vo vašej konfigurácii, takže máte flexibilitu na konfiguráciu pracovných priestorov, ktoré používajú toto pripojenie, ako uznáte za vhodné. Ak nakonfigurujete konto ADLS Gen 2 priradené nájomníkovi, stále musíte nakonfigurovať každý pracovný priestor tak, aby používal túto predvolenú možnosť.

Povolenia ukladacieho priestoru na úrovni pracovného priestoru môžete voliteľne alebo dodatočne nakonfigurovať ako samostatnú možnosť, ktorá poskytuje úplnú flexibilitu na nastavenie konkrétneho konta ADLS Gen 2 v pracovnom priestore podľa pracovného priestoru.

Ak chcete zhrnúť, ak sú povolené povolenia ukladacieho priestoru na úrovni nájomníka a ukladacieho priestoru na úrovni pracovného priestoru, správcovia pracovného priestoru môžu voliteľne použiť predvolené pripojenie ADLS alebo sa rozhodnúť nakonfigurovať iné konto ukladacieho priestoru oddelené od predvoleného. Ak ukladací priestor nájomníka nie je nastavený, správcovia pracovného priestoru môžu voliteľne nakonfigurovať kontá ADLS v pracovnom priestore podľa pracovného priestoru. Nakoniec, ak je vybratý ukladací priestor na úrovni nájomníka a je zakázané ukladanie na úrovni pracovného priestoru, správcovia pracovného priestoru môžu voliteľne nakonfigurovať toky údajov na používanie tohto pripojenia.

Pochopenie štruktúry a formátu pripojení pracovného priestoru ADLS Gen 2

V úložnom účte ADLS Gen 2 sú všetky toky údajov uložené v kontajneri powerbi súborového systému.

Štruktúra kontajnera powerbi vyzerá takto: <workspace name>/<dataflow name>/model.json <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>

Umiestnenie, kde toky údajov ukladajú údaje v hierarchii priečinkov pre ADLS Gen 2, je určené tým, či sa pracovný priestor nachádza v zdieľanej kapacite alebo Premium kapacite. Štruktúra súboru po obnovení pre každý typ kapacity sa zobrazí v tabuľke nižšie.

Kapacita Premium Zdieľaná kapacita
<workspace name>/<dataflow name>/<table name>/<tablesnapshots> <workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Nižšie je uvedený príklad pomocou tabuľky Objednávky vzorky Northwind Odata.

Vzorka Northwind zobrazujúca tabuľku Objednávky

Na obrázku vyššie:

  • Model.json je najnovšia verzia toku dát.
  • Model.json.snapshots sú všetky predchádzajúce verzie toku údajov. Je to užitočné, ak potrebujete predchádzajúcu verziu mashupu alebo prírastkové nastavenia.
  • table.snapshots.csv sú údaje, ktoré ste získali z obnovenia. Je to užitočné pre prírastkové obnovenia a tiež pre zdieľané obnovenia, pri ktorých sa používateľ nachádza v probléme s časovým limitom obnovenia z dôvodu veľkosti údajov. Môžu sa pozrieť na najnovšiu snímku, aby zistili, koľko údajov je v súbore csv.

Na tento úložný účet píšeme iba a v súčasnosti údaje nevymazáme. To znamená, že ani po odpojení neodstránime z účtu ADLS, takže všetky vyššie uvedené súbory sú stále uložené.

Poznámka

Súbor model.json môže odkazovať na iný model.json, čo je ďalší tok údajov v tom istom pracovnom priestore alebo v toku údajov v inom pracovnom priestore. Jediný čas, kedy by model.json odkazuje na table.snapshot.csv, je postupné obnovenie.

Rozšíriteľnosť pre pripojenia pracovného priestoru ADLS Gen 2

Ak pripájate ADLS Gen 2 k službe Power BI, môžete to urobiť na úrovni pracovného priestoru alebo nájomníka. Uistite sa, že máte správnu úroveň prístupu. Prečítajte si viac v predpokladoch.

Štruktúra ukladacieho priestoru sa pridržiavajú formátu Spoločného dátového modelu. Ďalšie informácie o štruktúre ukladacieho priestoru a cdm sa dozviete v časti Aká je štruktúra úložiska pre analytické toky údajov a spoločný dátový model a Azure Data Lake Storage Gen2.

Po správnej konfigurácii sú údaje a metaúdaje pod kontrolou. Niekoľko aplikácií si je vedomých CDM a údaje môžu byť rozšírené pomocou Azure, PowerApps a PowerAutomate, ako aj ekosystémov tretích strán buď prispôsobením formátu, alebo čítaním surových údajov.

Odpojenie úložiska Azure Data Lake Gen2 od pracovného priestoru alebo nájomníka

Ak chcete odstrániť pripojenie na úrovni pracovného priestoru, musíte najprv zabezpečiť, aby sa všetky toky údajov v pracovnom priestore odstránili. Po odstránení všetkých tokov údajov vyberte položku Odpojiť v nastaveniach pracovného priestoru. To isté platí aj pre nájomníka – pred odpojením na úrovni nájomníka ale najprv musíte zabezpečiť, aby boli od konta úložiska nájomníka odpojené všetky pracovné priestory.

Zakázanie úložiska Azure Data Lake Gen2

Na portáli na správu v časti toky údajov môžete zakázať prístup pre používateľov, aby nemohli túto funkciu používať. Správcom pracovného priestoru môžete zakázať prenos vlastného úložiska služby Azure.

Návrat zo služby Azure Data Lake Gen2

Keď je úložisko toku údajov nakonfigurované na používanie úložiska Azure Data Lake Gen2, nie je možné automaticky sa vrátiť. Proces vrátenia sa do spravovaného úložiska služby Power BI je manuálny.

Ak chcete vrátiť migráciu, ktorú ste vykonali v pracovnom priestore Gen2, budete musieť odstrániť svoje toky údajov a znova ich vytvoriť v tom istom pracovnom priestore. Potom, keďže sme neodstránili údaje z ADLS Gen2, prejdite na samotný zdroj a vyčistite údaje. To by zahŕňalo nasledujúce kroky.

  1. Exportujte kópiu toku údajov zo služby Power BI. Alebo skopírujte súbor model.json. Súbor model.json je uložený v ADLS.

  2. Odstránenie tokov údajov.

  3. Odpojenie ADLS.

  4. Znova vytvorte toky údajov pomocou importu. Je potrebné odstrániť údaje prírastku pred importom, ak je to potrebné. Môžete to urobiť odstránením príslušných oblastí v súbore model.json.

  5. Nakonfigurujte politiky obnovenia/znova vytvorte prírastkové obnovenie.

Pripojenie k údajom pomocou konektora ADLS Gen2

Rozsah tohto dokumentu popisuje pripojenia tokov údajov ADLS Gen2, a nie konektor služby Power BI ADLS Gen2. Práca s konektorom ADLS Gen2 je samostatnou scenárom s možno pribúdom. Konektor ADLS jednoducho používa ADLS ako zdroj údajov. To znamená, že použitie PQO na dotaz na tieto údaje nemusí byť vo formáte CDM, môže ísť o formát údajov, ktorý chce zákazník. Ďalšie informácie o tomto scenári nájdete v časti Analýza údajov v Azure Data Lake Storage Gen2 pomocou služby Power BI.

Ďalšie kroky

V nasledujúcich článkoch nájdete ďalšie informácie o tokoch údajov a službe Power BI: