Konfigurácia úložiska toku údajov na používanie úložiska Azure Data Lake Gen2

Údaje používané so službou Power BI sa predvolene ukladajú do interného úložiska, ktoré poskytuje služba Power BI. S integráciou tokov údajov služby Azure Data Lake Storage Gen2 (ADLS Gen2) môžete ukladať svoje toky údajov v konte Azure Data Lake Storage Gen2 vo svojej organizácii. Táto funkcia v podstate umožňuje "preniesť si vlastné úložisko" do tokov údajov služby Power BI a vytvoriť pripojenie na úrovni nájomníka alebo pracovného priestoru.

Prečo používať pracovný priestor ADLS Gen2 alebo pripojenie nájomníka

Po pripojení toku údajov Power BI nakonfiguruje a uloží odkaz, aby ste teraz mohli čítať a zapisovať údaje do vlastného úlomu ADLS Gen2. Power BI ukladá údaje vo formáte CDM (Common Data Model), ktorý okrem skutočných údajov vygenerovaných samotným tokom údajov zaznamenáva metaúdaje o vašich údajoch. Táto funkcia odomkne množstvo výkonných funkcií a umožňuje vašim údajom a súvisiacim metaúdajom vo formáte CDM odteraz slúžiť na rozšíriteľnosť, automatizáciu, monitorovanie a zálohovanie. Keď tieto údaje sprístupníte a široko budete mať prístupný vo svojom vlastnom prostredí, umožní vám to demokratizovať prehľady a údaje vytvorené vo vašej organizácii. Zároveň vám to odomkne možnosť vytvárať ďalšie riešenia so širokou škálou zložitosti. Vaše riešenia môžu byť vlastné aplikácie a riešenia spolupracujújúce s jazykom CDM v službách Power Platform, Azure a tie, ktoré sú k dispozícii prostredníctvom ekosystémov partnerov a nezávislých dodávateľov softvéru (ISV). Alebo môžete vytvoriť aplikáciu na čítanie súboru CSV. Vaši dátoví inžinieri, dátoví vedeckí pracovníci a analytici teraz môžu pracovať s bežnou množinou údajov, ktorá sa spravuje v odkladacom priestor ADLS Gen2, a používať ich a opätovne používať.

Existujú dva spôsoby, ako nakonfigurovať, ktoré úložisko ADLS Gen2 použiť: môžete použiť konto priradené nájomníkovi ADLS Gen2 alebo si môžete preniesť vlastné úložisko ADLS Gen2 na úrovni pracovného priestoru.

Predpoklady

  • Ak chcete preniesť vlastné konto ADLS Gen2, musíte mať povolenie vlastníka na vrstve konta úložiska. Povolenia na úrovni skupiny zdrojov alebo predplatného nebudú fungovať. Ak ste správcom, musíte si priradiť povolenie Vlastník. V súčasnosti nepodporuje kontá úložiska ADLS Gen2 za bránou firewall.

  • Konto úložiska sa musí vytvoriť s povolenou možnosťou Hierarchický priestor názvov (HNS ).

  • Konto úložiska sa musí vytvoriť v tom istom nájomníkovi služby Microsoft Entra ako nájomník služby Power BI.

  • Používateľ musí mať rolu vlastníka údajov ukladacieho priestoru objektu Blob, rolu čitateľa údajov ukladacieho priestoru objektu Blob a rolu vlastníka na úrovni konta úložiska (rozsah by mal byť týmto prostriedkom a nie zdedený). Synchronizácia a synchronizácia použitých zmien rolí môže trvať niekoľko minút a pred dokončením nasledujúcich krokov v služba Power BI sa musí vykonať synchronizácia.

  • Oblasť nájomníka pracovného priestoru služby Power BI by mala byť rovnaká ako oblasť konta úložiska.

  • Na zabezpečenie koncových bodov sa vyžaduje protokol TLS (Transport Layer Security) verzie 1.2 (alebo novšej). Webové prehliadače a iné klientske aplikácie, ktoré používajú verzie protokolov TLS staršie ako protokol TLS 1.2, sa nebudú môcť pripojiť.

  • Pripojenie toku údajov s ADLS Gen2 za viacfaktorovým overovaním (MFA) nie je podporované.

  • Nakoniec sa môžete z portálu Spravovanie pripojiť k ľubovoľnému úžerníku ADLS Gen2, ale ak sa pripojíte priamo k pracovnému priestoru, pred pripojením musíte najprv zabezpečiť, aby sa v pracovnom priestore nenachádzali žiadne toky údajov.

Poznámka

Vlastné úložisko Bring your own storage (Azure Data Lake Gen2) nie je k dispozícii v služba Power BI pre zákazníkov z prostredia GCC pre vládne organizácie USA. Ďalšie informácie o tom, ktoré funkcie sú k dispozícii a ktoré nie, nájdete v téme Dostupnosť funkcií služby Power BI pre zákazníkov z vládnych organizácií USA.

Nasledujúca tabuľka popisuje povolenia pre ADLS a pre Power BI požadované pre ADLS Gen2 a Power BI:

Činnosť Povolenia ADLS Minimálne povolenia Power BI
Pripojenie ADLS Gen2 pre nájomníka služby Power BI Vlastník Správca služby Power BI
Pripojenie ADLS Gen2 do pracovného priestoru Vlastník Správca pracovného priestoru
Vytvorenie tokov údajov služby Power BI, ktoré sa zapisujú späť do pripojeného konta ADLS Nevzťahuje sa Prispievateľ pracovného priestoru
Využitie toku údajov služby Power BI Nevzťahuje sa Zobrazovač pracovných priestorov

Pripojenie služby Azure Data Lake Gen2 na úrovni pracovného priestoru

Prejdite do pracovného priestoru, ktorý nemá žiadne toky údajov. Vyberte položku Nastavenia pracovného priestoru. Vyberte kartu Azure Pripojenie ions a potom vyberte časť Úložisko.

Screenshot of the Workspace settings pane on the Azure connections tab.

Možnosť Použiť predvolené pripojenie Azure je viditeľná, ak správca už nakonfiguroval konto ADLS Gen2 priradené nájomníkovi. Máte dve možnosti:

  • Vyberte pole s názvom Použiť predvolené pripojenie Azure pomocou konta ADLS Gen2 nakonfigurovaného nájomníkom, alebo
  • Vyberte položku Pripojenie do služby Azure a ukážte na nové konto Azure Storage.

Keď vyberiete možnosť Pripojenie azure, Power BI načíta zoznam predplatných služby Azure, ku ktorým máte prístup. Vyplňte rozbaľovacie zoznamy. Potom vyberte platné predplatné azure, skupinu zdrojov a konto úložiska, ktoré má povolenú možnosť hierarchického priestoru názvov, čo je príznak úložiska ADLS Gen2. Osobné konto použité na pripojenie k službe Azure sa používa iba raz, na nastavenie počiatočného pripojenia a udelenie práv konta služba Power BI na čítanie a zapisovaie údajov, po ktorých už nie je potrebné pôvodné používateľské konto, aby bolo pripojenie aktívne.

Screenshot of the Settings window after choosing Connecting to Azure.

Po výbere vyberte položku Uložiť a teraz ste úspešne pripojili pracovný priestor k vlastnému kontu služby ADLS Gen2. Power BI automaticky nakonfiguruje konto úložiska s požadovanými povoleniami a nastaví systém súborov Power BI, kde sa budú údaje zapisovať. V tomto momente sa všetky údaje toku údajov v tomto pracovnom priestore zapíšu priamo do tohto systému súborov, ktorý sa dá použiť s inými službami Azure. Teraz máte k dispozícii jeden zdroj pre všetky údaje organizácie alebo oddelenia.

Konfigurácia pripojení azure

Konfigurácia pripojení v službe Azure je voliteľná možnosť s viacerými vlastnosťami, ktoré možno nastaviť voliteľne:

  • Úložisko na úrovni nájomníka, ktoré umožňuje nastaviť predvolené
  • Úložisko na úrovni pracovného priestoru, ktoré vám umožní zadať pripojenie na pracovný priestor

Môžete tiež nakonfigurovať úložisko na úrovni nájomníka, ak chcete používať iba centralizované dátové jazero, alebo chcete, aby toto úložisko bolo predvolenou možnosťou. Nespustíme automaticky pomocou predvoleného nastavenia, ktoré umožní flexibilitu vo vašej konfigurácii, takže máte flexibilitu konfigurovať pracovné priestory, ktoré používajú toto pripojenie podľa potreby. Ak nakonfigurujete konto ADLS Gen2 priradené nájomníkovi, stále musíte nakonfigurovať každý pracovný priestor tak, aby používal túto predvolenú možnosť.

Povolenia úložiska na úrovni pracovného priestoru môžete voliteľne konfigurovať ako samostatnú možnosť, ktorá poskytuje úplnú flexibilitu nastavenia konkrétneho konta úložiska ADLS Gen2 na pracovný priestor podľa pracovného priestoru.

Stručne povedané, ak sú povolenia úložiska na úrovni nájomníka a úložiska na úrovni pracovného priestoru povolené, správcovia pracovného priestoru môžu voliteľne použiť predvolené pripojenie ADLS alebo sa rozhodnúť nakonfigurovať iné konto úložiska oddelené od predvoleného nastavenia. Ak nie je úložisko nájomníka nastavené, správcovia pracovného priestoru môžu podľa potreby nakonfigurovať kontá ADLS pre pracovné priestory podľa pracovného priestoru. Nakoniec, ak je vybratý ukladací priestor na úrovni nájomníka a úložisko na úrovni pracovného priestoru nie je povolené, správcovia pracovného priestoru môžu voliteľne nakonfigurovať ich toky údajov tak, aby používali toto pripojenie.

Štruktúra a formát pre pripojenia pracovného priestoru ADLS Gen2

V konte úložiska úložiska ADLS Gen2 sú všetky toky údajov uložené v kontajneri powerbi systému súborov.

Štruktúra kontajnera powerbi vyzerá takto: <workspace name>/<dataflow name>/model.json<workspace name>/<dataflow name>/model.json.snapshots/<all snapshots> a<workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Umiestnenie, kde toky údajov ukladajú údaje v hierarchii priečinkov pre ADLS Gen2, je rovnaké, či sa pracovný priestor nachádza v zdieľanej kapacite alebo kapacite Premium.

V nasledujúcom príklade sa používa tabuľka Objednávky ukážky Northwind Odata.

Screenshot of the file explorer showing an example using the Orders table of the Northwind Odata sample.

Na predchádzajúcom obrázku:

  • Model.json je najnovšia verzia toku údajov.
  • Model.json.snapshots sú všetky predchádzajúce verzie toku údajov. Táto história je užitočná, ak potrebujete predchádzajúcu verziu mashupu alebo prírastkové nastavenia.
  • Tablename je priečinok obsahujúci výsledné údaje po dokončení obnovenia toku údajov.

Do tohto konta úložiska zapisujeme iba tieto údaje a v súčasnosti ich neodstránime. Takže ani po odpojení sa neodstránime z konta ADLS, takže všetky súbory spomenuté v predchádzajúcom zozname sa aj naďalej ukladajú.

Poznámka

Toky údajov umožňujú vytváranie prepojení alebo odkazovanie na tabuľky v iných tokoch údajov. V takýchto tokoch údajov môže súbor model.json odkazovať na iný model.json iného toku údajov v tom istom alebo inom pracovnom priestore.

Presúvanie súborov medzi kontami úložiska ADLS Gen2 alebo v rámci neho

Keď premiestnite tok údajov z jedného konta úložiska ADLS Gen2 do druhého, musíte sa uistiť, že cesty v súbore model.json sa aktualizujú tak, aby odrážali nové umiestnenie. Dôvodom je, že súbor model.json obsahuje cestu k toku údajov a cestu k údajom. Ak neaktualizujete cesty, tok údajov nebude schopný nájsť údaje a spôsobí chyby povolení. Ak chcete aktualizovať cesty, môžete použiť tieto kroky:

  • Otvorte súbor model.json v textovom editore.
  • Vyhľadajte URL adresu konta úložiska a nahraďte ju novou URL adresou konta úložiska.
  • Uložte súbor.
  • Prepíšte existujúci súbor model.json v konte úložiska ADLS Gen2.

Rozšíriteľnosť pre pripojenia pracovného priestoru ADLS Gen2

Ak sa pripájate ADLS Gen2 k službe Power BI, môžete túto akciu vykonať na úrovni pracovného priestoru alebo nájomníka. Uistite sa, že máte správnu úroveň prístupu. Ďalšie informácie nájdete v téme Požiadavky.

Štruktúra úložiska dodržiava formát modelu Common Data Model. Ďalšie informácie o štruktúre úložiska a model CDM nájdete v téme Čo je štruktúra úložiska pre analytické toky údajov a použitie modelu Common Data Model na optimalizáciu služby Azure Data Lake Storage Gen2.

Po správnom nakonfigurovaní sa údaje a metaúdaje nachádzajú vo vašom ovládaní. Mnoho aplikácií si je vedomé modelu CDM a údaje je možné rozšíriť pomocou služieb Azure, PowerApps a PowerAutomate. Ekosystémy tretích strán môžete používať buď tak, že vyhovujú formátu alebo si prečítate nespracované údaje.

Odpojte azure Data Lake Gen2 od pracovného priestoru alebo nájomníka

Ak chcete odstrániť pripojenie na úrovni pracovného priestoru, musíte najprv zabezpečiť, aby sa všetky toky údajov v pracovnom priestore odstránili. Po odstránení všetkých tokov údajov vyberte položku Odpojiť v nastaveniach pracovného priestoru. To isté platí aj pre nájomníka – pred odpojením na úrovni nájomníka však najprv musíte zabezpečiť, aby boli od konta úložiska nájomníka odpojené všetky pracovné priestory.

Zakázanie úschovne Azure Data Lake Gen2

Na portáli Spravovanie môžete v časti toky údajov zakázať prístup pre používateľov, aby mohli túto funkciu používať. Správcom pracovného priestoru môžete zakázať prenos vlastného úložiska služby Azure.

Vrátenie z Azure Data Lake Gen2

Po nakonfigurovaní úložiska toku údajov na používanie odkladacieho priestoru Azure Data Lake Gen2 sa nedá automaticky vrátiť. Proces návratu do úložiska spravovaného službou Power BI je manuálny.

Ak chcete vrátiť migráciu, ktorú ste vykonali v Gen2, musíte odstrániť toky údajov a znovu ich vytvoriť v tom istom pracovnom priestore. Keďže údaje z ADLS Gen2 neodstránime, prejdite na samotný zdroj a vyčistíme údaje. Táto akcia by zahŕňala nasledujúce kroky.

  1. Exportovanie kópie toku údajov zo služby Power BI. Alebo skopírujte súbor model.json. Súbor model.json je uložený v ADLS.

  2. Odstránenie tokov údajov.

  3. Odpojiť ADLS.

  4. Znova vytvorte toky údajov pomocou importu. Prírastkové údaje o obnovení (ak existujú) bude potrebné pred importovaním odstrániť. Túto akciu možno vykonať odstránením príslušných oblastí v súbore model.json.

  5. Nakonfigurujte politiky obnovenia alebo znova vytvorte politiky prírastkového obnovenia.

Pripojenie k údajom pomocou konektora ADLS Gen2.

Rozsah tohto dokumentu popisuje pripojenia tokov údajov ADLS Gen2 a nie konektor Power BI ADLS Gen2. Práca s konektorom ADLS Gen2 je samostatný scenár s možným s pripočítaím. Konektor ADLS jednoducho používa ADLS ako zdroj údajov. Takže použitie doplnku Power Query Online na dotazovanie na dané údaje nemusí byť vo formáte CDM, môže to byť požadovaný formát údajov, aký chce zákazník. Ďalšie informácie nájdete v téme Azure Data Lake Storage Gen2.

V nasledujúcich článkoch nájdete ďalšie informácie o tokoch údajov a službe Power BI: