Konfigurácia úložiska toku údajov na používanie úložiska Azure Data Lake Gen2

Údaje používané so službou Power BI sa predvolene ukladajú do interného úložiska, ktoré poskytuje služba Power BI. S integráciou tokov údajov služby Azure Data Lake Storage Gen2 (ADLS Gen2) môžete ukladať svoje toky údajov v konte Azure Data Lake Storage Gen2 vo svojej organizácii. To vám v podstate umožní "prenos vlastného úložiska" do tokov údajov služby Power BI a vytvorenie pripojenia na úrovni nájomníka alebo pracovného priestoru.

Prečo používať pracovný priestor ADLS Gen2 alebo pripojenie k nájomníkovi

Po pripojení toku údajov služba Power BI nakonfiguruje a uloží odkaz, aby ste teraz mohli čítať a zapisovať údaje do svojho vlastného ADLS Gen2. Power BI ukladá údaje vo formáte CDM, ktorý zaznamenáva metaúdaje o vašich údajoch okrem skutočných údajov vygenerovaných samotným tokom údajov. Vďaka tomu môžete odomknúť mnohé výkonné možnosti a umožňuje vám údaje a priradené metaúdaje vo formáte CDM. Teraz umožňujú rozšíriteľnosť, automatizáciu, monitorovanie a zálohovanie. Vďaka sprístupneniu týchto údajov a široko dostupným vo vlastnom prostredí vám umožňuje demokratizovať prehľady a údaje vytvorené v organizácii. Poskytuje tiež možnosť vytvárať ďalšie riešenia, ktoré sú buď známe ako cdm (napríklad vlastné aplikácie a riešenia v službe Power Platform, Azure a tie, ktoré sú k dispozícii prostredníctvom partnerov a ekosystémov ISV), alebo jednoducho schopné prečítať si súbor CSV. Vaši dátoví inžinieri, dátoví vedci a analytici teraz môžu pracovať s, používať a opätovne používať spoločnú množinu údajov, ktorá je vytvorený v ADLS Gen2.

Existujú dva spôsoby, ako nakonfigurovať, ktoré obchod ADLS Gen2 použiť: môžete použiť konto priradené nájomníkovi ADLS Gen2 alebo si môžete prinesie vlastné obchody ADLS Gen2 na úrovni pracovného priestoru.

Požiadavky

  • Ak chcete mať vlastné konto ADLS Gen2, musíte mať povolenia vlastníka na úrovni konta úložiska. Povolenia na úrovni skupiny prostriedkov alebo predplatného nebudú fungovať. Ak ste správcom, musíte si priradiť povolenie vlastníka. V súčasnosti nie je ADLS Gen2 údajové kontá úložiska za bránou firewall.

  • Konto úložiska sa musí vytvoriť s povolenou možnosťou Hierarchický priestor názvov (HNS).

  • Konto úložiska sa musí vytvoriť v tom istom nájomníkovi Azure Active Directory ako nájomník služby Power BI.

  • Na zabezpečenie koncových bodov sa vyžaduje protokol TLS (Transport Layer Security) verzie 1.2 (alebo novšej). Webové prehliadače a iné klientske aplikácie, ktoré používajú verzie protokolu TLS staršie ako protokol TLS 1.2, sa nebudú môcť pripojiť.

  • Pripojenie toku údajov so služby ADLS Gen2 za viacfaktorové overovanie (MFA) nie je podporované.

  • Nakoniec z portálu na správu sa môžete pripojiť k ľubovoľnému zdroju ADLS Gen2, ale ak sa pripojíte priamo k pracovnému priestoru, pred pripojením musíte najprv zabezpečiť, aby sa v pracovnom priestore žiadne toky údajov nachádzali.

Nasledujúca tabuľka popisuje povolenia pre ADLS a pre služby Power BI požadované pre ADLS Gen2 a Power BI:

Akcia Povolenia ADLS Minimálne povolenia Power BI
Pripojenie ADLS Gen 2 pre nájomníka Power BI Vlastník Správca služby Power BI
Pripojenie ADLS Gen 2 do pracovného priestoru Vlastník Správca pracovného priestoru
Vytvorenie tokov údajov služby Power BI zapisovanie späť do pripojeného konta ADLS Prispievateľ pracovného priestoru
Tok údajov služby Power BI Čitateľ pracovného priestoru

Pripojenie k úložisku Azure Data Lake Gen2 na úrovni pracovného priestoru

Prejdite do pracovného priestoru, ktorý nemá žiadne toky údajov. Vyberte položku Nastavenia pracovného priestoru. Vyberte kartu Pripojenia Azure a potom vyberte časť Úložisko.

Pripojenie k službe Azure

Možnosť Použiť predvolené pripojenie Azure je viditeľná, ak správca už nakonfiguroval konto ADLS Gen2 priradené nájomníkovi. Máte dve možnosti:

  • Použite konto úložiska ADLS Gen2 nakonfigurované nájomníkom tak, že začiarknete políčko s názvom Použiť predvolené pripojenie Azure, alebo
  • Vyberte Pripojenie azure a ukážte na nové konto úložiska Azure.

Keď vyberiete Pripojenie do služby Azure, služba Power BI načíta zoznam predplatných služby Azure, ku ktorým máte prístup. Vyplňte rozbaľovacie ponuky a vyberte platné predplatné na Azure, skupinu zdrojov a konto úložiska, ktoré má povolenú možnosť hierarchického priestoru názvov, čo je ADLS Gen2 príznakom.

podrobnosti o predplatnom

Po výbere vyberte položku Uložiť. Úspešne ste sa pripojili k pracovnému priestoru k vlastnému ADLS Gen2 konto. Power BI automaticky nakonfiguruje konto úložiska s požadovanými povoleniami a nastaví systém súborov Power BI, v ktorom sa budú údaje zapisovať. V tomto momente sa všetky údaje toku údajov v danom pracovnom priestore zapíšu priamo do tohto systému súborov, ktorý sa dá použiť s inými službami Azure, čím sa vytvorí jeden zdroj pre všetky vaše údaje organizácie alebo oddelenia.

Informácie o konfigurácii

Konfigurácia pripojení k službe Azure je voliteľným nastavením s ďalšími vlastnosťami, ktoré možno nastaviť voliteľne:

  • Úložisko na úrovni nájomníka, ktoré umožňuje nastaviť predvolené, alebo
  • úložisko na úrovni pracovného priestoru, ktoré vám umožní zadať pripojenie na pracovný priestor.

Ak chcete používať iba centralizované dátové jazero alebo chcete, aby to bola predvolená možnosť, môžete voliteľne nakonfigurovať úložisko na úrovni nájomníka. Nezačnú sme automaticky používať predvolenú hodnotu, aby sme umožnili flexibilitu v konfigurácii, takže máte flexibilitu nakonfigurovať pracovné priestory, ktoré používajú toto pripojenie podľa vašich predsudkov. Ak nakonfigurujete konto ADLS Gen2 priradené nájomníkovi, stále budete musieť nakonfigurovať každý pracovný priestor tak, aby používal túto predvolenú možnosť.

Môžete voliteľne alebo dodatočne nakonfigurovať povolenia úložiska na úrovni pracovného priestoru ako samostatnú možnosť, ktorá poskytuje úplnú flexibilitu na nastavenie konkrétneho konta ADLS Gen2 v pracovnom priestore podľa pracovného priestoru.

Ak to chcete zhrnúť: ak sú povolené povolenia úložiska na úrovni nájomníka a úložiska na úrovni pracovného priestoru, správcovia pracovného priestoru môžu voliteľne použiť predvolené pripojenie ADLS alebo sa rozhodnúť nakonfigurovať iné konto úložiska oddelené od predvoleného nastavenia. Ak úložisko nájomníka nie je nastavené, správcovia pracovného priestoru môžu voliteľne nakonfigurovať kontá ADLS v pracovnom priestore podľa pracovného priestoru. Ak je vybratý ukladací priestor na úrovni nájomníka a ukladací priestor na úrovni pracovného priestoru je nepovolený, správcovia pracovného priestoru môžu podľa potreby nakonfigurovať svoje toky údajov tak, aby toto pripojenie mohli používať.

Princíp štruktúry a formátu pre pripojenia pracovného priestoru ADLS Gen2

V konte úložiska ADLS Gen2 sa všetky toky údajov ukladajú v kontajneri powerbi systému súborov.

Štruktúra kontajnera powerbi vyzerá takto: <workspace name>/<dataflow name>/model.json <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>

Umiestnenie, kde toky údajov ukladajú údaje v hierarchii priečinkov pre ADLS Gen2, sa určuje podľa toho, či sa pracovný priestor nachádza v zdieľanej kapacite alebo Premium kapacite. Štruktúra súborov po obnovení pre každý typ kapacity je znázornená v tabuľke nižšie.

Kapacita Premium Zdieľaná kapacita
<workspace name>/<dataflow name>/<table name>/<tablesnapshots> <workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Nižšie je uvedený príklad s použitím tabuľky Orders (Objednávky) ukážky Northwind Odata.

Ukážka Northwind zobrazujúca tabuľku Orders (Objednávky)

Na obrázku vyššie:

  • The model.json je najnovšia verzia toku údajov.
  • Všetky model.json.snapshots sú predchádzajúce verzie toku údajov. Je to užitočné, ak potrebujete predchádzajúcu verziu mashupu alebo prírastkové nastavenia.
  • Názov table.snapshots.csv sú údaje, ktoré ste dostali z obnovenia. Je to užitočné pri prírastkových obnoveniach a tiež pri zdieľaných obnoveniach, v ktorých používateľ spúšťa problém s časovým limitom obnovenia z dôvodu veľkosti údajov. Môžu sa pozrieť na najnovšie snímky, z akých údajov sa nachádza v súbore CSV.

Do tohto konta úložiska zapíšeme len a momentálne údaje neodstránime. To znamená, že aj po odpojeniach sa z konta ADLS neodstránime, takže všetky vyššie uvedené súbory sú stále uložené.

Poznámka

Odkaz model.jsna súbor môže odkazovať na inú model.jsna inom toku údajov v tom istom pracovnom priestore alebo v toku údajov v inom pracovnom priestore. Jediný čas, kedy model.jsodkazuje na table.snapshot.csv je prírastkové obnovenie.

Rozšíriteľnosť pre pripojenia pracovného priestoru ADLS Gen2

Ak pripájate ADLS Gen2 k službe Power BI, môžete to urobiť na úrovni pracovného priestoru alebo nájomníka. Uistite sa, že máte správnu úroveň prístupu. Ďalšie informácie nájdete v časti Predpoklady.

Štruktúra úložiska dodržiava Common Data Model formátu. Ďalšie informácie o štruktúre úložiska a cdm nájdete v časti Čo je štruktúra úložiska pre analytické toky údajov a Common Data Model a Azure Data Lake Storage Gen2.

Po nakonfigurovaní správne sa údaje a metaúdaje nachádza vo vašom ovládacom prvku. Mnoho aplikácií vie o dáte modelu CDM a údaje je možné rozšíriť pomocou služieb Azure, PowerApps a PowerAutomate, ako aj ekosystémov tretích strán, a to buď tým, že sú v súlade s formátom alebo pri čítaní nespracované údaje.

Odpojenie úložiska Azure Data Lake Gen2 od pracovného priestoru alebo nájomníka

Ak chcete odstrániť pripojenie na úrovni pracovného priestoru, musíte najprv zabezpečiť, aby sa všetky toky údajov v pracovnom priestore odstránili. Po odstránení všetkých tokov údajov vyberte položku Odpojiť v nastaveniach pracovného priestoru. To isté platí aj pre nájomníka – pred odpojením na úrovni nájomníka ale najprv musíte zabezpečiť, aby boli od konta úložiska nájomníka odpojené všetky pracovné priestory.

Zakázanie úložiska Azure Data Lake Gen2

Na portáli na správu v časti toky údajov môžete zakázať prístup pre používateľov, aby nemohli túto funkciu používať. Správcom pracovného priestoru môžete zakázať prenos vlastného úložiska služby Azure.

Návrat zo služby Azure Data Lake Gen2

Keď je úložisko toku údajov nakonfigurované na používanie úložiska Azure Data Lake Gen2, nie je možné automaticky sa vrátiť. Proces návratu do spravovaného úložiska služby Power BI je manuálny.

Ak chcete vrátiť migráciu, ktorú ste vykonali v pracovnom priestore Gen2, budete musieť odstrániť svoje toky údajov a znova ich vytvoriť v tom istom pracovnom priestore. Potom, keďže sme neodstránili údaje z ADLS Gen2, prejdite na samotný zdroj a vyčistite údaje. To by zahŕňalo nasledujúce kroky.

  1. Exportujte kópiu toku údajov zo služby Power BI. Alebo skopírujte súbor model.jssúbore . Zoznam model.jssúbore sa uloží v ADLS.

  2. Odstránenie tokov údajov.

  3. Odpojenie ADLS.

  4. Znova vytvorte toky údajov pomocou importu. Je potrebné odstrániť údaje prírastku obnovenia pred importom, ak je to potrebné. Môžete to urobiť odstránením príslušných oblastí v súbore, model.jsje potrebné použiť.

  5. Nakonfigurujte politiky obnovenia/znova vytvorte prírastkové obnovenie.

Pripojenie k údajom pomocou konektora ADLS Gen2

Rozsah tohto dokumentu popisuje pripojenia tokov údajov ADLS Gen2, a nie konektor služby Power BI ADLS Gen2. Práca s konektorom ADLS Gen2 je samostatný scenár s možno pribúdom. Konektor ADLS jednoducho používa ADLS ako zdroj údajov. To znamená, že použitie PQO na dotaz na základe týchto údajov nemusí byť vo formáte CDM, môže ísť o formát údajov, ktorý chce zákazník. Ďalšie informácie o tomto scenári nájdete v časti Analýza údajov v Azure Data Lake Storage Gen2 pomocou služby Power BI.

Ďalšie kroky

V nasledujúcich článkoch nájdete ďalšie informácie o tokoch údajov a službe Power BI: