Osvedčené postupy opätovného používania tokov údajov v prostrediach a pracovných priestoroch

Tento článok obsahuje kolekciu osvedčených postupov na efektívne a efektívne opätovné použitie tokov údajov. Prečítajte si tento článok, aby ste sa pri vývoji tokov údajov na opätovné použitie vyhli úskaliam pri navrhovaní a potenciálnym problémom s výkonom.

Oddelenie tokov údajov transformácie údajov od fázových alebo extrahovaných tokov údajov

Ak tok údajov vykonáva všetky akcie, je ťažké opätovne použiť tabuľky v iných tokoch údajov alebo na iné účely. Najlepšie toky údajov na opätovné použitie sú toky údajov, ktoré vykonávajú len niekoľko akcií. Vytvorenie tokov údajov, ktoré sa špecializuje na jednu konkrétnu úlohu, je jedným z najlepších spôsobov ich opätovného použitia. Ak máte množinu tokov údajov, ktoré používate ako fázové toky údajov, ich jedinou akciou je extrahovať údaje tak, ako sú zo zdrojového systému. Tieto toky údajov je možné opätovne použiť vo viacerých iných tokoch údajov.

Ak máte toky údajov transformácie údajov, môžete ich rozdeliť na toky údajov, ktoré robia bežné transformácie. Každý tok údajov môže vykonať len niekoľko akcií. Tieto niektoré akcie na tok údajov zaisťujú, že výstup tohto toku údajov je opätovne použiteľný inými tokmi údajov.

Dataflow doing only a few actions.

Obrázok s údajmi extrahovanými zo zdroja údajov na fázu tokov údajov, kde sú tabuľky buď uložené v úložisku Dataverse alebo Azure Data Lake. Potom sa údaje premiestnia do transformácie tokov údajov, kde sa údaje transformujú a skonvertujú na štruktúru skladu údajov. Nakoniec sa údaje načítajú do sémantického modelu služby Power BI.

Používanie viacerých pracovných priestorov

Každý pracovný priestor (alebo prostredie) je k dispozícii iba pre členov tohto pracovného priestoru. Ak vytvoríte všetky toky údajov v jednom pracovnom priestore, minimalizujete opätovné použitie tokov údajov. Môžete mať niekoľko všeobecných pracovných priestorov pre toky údajov, ktoré spracúvajú tabuľky v celej spoločnosti. Môžete mať aj pracovný priestor pre toky údajov na spracovanie tabuliek v rámci viacerých oddelení. Môžete tiež mať niekoľko pracovných priestorov pre toky údajov, ktoré sa majú použiť iba v konkrétnych oddeleniach.

Image showing the separate workspaces.

Nastavenie správnych úrovní prístupu v pracovných priestoroch

Ak chcete poskytnúť prístup k tokom údajov v iných pracovných priestoroch a použiť výstup toku údajov v pracovnom priestore, stačí im poskytnúť prístup k zobrazeniu v pracovnom priestore. Ďalšie informácie o iných rolách v pracovnom priestore Power BI nájdete v téme Roly v nových pracovných priestoroch.

Screenshot showing how to access to the Power BI workspace.

Odporúčanie toku údajov v službe Power BI

V organizácii nájomníka môže byť vytvorených veľa tokov údajov a pre používateľov môže byť ťažké zistiť, ktorý tok údajov je najspoľahlivejší. Autori toku údajov alebo používatelia, ktorí k nemu majú prístup na úpravy, môžu odporúčať tok údajov na troch úrovniach: bez odporúčania, uprednostnenia alebo certifikovaného.

Tieto úrovne odporúčania pomáhajú používateľom jednoduchšie a rýchlejšie nájsť spoľahlivé toky údajov. Najprv sa zobrazí tok údajov s vyššou úrovňou odporúčania. Správca služby Power BI môže delegovať možnosť odporučiť toky údajov na certifikovanú úroveň iným ľuďom. Ďalšie informácie: Odporučenie – propagácia a certifikácia obsahu služby Power BI

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

Oddelenie tabuliek do viacerých tokov údajov

V jednom toku údajov môžete mať viacero tabuliek. Jedným z dôvodov, prečo by ste mohli rozdeliť tabuľky do viacerých tokov údajov, je to, čo ste sa už v tomto článku naučili o oddelení príjmu údajov a transformácii údajov. Ďalším dobrým dôvodom, prečo mať tabuľky vo viacerých tokoch údajov, je to, keď chcete iný plán obnovenia ako iné tabuľky.

V príklade znázornenom na nasledujúcom obrázku je potrebné obnoviť tabuľku predaja každé štyri hodiny. Tabuľku dátumov je potrebné obnoviť iba raz za deň, aby sa aktualizoval aktuálny záznam dátumu. A tabuľku priradenia produktov je potrebné obnoviť raz za týždeň. Ak máte všetky tieto tabuľky v jednom toku údajov, máte pre všetky iba jednu možnosť obnovenia. Ak však tieto tabuľky rozdelíte do viacerých tokov údajov, môžete naplánovať obnovenie každého toku údajov samostatne.

Image showing dataflows with different schedules for the refresh.

Dobrá tabuľka kandidátov na tabuľky toku údajov

Keď vyvíjate riešenia pomocou doplnku Power Query v počítačových nástrojoch, môžete si klásť otázku; Ktoré z týchto tabuliek sú vhodnými kandidátmi na presunutie do toku údajov? Najlepšie tabuľky, ktoré sa majú presunúť do toku údajov, sú tabuľky, ktoré je potrebné použiť vo viac ako jednom riešení alebo vo viac ako jednom prostredí alebo službe. Napríklad tabuľka Dátum uvedená na nasledujúcom obrázku musí byť použitá v dvoch samostatných súboroch služby Power BI. Namiesto duplikovania tejto tabuľky v každom súbore môžete tabuľku vytvoriť v toku údajov ako tabuľku a opätovne ju použiť v týchto súboroch Power BI.

Image showing a shared table used in a dataflow.