Konfigurácia služieb tokov údajov v službe Power BI Premium

V predplatnom služby Power BI Premium môžete vytvárať vyťaženie tokov údajov. Power BI používa na popisovanie prémiového obsahu pojem vyťaženie. Pracovné zaťaženie zahŕňa množiny údajov, stránkované zostavy, toky údajov a AI. Vyťaženie tokov údajov umožňuje používať samoobslužnú prípravu údajov v tokoch údajov na prijímanie, úpravu, integráciu a obohacovanie údajov. Tok údajov služby Power BI Premium je spravovaný na portáli na správu.

V nasledujúcich častiach sa opisuje, ako povoliť toky údajov vo vašej organizácii, ako spresniť ich nastavenia v kapacite Premium a ako ich bežne používať.

Povolenie tokov údajov v službe Power BI Premium

Prvou požiadavkou pri používaní tokov údajov v predplatnom služby Power BI Premium je umožniť vytváranie a používanie tokov údajov vo vašej organizácii. V portáli na správu vyberte položku Nastavenia nájomníka a prepnite jazdec v časti Nastavenia toku údajov na možnosť Povolené, ako je to znázornené na nasledujúcom obrázku.

Portál na správu tokov údajov v službe Power BI Premium

Po povolení zaťaženia tokov údajov je nakonfigurovaný s predvolenými nastaveniami. Tieto nastavenia môžete upraviť podľa vlastných potrieb. Ďalej sa naučíme, kde sa tieto nastavenia nachádzajú, popíšeme ich a pomôžeme vám rozpoznať, kedy by bolo dobré zmeniť hodnoty na optimalizáciu výkonu toku údajov.

Spresnenie nastavení toku údajov

Po povolení tokov údajov môžete v predplatnom služby Power BI Premium použiť Portál na správu na zmenu alebo spresnenie spôsobu vytvorenia tokov údajov a spôsobu používania zdrojov. Nasledujúce kroky ukazujú, ako upraviť nastavenia toku údajov.

  1. V Portáli na správu vyberte položku Nastavenia nájomníka a zobrazte zoznam všetkých kapacít, ktoré boli vytvorené. Vyberte kapacitu na spravovanie jej nastavení.

    Výber kapacity na spravovanie nastavení

  2. Kapacita služby Power BI Premium odzrkadľuje zdroje dostupné pre vaše toky údajov. Veľkosť kapacity môžete zmeniť výberom tlačidla Zmeniť veľkosť, ako je to znázornené na nasledujúcom obrázku.

    Zmena veľkosti kapacity

  3. V nastaveniach kapacity môžete konfigurovať nastavenia toku údajov rozšírením časti Vyťaženia.

    Rozšírenie časti s vyťaženiami

  4. V časti Vyťaženia prejdite na oblasť Toky údajov. Na nasledujúcom obrázku sú uvedené nastavenia, ktoré môžete použiť na ovládanie alebo spresnenie správania toku údajov vo vašej kapacite.

    Nastavenia vyťaženia toku údajov

Nasledujúca tabuľka obsahuje základný popis nastavení tokov údajov.

Sekcia správcu Názov nastavenia Popis
Veľkosť kapacity Zmena veľkosti Aktuálne vybratá kapacita je uvedená v zozname s možnosťami na jej zmenu. Zmena tohto nastavenia umožňuje zvýšenie alebo zníženie kapacity.
Záťažová úloha Maximálna pamäť (%) Maximálne percento dostupnej pamäte, ktorú môžu toky údajov používať v kapacite.
Záťažová úloha Rozšírený nástroj na výpočet tokov údajov Povoľte túto možnosť pre 20-násobne rýchlejší výpočet vypočítaných entít pri práci s veľkými objemami údajov. Ak chcete aktivovať nový nástroj, musíte reštartovať kapacitu. Ďalšie informácie nájdete v časti Rozšírený nástroj na výpočet tokov údajov.
Záťažová úloha Veľkosť kontajnera Maximálna veľkosť kontajnera, ktorý toky údajov používajú pre každú tabuľku v toku údajov. Predvolená hodnota je 700 MB. Ďalšie informácie nájdete v časti Veľkosť kontajnera.
Záťažová úloha Pamäť výpočtového nástroja (%) Maximálne percento pamäte vyhradenej pre výpočtový nástroj. Predvolená hodnota je 30%.

V nasledujúcich častiach sa podrobne pozrieme na jednotlivé nastavenia a ako ovplyvňujú vyťaženie toku údajov.

Informácie o možnostiach vyťaženia toku údajov

Jednoduchý spôsob, ako porozumieť možnostiam vyťaženia toku údajov, je použiť analógiu. Veľkosť kapacity alebo typ služby Power BI, Premium inštanciu, možno na vás myslieť ako na vašu reštauráciu. V reštaurácii máte kuchyňu, ktorá predstavuje pamäť vyťaženia. Výpočtový nástroj je elektrická rúra. A nakoniec, kontajner je kvalita vášho šéfkuchára. Ak chcete zhodnotiť možnosti vyťaženia toku údajov, predstavte si prípravu jedla pre veľkú alebo veľmi významnú večeru. Prídu k vám na večeru významní hostia a keď prídu, večera musí byť hotová.

Pri vysvetľovaní každého nastavenia budeme používať túto analógiu s reštauráciou. Začneme na najvyššej úrovni - vašej kapacite Premium - pretože toto je prvá voľba, ktorú urobíte pri používaní služby Power BI Premium.

Skladové jednotky SKU kapacity Premium – zvýšenie škálovania hardvéru

Vyťaženie služby Power BI Premium používa kombináciu klientskych a koncových jadier, ktoré slúžia na poskytovanie rýchlych dotazov v rôznych typoch vyťaženia. Článok o uzloch kapacity obsahuje graf, ktorý znázorňuje aktuálne špecifikácie v rámci každej dostupnej ponuky vyťaženia. Kapacity s veľkosťou A3 alebo väčšou môžu používať výpočtový nástroj. Ak chcete použiť rozšírený výpočtový nástroj, začnite tam – Uzly kapacity.

V našej analógii s reštauráciou, je výber kapacity ako výber reštaurácie vyššej kvality. Hoci je drahšia, dostanete vyššiu úroveň výkonu v dôsledku zvýšenia počtu klientskych jadier, koncových jadier a väčšej pamäte. Keď idete do väčšej reštaurácie, získate väčšiu kuchyňu a lepších kuchárov, ktorí sú podobní inovácii na vyššiu SKU v službe Power BI Premium, čo vám dáva výhodu zvýšenia rýchlosti procesora, zvýšenia pamäte na operáciu a pridania väčšej rovnobežky.

Maximálna pamäť – vyhradenie kapacity pre toky údajov

Nastavenie Maximálna pamäť (%) je percento fyzickej pamäte dostupnej pre kapacitu Premium, ktoré sa poskytuje vyťaženiu tokov údajov. Môžete efektívne vyhradiť až celú kapacitu pre vyťaženie tokov údajov a kapacita sa bude dynamicky zvyšovať podľa potreby do vami nastavenej hodnoty. Ak zväčšíte kuchyňu z našej analógie, môžete variť viac jedál. Podobne môžete zvýšiť veľkosť vyťaženia kapacity pre toky údajov a vytvoriť tým podmienky pre viac tokov údajov. Ak je nastavené dynamické riadenie zdrojov, možnosť Maximálna pamäť (%) umožňuje vyhradiť 100 % pamäte pre vyťaženie tokov údajov. Používa sa to v zriedkavých situáciách, keď chcete zabezpečiť, aby bola pamäť kapacity dostupná pre vyťaženie toku údajov a nechcete sa spoliehať na riadenie prostriedkov. Ak by sme opäť chceli použiť našu analógiu, bolo by to ako keby sa mala celá kuchyňa zamerať na prípravu jedného jedla pre hosťa. Samozrejme, že schopnosť poskytnúť viac zdrojov neznamená, že jedlo bude lepšie alebo sa k zákazníkom dostane rýchlejšie. Viac si o tom povieme v ďalšej časti.

Veľkosť kontajnera – problémy s obnovením alebo s pamäťou

Poďme sa ďalej pozrieť na nastavenie Veľkosť kontajnera (MB) . Toky údajov používajú interne proces s názvom Kombinácia kontajnerov na vyhodnocovanie procesov ETL. Nástroj rozdelí logiku dotazu na kontajnery, ktoré možno spracovávať paralelne. Viac kontajnerov umožňuje súbežné spracovanie a zvyšuje výkon. Tieto kontajnery sú obmedzené najmä nastavením Kapacita, následne nastavením Maximálna pamäť (%) a potom veľkosťou pamäte, ktorú ste im pridelili v nastavení kontajnera. predvolená hodnota je 700 MB. Je teda možné zvýšiť množstvo hardvérovej pamäte a zväčšiť veľkosť kontajnera, ale tým sa zníži počet paralelných operácií a zároveň sa pridelí viac pamäte pre konkrétny proces ETL v kontajneroch. Počet kontajnerov je obmedzený na trojnásobok počtu serverových jadier. Je to dôležité, pretože nie je možné vytvoriť veľmi malý kontajner a zároveň mať veľa paralelných kontajnerov. Minimálna veľkosť kontajnera je 200 MB. Veľkosť kontajnera tiež závisí od úrovne dotazu, čo znamená, že každý dotaz sa vykoná vo vlastnom kontajneri, okrem prípadov, keď dotazy odkazujú na iné dotazy. V takom prípade sa obnovia ako súčasť rovnakého kontajnera.

Vráťme sa k analógii reštaurácie. Menšie množstvo špecializovaných kuchárov vám umožní variť jedlo oveľa rýchlejšie, v závislosti od typu objednávok a zložitosti receptu. Nevýhodou je v takomto prípade menší počet kuchárov, aj keď sa zas príprave môžete venovať viac. Zvýšenie mierky veľkosti kontajnera na 1 200 – 1 500 MB môže podobne znamenať, že menší počet zložitejších úloh ETL (agregácie, spojenia, kontingenčné tabuľky, manipulácie s riadkami alebo stĺpcami) môže zaznamenať zvýšenie výkonu, pretože každému kontajneru poskytujeme viac pamäte, aj keď znížite počet kontajnerov. Rovnako ako analógia napovedá, príliš veľa objednávok môže skutočne spomaliť výstup kuchyne, čo je spôsob, ako môžete premýšľať o veľkosti kontajnera - použite to, keď potrebujete dokončiť zložité operácie stola a ste ochotní obchodovať s rovnobežkou pre výkon, pretože zvýšenie tohto zdroja rozdeľuje pamäť pridelenú menšiemu počtu kontajnerov.

Stručne povedané, optimalizujte veľkosť kontajnera na základe používaných dotazov. Napríklad jednoduché načítanie údajov zo zdroja do tabuľky nemusí vtiahnuť údaje a vykonať žiadne operácie a jednoducho načíta údaje do ukladacieho priestoru. V takejto situácii chcete je dobré mať k dispozícii čo najviac paralelného spracovania, pretože tým zvýšite rýchlosť operácií načítania a obnovenia. Naopak, keď pridáte ďalšie operácie transformácie (komplexné filtre, spojenia, agregácie), pamäť môže byť oveľa vyššia, pretože možno budete musieť spracovať niektoré z týchto operácií transformácie v pamäti. Pamätajte, že ak v kapacite sú spustené aj iné operácie toku údajov, môže ich to spomaliť a vynútiť ich vstúpenie do frontu na pridelenie intervalu na vykonanie. Na tento účel je monitorovanie a správa tokov údajov, obnovenia výkonu a celej kapacity podporovaná aplikáciou Metrika kapacity Power BI Premium. Môžete použiť aplikáciu Metrika kapacity Power BI Premium na filtrovanie podľa kapacity a preskúmať metriku výkonu pre obsah pracovného priestoru. Metriky výkonu a využívanie prostriedkov podľa hodín za posledných sedem dní môžete preskúmať v prípade všetkého obsahu uloženého v kapacite Premium. Ak chcete preskúmať výkon toku údajov, odporúča sa začať v aplikácii.

Rozšírený nástroj na výpočet – príležitosť na zlepšenie výkonu

Ak by sme použili našu analógiu, rozšírený nástroj na výpočet je ako elektrická rúra. Služba Power BI používa na spracovanie dotazov a operácií obnovenia výpočtový nástroj. Vylepšený výpočtový nástroj je vylepšený oproti štandardnému nástroju a funguje tak, že načíta údaje do vyrovnávacej pamäte SQL a používa SQL na urýchlenie transformácie tabuľky, obnovenie operácií a umožňuje pripojenie režimu DirectQuery. Ak prirovnáme nástroje k elektrickým rúram, tak používaním lepšej elektrickej rúry budete môcť piecť jedlo rýchlejšie a efektívnejšie. Ak je pre vypočítané entity nakonfigurovaná možnosť Zapnuté alebo Optimalizované, služba Power BI zvýši výkon pomocou SQL, ak to vaša obchodná logika umožňuje. Ak je nástroj nastavený možnosť Zapnuté, poskytuje tiež pripojenie k režimu DirectQuery. Ako vyplýva z analógie, príprava niektorých jedál si nevyžaduje elektrickú rúru. Rozšírený nástroj na výpočet sa dá chápať podobným spôsobom. Uistite sa, že použitie toku údajov využíva rozšírený nástroj na výpočet správne. Používatelia môžu nakonfigurovať vylepšený výpočtový nástroj tak, aby bol na základe toku údajov zasudzovaný, optimalizovaný alebo vypnutý.

Poznámka

Rozšírený nástroj na výpočet zatiaľ nie je k dispozícii vo všetkých oblastiach.

Usmernenie pre bežné scenáre

Táto časť poskytuje usmernenie pre bežné scenáre pri používaní vyťaženia toku údajov so službou Power BI Premium.

Pomalé časy obnovenia

Pomalé časy obnovenia sú zvyčajne problémom paralelného spracovávania. Skontrolujte nasledujúce možnosti:

  1. Kľúčovým konceptom pre pomalé časy obnovenia je povaha prípravy údajov. Ak by sme použili analógiu reštaurácie opísanej vyššie v článku, predstavte si, že jedlo je pripravené a čaká sa na jeho odnesenie zákazníkovi. V tomto scenári sa dá jedlo pripraviť oveľa rýchlejšie z dôvodu krátkej doby prípravy. Podobne vždy, keď môžete optimalizovať časy pomalého obnovenia využitím zdroja údajov, ktorý skutočne vykonáva prípravu a vykonáva logiku dotazu vopred, mali by ste tak urobiť. Ak je zdrojom relačná databáza ako napríklad SQL, skontrolujte, či je možné spustiť počiatočný dotaz v zdroji. Následne použite tento zdrojový dotaz v počiatočnej extrakcii toku údajov pre zdroj údajov. Ak nemôžete použiť natívny dotaz v zdrojovom systéme, vykonajte operácie, ktoré nástroj tokov údajov môže zložiť do zdroja údajov.

  2. Vyhodnoťte rozmiestnenie časov obnovenia v rovnakej kapacite. Operácie obnovenia sú proces, ktorý vyžaduje veľa výpočtov. Ak by sme použili našu analógiu reštaurácie, rozmiestnenie časov obnovenia sa podobá obmedzeniu počtu hostí v reštaurácii. Rovnako ako reštaurácie vytvárajú pre hostí rezervácie a zohľadňujú svoju kapacitu, aj vy môžete zvážiť presunúť operácie obnovenia na obdobie, keď využitie nie je na úplnom vrchole. Toto môže veľmi pomôcť pri znižovaní záťaže na kapacitu.

  3. Zvýšte celkovú veľkosť pamäte, ktorá je priradená vyťaženiu. Predstavte si to ako veľkosť kuchyne. Úprava tohto zdroja je podobná úprave počtu kuchárov v kuchyni. Vykonáva sa to zvýšením nastavenia Maximálna pamäť (%) na 100 %.

  4. Znížte množstvo pamäte kontajnera, čím vytvoríte priestor pre viac kontajnerov. Predstavte si to tak, že namiesto zamestnania Gordona Ramseyho, slávneho kuchára, môžete radšej zamestnať schopných, ale lacnejších kuchárov. V kuchyni máte viac kuchárov, ale každý z nich dokáže plniť iba menej zložité úlohy. Potom máte viac kontajnerov, ale menej pamäte.

  5. Vykonajte oba predchádzajúce kroky, čím dosiahnete ešte vyšší stupeň paralelného spracovania, pretože získate viac kuchárov a väčšiu kuchyňu.

  6. Ak krokmi z tejto časti nedosiahnete požadovanú úroveň paralelného spracovania, pouvažujte nad inováciou kapacity na vyššiu skladovú jednotku SKU. Potom znova postupujte podľa predchádzajúcich krokov v tejto sekvencii.

Výnimky z nedostatku pamäte

Keď sa stretnete s výnimkami z nedostatku pamäte, je potrebné zvýšiť výkon kontajnerov a pamäte. Na to je potrebné, aby ste vykonali tieto kroky:

  1. Zväčšite pamäť v kontajneri. Je to podobné ako keby ste mali jedného hviezdneho kuchára v porovnaní s viacerými obyčajnými kuchármi, ako bolo opísané v predchádzajúcej časti.

  2. Zvýšte pamäť vyťaženiu aj kontajneru. Ak by sme chceli použiť našu analógiu s kuchyňou, získate tým väčšiu kuchyňu a kvalitnejších kuchárov.

  3. Ak tieto zmeny neposkytnú požadovaný stupeň paralelného spracovania, zvážte vyššiu skladovú jednotku SKU služby Power BI Premium.

Zvýšenie výkonu použitím nástroja na výpočet

Vykonaním nasledujúcich krokov zapnete, aby vyťaženie spúšťalo nástroj na výpočet a zvyšovalo výkon:

Vypočítané a prepojené entity v tom istom pracovnom priestore:

  1. Pri príjme sa zamerajte na čo najrýchlejšie ukladanie údajov v úložisku. Filtre používajte iba ak znižujú celkovú veľkosť množiny údajov. Odporúča sa uchovávať logiku transformácie oddelene od tohto kroku, aby sa nástroj mohol sústrediť na počiatočné zhromažďovanie surovín. V ďalšom kroku oddeľte logiku transformácie a podnikovú logiku do samostatných tokov údajov v tom istom pracovnom priestore pomocou prepojených alebo vypočítaných entít. Umožníte tak nástroju aktivovať a zrýchliť výpočty. V našej analógii s reštauráciou je to ako pri príprave jedál v kuchyni. Príprava jedál je zvyčajne samostatným krokom, ktorý sa odlišuje od zhromažďovania surovín, a je nevyhnutným predpokladom vkladania jedál do elektrickej rúry. Podobne musí byť vaša logika pripravená samostatne, skôr než bude môcť využiť nástroj na výpočet.

  2. Uistite sa, že vykonávate skladacie operácie, ako sú napríklad zlučovania, spojenia, konverzie a iné.

  3. Vytváranie tokov údajov v rámci publikovaných usmernení a obmedzení.

Môžete tiež použiť režim DirectQuery.

Nástroj na výpočet je zapnutý, ale výkon je pomalý

Ak skúmate prečo je nástroj na výpočet síce zapnutý, ale jeho výkon je pomalý, vykonajte nasledujúce kroky:

  1. Obmedzte vypočítané a prepojené entity, ktoré existujú v celom pracovnom priestore.

  2. Keď vykonáte počiatočné obnovenie so zapnutým výpočtovým motorom, údaje sa zapíšu do jazera a do vyrovnávacej pamäte. Tento dvojitý zápis znamená, že tieto obnovenia budú pomalšie.

  3. Ak máte tok údajov s prepojením na viaceré toky údajov, uistite sa, že plánujete obnovenia tokov údajov zdroja tak, aby sa všetky neuskutočňovali v rovnakom čase.

Ďalšie kroky

V nasledujúcich článkoch nájdete ďalšie informácie o tokoch údajov a službe Power BI: