Funkcie Premium tokov údajov

Toky údajov sú podporované pre používateľov Power BI Pro, Premium na používateľa (PPU) a power BI Premium. Niektoré funkcie sú k dispozícii iba s predplatným Premium služby Power BI alebo licenciou Premium na používateľa (PPU). Tento článok popisuje a podrobne popisuje Premium na používateľa (PPU) a Premium funkcií a ich použití.

Nasledujúce funkcie sú k dispozícii len v službe Power BI Premium:

  • Rozšírené výpočtové zariadenie
  • Direct Query
  • Vypočítané entity
  • Prepojené entity
  • Prírastkové obnovenie

V nasledujúcich častiach sa podrobnejšie popisuje každá z týchto funkcií.

Rozšírené výpočtové zariadenie

Rozšírené výpočtové zariadenie v službe Power BI umožňuje predplatiteľom služby Power BI Power využiť ich kapacitu na optimalizáciu používania tokov údajov. Používanie rozšíreného výpočtového zariadenia poskytuje nasledujúce výhody:

  • výrazné zníženie času obnovenie potrebného na dlhotrvajúce kroky ETL v prípade vypočítavaných entít, napríklad na vykonanie spojenia, odlíšenia, filtrovania a zoskupenia podľa kategórie;
  • Vykonáva dotazy directQuery nad entitami

Poznámka

Procesy overovania a obnovenia informujú o toku údajov schémy modelu. Ak chcete nastaviť schému tabuliek sami, použite Editor PowerQuery a nastavte typy údajov.

Rozšírené výpočtové zariadenie je predvolene zapnuté. Ak nie je rozšírené výpočtové zariadenie zapnuté, povolenie rozšíreného výpočtového zariadenia je popísané v ďalšej časti spolu s odpoveďami na bežné otázky.

Používanie rozšíreného výpočtového zariadenia

Rozšírené výpočtové zariadenie povolíte na stránke Nastavenia kapacity služby Power BI v sekcii tokov údajov. Rozšírené výpočtové zariadenie je predvolene zapnuté. Ak je nastavená možnosť Vypnuté, zapnite vylepšený výpočtový motor prepnutím prepínača na možnosť Zapnuté a uložte nastavenia.

Dôležité

Rozšírené výpočtové zariadenie funguje iba pre kapacity služby Power BI A3 a vyššie.

Po zapnutí rozšíreného výpočtového nástroja sa vráťte k tokom údajov a v každej počítačovej tabuľke, ktorá vykonáva zložité operácie, ako sú spojenia alebo zoskupiť podľa operácií pre toky údajov vytvorené z existujúcich prepojených entít s rovnakou kapacitou, by sa malo zobraziť zlepšenie výkonu.

Na to, aby ste rozšírené výpočtové zariadenie využili čo najlepšie, by ste fázu ETL mali nasledujúcim spôsobom rozdeliť na dva samostatné toky údajov:

  • Tok údajov 1 – tento tok údajov by mal len prijímať všetko, čo je požadované, zo zdroja údajov a umiestniť to do toku údajov 2.
  • Tok údajov 2 – všetky operácie ETL vykonajte v tomto druhom toku údajov, no uistite sa, že odkazujete na tok údajov 1, ktorý by sa mal nachádzať v rámci tej istej kapacity. Uistite sa tiež, že vykonávate operácie, ktoré sa dajú vypočítať pred ostatnými operáciami (filtrovanie, zoskupenie podľa kategórie, odlíšenie, spojenie), aby sa využil nástroj na výpočet.

Bežné otázky a odpovede

Otázka: Mám zapnuté rozšírené výpočtové zariadenie, no obnovenia sú pomalšie. Prečo?

Odpoveď: Ak ste povolili rozšírené výpočtové zariadenie, existujú dve možnosti, ktoré môžu viesť k pomalšiemu obnovovaniu:

  • Keď je rozšírené výpočtové zariadenie povolené, na jeho správne fungovanie sa vyžaduje využívanie časti pamäte. Pamäť, ktorá je na vykonanie obnovenia k dispozícii, je preto menšia a zvyšuje sa pravdepodobnosť zaradení obnovení do frontu. Týmto sa znižuje počet tokov údajov, ktoré sa môžu súbežne obnovovať. Ak chcete tento problém riešiť, zvýšte pri zapnutí rozšíreného nástroja množstvo pamäte priradenej tokom údajov, aby ste zaistili, že pamäť dostupná na súbežné obnovenie tokov údajov zostane rovnaká.

  • Ďalším dôvodom, prečo sa môžete stretnúť s pomalším obnovovaním, je, že výpočtové zariadenie funguje iba na existujúcich entitách. Ak váš tok údajov odkazuje na zdroj údajov, ktorý nie je tokom údajov, zlepšenie sa neprejaví. K zlepšeniu výkonu nedôjde, pretože v niektorých prípadoch rozsiahlych údajov bude počiatočné načítanie zo zdroja údajov pomalšie, a to z toho dôvodu, že údaje je potrebné odovzdať rozšírenému výpočtovému zariadeniu.

Otázka: Nevidím prepínač rozšíreného výpočtového zariadenia. Prečo?

Odpoveď: Vylepšený výpočtový motor sa uvoľňuje postupne do regiónov po celom svete, ale ešte nie je k dispozícii v každom regióne.

Otázka: Aké sú podporované typy údajov pre nástroj na výpočet?

Odpoveď: Rozšírené výpočtové zariadenie a toky údajov aktuálne podporujú nasledujúce typy údajov. Ak váš tok údajov nepoužíva niektorý z nasledujúcich typov údajov, vyskytne sa počas obnovenia chyba.

  • Dátum a čas
  • Desatinné číslo
  • Text
  • Celé číslo
  • Dátum/čas/pásmo
  • True/False
  • Dátum
  • Čas

Používanie funkcie DirectQuery s tokmi údajov v službe Power BI

Pomocou režimu DirectQuery sa môžete pripojiť priamo k tokom údajov. To znamená, že sa môžete pripojiť priamo k svojmu toku údajov bez potreby importovania jeho údajov.

Používaním režimu DirectQuery s tokmi údajov získate nasledujúce vylepšenia v službe Power BI a procesoch tokov údajov:

  • Zrušenie potreby samostatných plánov obnovenia – DirectQuery sa pripojí k toku údajov priamo, čím sa zbaví potreby vytvorenia importovanej množiny údajov. To znamená, že keď používate režim DirectQuery s tokmi údajov, vaše údaje budú synchronizované aj bez potreby samostatných plánov obnovenia pre tok údajov a množiny údajov.

  • Filtrovanie údajov – DirectQuery sa hodí na prácu s filtrovaným zobrazením údajov v rámci toku údajov. Ak chcete filtrovať údaje, a tak pracovať s menšou podmnožinou údajov v toku údajov, údaje toku údajov môžete vyfiltrovať pomocou režimu DirectQuery (a nástroja na výpočet) a následne pracovať s požadovanou vyfiltrovanou podmnožinou.

Použitie režimu DirectQuery v tokoch údajov

Používanie funkcie DirectQuery s tokmi údajov je k dispozícii v Power BI Desktop.

Na používanie režimu DirectQuery s tokmi údajov sa vzťahujú aj isté požiadavky:

  • Tok údajov sa musí nachádzať v pracovnom priestore Power BI Premium.
  • Výpočtové zariadenie musí byť zapnuté

Ďalšie informácie o DirectQuery s tokmi údajov nájdete v článku Pomocou funkcie DirectQuery s tokmi údajov.

Povolenie režimu DirectQuery pre toky údajov

Ak chcete, aby sa bolo možné získať k vášmu toku údajov prístup prostredníctvom režimu DirectQuery, rozšírené výpočtové zariadenie musí byť v optimalizovanom stave. Ak chcete povoliť DirectQuery pre toky údajov, nastavte nové nastavenia rozšíreného výpočtového zariadenia na možnosť Zapnuté. Nasledujúci obrázok znázorňuje správne nastavenie.

Podrobná kontrola priameho dotazu

Keď dané nastavenie použijete, obnovte tok údajov, aby sa optimalizácia prejavila.

Dôležité informácie a obmedzenia pre režim DirectQuery

Na režim DirectQuery a toky údajov sa vzťahuje niekoľko známych obmedzení:

  • Zložené/kombinované modely, ktoré obsahujú zdroje údajov importu a režimu DirectQuery, sa aktuálne nepodporujú.

  • V prípade veľkých tokoch údajov sa pri zobrazovaní vizualizácií môžu vyskytnúť problémy s uplynutím časového limitu. Veľké toky údajov, v ktorých sa vyskytnú problémy s uplynutím časového limitu, by mali používať režim Import.

  • Ak používate režim DirectQuery, v nastaveniach zdroja údajov zobrazuje konektor toku údajov neplatné prihlasovacie údaje. Táto chyba nemá vplyv na správanie, množina údajov bude fungovať správne.

Vypočítané entity

Môžete vykonávať výpočty v úložisku pri použití tokov údajov s predplatným služby Power BI Premium. Umožní vám to vykonávať výpočty v existujúcich tokoch údajov a získať výsledky, ktoré vám umožnia sústrediť sa na vytváranie zostáv a analýzu.

Vypočítaná tabuľka

Ak chcete vykonať výpočty v úložisku, najprv musíte vytvoriť tok údajov a preniesť údaje do ukladacieho priestoru tohto toku údajov v službe Power BI. Keď budete mať tok údajov, ktorý obsahuje údaje, môžete vytvoriť vypočítané entity, čo sú entity, ktoré vykonávajú výpočty v úložisku.

Dôležité informácie a obmedzenia týkajúce sa vypočítaných entít

  • Pri práci s tokmi údajov, ktoré boli vytvorené v konte Azure Data Lake Storage Gen2 vašej organizácie, fungujú prepojené a vypočítané entity správne iba vtedy, keď sa entity nachádzajú v rovnakom konte úložiska.

Najvhodnejším postupom je, že pri výpočtoch údajov, ktoré sa pripájajú k lokálnym a cloudovým údajom, sa vytvorí nový tok údajov pre každý zdroj (jeden pre lokálne údaje a jeden pre cloud) a potom sa vytvorí tretí tok údajov na zlúčenie/výpočet týchto dvoch zdrojov údajov.

Prepojené entity

Pri používaní s predplatným služby Power BI Premium môžete odkazovať na existujúce toky údajov, vďaka čomu môžete vykonávať výpočty v týchto entitách pomocou vypočítaných entít alebo môžete vytvoriť tabuľku ako „jediný zdroj pravdy“, ktorú môžete opätovne použiť v rámci viacerých tokov údajov.

Prírastkové obnovenie

Toky údajov je možné nastaviť tak, aby sa obnovovali prírastkovo. Cieľom je predísť získaniu všetkých údajov pri každom obnovení. Vyberte tok údajov a potom vyberte ikonu prírastkového obnovenia.

Prírastkové obnovenie

Nastavením prírastkového obnovenia sa do toku údajov pridajú parametre, ktoré určujú rozsah dátumov. Podrobné informácie o tom, ako nastaviť prírastkové obnovenie, nájdete v článku o prírastkovom obnovení.

Dôležité informácie o tom, kedy nenastaviť prírastkové obnovenie

Tok údajov nenastavujte na prírastkové obnovenie v nasledujúcich situáciách:

  • Prepojené entity by nemali používať prírastkové obnovenie, ak odkazujú na tok údajov. Toky údajov nepodporujú skladanie dotazov (aj keď je tabuľka zapnutá directQuery).
  • Množiny údajov, ktoré odkazujú na toky údajov, by nemali používať prírastkové obnovenie. Obnovovanie tokov údajov by malo vo všeobecnosti fungovať dobre. Ak obnovovanie trvá dlhšie, než sa očakávalo, skúste použiť výpočtové zariadenie alebo režim DirectQuery.

Ďalšie kroky

V nasledujúcich článkoch nájdete ďalšie informácie o tokoch údajov a službe Power BI: