Zlepšenie obnovenia modelu a funkcie
Skôr než sa podrobnejšie oboznámite s tým, ako zlepšiť obnovenie a funkciu modelu, mali by ste vedieť, ako power BI ukladá údaje. Podobne ako hyper súbory Tableau ukladá Power BI údaje ako stĺpcovú databázu.
Poznámka
Stĺpcová databáza ukladá každý stĺpec ako svoj vlastný súbor namiesto ukladania údajov riadok po riadku (databáza založená na riadkoch).
Ukladanie údajov ako stĺpcovej databázy je ideálne pre dlhé tabuľky, v ktorých je načítanie riadkov pre stĺpec omnoho rýchlejšie. Údaje v jednom stĺpci sú vždy rovnakého typu, napríklad reťazec alebo celé číslo. Keďže všetky položky typu sú zoskupené, možno ich efektívnejšie komprimovať, čo vedie k lepšiemu výkonu pri analýze veľkých objemov údajov.
Poznámka
Power BI sa tiež pokúsi uložiť tieto stĺpce optimálne tak, že ich zoskupí dokopy, napríklad položiek. Po zoskupení stĺpcov sa vytvorí slovník namapovaných odlišných hodnôt.
Zlepšenie modelu
Ak chcete zlepšiť výkon modelu, zvážte nasledujúce faktory:
Kardinalita
Zmena prázdnych údajov na hodnoty
Odstránenie nadbytočných a nepotrebných polí
Hviezdicová schéma
Automatický dátum a čas
Celé čísla verzus reťazce
Odstránenie polí s vysokou kardinalitou
Kardinalita odkazuje na počet jedinečných hodnôt, ktoré sú obsiahnuté v stĺpci alebo poli databázy. Hodnoty s vysokou kardinalitou sú zvyčajne identifikačné čísla, e-mailové adresy alebo mená používateľov.
Polia s vysokou kardinalitou by ste mali najprv odstrániť. Ak máte jedinečné ID pre každý riadok, odstráňte toto pole. Čím vyššia je kardinalita, tým nákladnejšie je uloženie; odlišné hodnoty sa rovnajú vysokým nákladom.
Bežným problémom je pole Dátum a čas , v ktorom kombinácia dátumu a času zvyšuje kardinalitu poľa. Tento problém vyriešite rozdelením poľa do samostatných polí dátumu a času.
Zmena prázdnych údajov na hodnoty
Pri písaní mierok sa môžu vyskytnúť scenáre, v ktorých sa nedá vrátiť zmysluplná hodnota. V týchto prípadoch vás môže lákať vrátiť namiesto toho hodnotu, ako je napríklad nula. V záujme výkonu by ste mali prehodnotiť toto pokušenie.
Pri väčšine výpočtov sa prázdne hodnoty BLANK ignorujú, ale nulové hodnoty nie. Konvertovaním prázdnych hodnôt na nulu sa vo výpočte vynúti vyhodnotenie viacerých riadkov a vrátenie veľkej množiny výsledkov dotazu, čo často vedie k pomalému vykresľovanie zostavy. Inými slovami, konvertovanie hodnôt BLANK na nulu sa pridá k nákladom na výpočet.
Odstránenie nadbytočných a nepotrebných polí
Odstránenie nadbytočných a nepotrebných polí je dôležité, pretože sa pokúšate obmedziť šírku tabuliek, čím sa zlepší výkon obnovenia. Nadbytočné polia je zvyčajne možné odstrániť, pretože ste vytvorili hviezdicovú schému, pričom na viackrát zobrazenie toho istého poľa nepotrebujete. Pri nepotrebných poliach identifikujete, ktoré polia sa pri importe použijú. Najlepšie je začať v malom a raste namiesto toho, aby ste všetky údaje hádzali do jednej masívnej množiny údajov.
Vytváranie vysoko výkonných modelov pomocou hviezdicových schém
Návrh hviezdicovej schémy je relevantný pre vývoj vysoko výkonných a použiteľných modelov Power BI. Každá zostava služby Power BI vytvorí dotaz, ktorý sa odošle do modelu služby Power BI. Tieto dotazy sa používajú na filtrovanie, zoskupovanie a sumarizáciu údajov modelu. Dobre navrhnutý model poskytuje tabuľky na filtrovanie, zoskupenie a sumarizáciu.
Poznámka
Hviezdicová schéma je typ schémy modelovania údajov, v ktorej sa v strede nachádza jedna tabuľka faktov a okolo tabuľky faktov sa nachádza niekoľko priradených tabuliek dimenzií. Hviezdicové schémy sú optimalizované na dotazovanie veľkých množín údajov.
Tento dobre navrhnutý model dobre funguje s požiadavkami na hviezdicovú schému:
Tabuľky dimenzií podporujú filtrovanie a zoskupovanie.
Tabuľka faktov podporuje sumarizáciu.
Hviezdicová schéma zabraňuje výpočtu a manipulácii s pridanými spojeniami, ktoré by ste získali zo schémy v tvare vločky, ale stále to poskytuje výhody zhustených údajov, ktoré plochá tabuľka nedokáže poskytnúť.
Vypnutie automatického dátumu a času
Automatický dátum a čas je možnosťou načítavania údajov v Power BI Desktop, ktorá podporuje užitočné vytváranie zostáv časovej inteligencie na základe dátumových stĺpcov, ktoré sa načítajú do modelu. Keď je táto možnosť zapnutá, Power BI Desktop vytvorí skryté tabuľky dátumu a času za všetkými poľami dátumov v množine údajov.
Vďaka tomu, že všetky tieto skryté tabuľky dátumu a času a polia dátumu spolu, veľkosť modelu sa výrazne zväčší. Zmenšenie veľkosti modelu optimalizuje výkon, a to najmä pri väčších množinách údajov. Optimálne by ste vytvorili jednu tabuľku dátumov a prepojenie na túto tabuľku dátumov. Môžete tiež pridať ďalšie dimenzionality dátumu s vlastnou tabuľkou dátumov, ktorá môže poskytnúť viac funkcií ako skrytá tabuľka automatického dátumu a času.
Ak chcete v službe Power BI vypnúť možnosť Automatický dátum a čas , postupujte podľa nasledujúcich krokov.
Vyberte položky Súbor > Možnosti a nastavenia.
Vyberte položku Možnosti.
Vyberte možnosť Načítanie údajov v sekcii Globálne alebo Aktuálny súbor .
Vymažte možnosť Automatický dátum a čas pre nové súbory v časti Časová inteligencia .
Používanie celých čísel v reťazcoch
Celé čísla sú lepšie ako reťazce z dvoch dôvodov:
Priradenie celého čísla k inému celému čísla je rýchlejšie ako zhoda reťazca s reťazcom.
Reťazce sa musia ukladať takým spôsobom, aby ste najprv museli nájsť jeho index, a potom nájdete hodnotu.
Na reťazce sa odkazuje dvakrát, zatiaľ čo na celé čísla sa odkazuje len raz.
Ďalšie informácie nájdete v časti Vysvetlenie hviezdicovej schémy a dôležitosti pre Power BI.
Potrebujete pomoc? Pozrite si nášho sprievodcu riešením problémov alebo odošlite konkrétne pripomienky nahlásením problému.


