Zjednodušenie štruktúry údajov

Dokončené

Keď do aplikácie Power BI Desktop importujete údaje z viacerých zdrojov, údaje si zachovajú preddefinované názvy tabuliek a stĺpcov. Niektoré z týchto názvov možno budete chcieť zmeniť, aby mali konzistentné formátovanie, jednoduchšie sa s nimi pracovalo a aby im používateľ lepšie porozumel. Tieto zmeny názvov a zjednodušenie štruktúry údajov môžete urobiť pomocou Editora Power Query v aplikácii Power BI Desktop. 

Ak chcete pokračovať s predchádzajúcim scenárom, v ktorom ste tvarovali pôvodné údaje v modeli, treba vykonať ďalšie kroky na zjednodušenie štruktúry údajov o predaji a pripraviť tieto údaje pre tím predaja na vývoj zostáv. Stĺpce ste už premenovali, teraz však treba preskúmať názvy dotazov (tabuliek) a zistiť, či ich nemožno vylepšiť. Treba tiež skontrolovať obsah stĺpcov a nahradiť všetky hodnoty, ktoré vyžadujú korekciu. 

Premenovanie dotazu 

Neobvyklé alebo neužitočné názvy dotazov je vhodné zmeniť na názvy, ktoré sú jednoznačnejšie alebo ktoré používateľ lepšie pozná. Keď napríklad importujete do aplikácie Power BI Desktop tabuľku s informáciami o produktoch a názov dotazu je FactProductTable (TabuľkaInformáciíOProduktoch), možno budete chcieť tento názov zmeniť, aby bol viac používateľsky príjemný, napríklad  Products (Produkty). Podobne ak importujete zobrazenie, toto zobrazenie môže mať pred názvom predponu v, napríklad vProduct (vProdukt). Pre ľudí môže byť tento názov nejasný a zavádzajúci, preto možno budete chcieť predponu odstrániť. 

V tomto príklade ste preskúmali názov dotazu SalesTarget (CieľPredaja) a uvedomili ste si, že tento názov nie je užitočný, pretože dotaz s rovnakým názvom sa bude vytvárať pre každý rok. Chcete predísť zámene, preto sa rozhodnete pridať do názvu dotazu aj rok. 

V Editore Power Query na table Dotazy naľavo od údajov vyberte dotaz, ktorý chcete premenovať. Kliknite na dotaz pravým tlačidlom myši a vyberte položku Premenovať. Upravte aktuálny názov alebo zadajte nový názov a potom stlačte kláves Enter.

Premenovanie dotazu

Nahradenie hodnôt

Pomocou funkcie Nahradiť hodnoty v editore Power Query môžete nahradiť ľubovoľnú hodnotu inou hodnotou z vybratého stĺpca. 

V tomto príklade ste si všimli, že v stĺpci Attribute (Atribút) je mesiac december napísaný nesprávne. Túto pravopisnú chybu chcete opraviť. Vyberte stĺpec obsahujúci hodnotu, ktorú chcete nahradiť (v našom prípade Attribute (Atribút)), a potom vyberte položku  Nahradiť hodnoty na karte  Transformovať.  

Funkcia Nahradiť hodnoty v Editore Power Query

Do poľa Hodnota, ktorá sa má vyhľadať zadajte názov hodnoty, ktorú chcete nahradiť, a do poľa Nahradiť čím zadajte správny názov hodnoty. Potom vyberte tlačidlo OK. V doplnku Power Query nie je možné vybrať jednu bunku a zmeniť jednu hodnotu, ako by ste to urobili v Exceli.

Nahradenie jednej hodnoty inou v poli Hodnota, ktorá sa má vyhľadať

Na table Nastavenia dotazu môžete skontrolovať zoznam krokov, ktoré ste vykonali pri zmene štruktúry a oprave údajov. Keď dokončíte všetky kroky, ktoré chcete vykonať, výberom položky Zavrieť a použiť môžete zavrieť Editor Power Query a použiť zmeny v dátovom modeli. Môžete však pokračovať ďalšími krokmi a údaje vyčistiť a transformovať.

Nahradenie hodnôt null

Príležitostne možno zistíte, že zdroje údajov obsahujú hodnoty null. Suma prepravných nákladov v predajnej objednávke môže mať napríklad hodnotu null, ak je synonymom nuly. Ak hodnota zostane null, priemer sa nevypočíta správne. Jedným z riešení by bolo zmeniť hodnoty null na nulu, čo by malo za následok presnejší výpočet priemeru prepravných nákladov. V tomto prípade môžete pomocou rovnakých krokov, ktoré ste použili predtým, nahradiť hodnoty null nulami. 

Nahradenie hodnôt null nulami

Odstránenie duplikátov 

Pomocou funkcie Odstrániť duplikáty v doplnku Power Query tiež môžete odstrániť zo stĺpcov duplikáty, aby vybratý stĺpec obsahoval len jedinečné názvy. 

V tomto príklade si môžete všimnúť, že stĺpec Category Name (Názov kategórie) obsahuje duplicitné hodnoty pre jednotlivé kategórie. Preto chcete vytvoriť tabuľku s jedinečnými kategóriami a použiť ju vo svojom dátovom modeli. Môžete to dosiahnuť výberom stĺpca, kliknutím pravým tlačidlom myši na hlavičku stĺpca a následným výberom možnosti Odstrániť duplikáty.  

Pred odstránením duplikátov porozmýšľajte, či si tabuľku neskopírovať. Možnosť Kopírovať nájdete navrchu kontextovej ponuky, ako je znázornené na nasledujúcej snímke obrazovky. Ak si tabuľku pred odstránením duplikátov skopírujete, získate možnosť tabuľky porovnať a v prípade potreby môžete využiť obe tabuľky.

Funkcia Odstrániť duplikáty

Najvhodnejšie postupy pri vytváraní názvov tabuliek, stĺpcov a hodnôt

Konvencie pomenovania tabuliek, stĺpcov a hodnôt nemajú žiadne pevne stanovené pravidlá. Odporúča sa však použiť jazyk a skratky, ktoré sa vo vašej organizácii bežne používajú, ktoré sú všeobecne schválené a považujete ich za bežnú terminológiu. 

Najvhodnejšie je vytvoriť pre tabuľky, stĺpce a mierky popisné obchodné názvy a nahradiť znaky podčiarknutia (_) medzerami. Skratky, predpony a slová ako „číslo“ alebo „ID“ používajte konzistentne. Neúmerne krátke skratky môžu pôsobiť zavádzajúco, ak sa v organizácii bežne nepoužívajú. 

Nejasnostiam môžete predísť aj tak, že odstránite predpony alebo prípony, ktoré sa môžu používať v názvoch tabuliek, a nahradíte ich názvami v jednoduchšom formáte.

Pri nahrádzaní hodnôt si skúste predstaviť, ako sa tieto hodnoty budú zobrazovať v zostave. Hodnoty, ktoré sú príliš dlhé, môžu spôsobovať problémy pri čítaní alebo sa nemusia zmestiť do vizuálu. Hodnoty, ktoré sú príliš krátke, môžu spôsobovať problémy pri interpretácii. Pokiaľ sa text priestorovo zmestí do vizuálu, je tiež vhodné vyhnúť sa v hodnotách akronymom.