Vyčistenie a transformácia údajov pomocou editora Power Query
Teraz, keď sme sa už pripojili k zdroju údajov prostredníctvom aplikácie Microsoft Power BI Desktop, musíme údaje upraviť tak, aby vyhovovali našim potrebám. Upravovanie niekedy znamená tvarovanie údajov napríklad pomocou premenovania stĺpcov alebo tabuliek, prevodu textu na čísla, odstránenia riadkov alebo nastavenia prvého riadku ako hlavičky.
Editor Power Query v aplikácii Power BI Desktop okrem úloh dostupných na páse s nástrojmi vo veľkej miere využíva kontextové ponuky (tiež známe ako ponuky dostupné po kliknutí pravého tlačidla). Väčšina položiek, ktoré si môžete vybrať na páse s nástrojmi na karte Transformovať, je tiež k dispozícii po kliknutí pravým tlačidlom na položku (ako napr. stĺpec) a následným výberom príkazu v zobrazenej kontextovej ponuke.
Tvarovanie údajov
Pri tvarovaní údajov v editore Power Query zadávate podrobné pokyny, ktoré editor Power Query vykoná, aby upravil údaje tak, ako ich načítava a zobrazuje. Pôvodný zdroj údajov nie je ovplyvnený. Upravuje sa alebo tvaruje iba príslušné zobrazenie údajov.
Kroky, ktoré ste zadali (napríklad premenovanie tabuľky, transformovanie typu údajov alebo odstránenie stĺpcov), sa zaznamenávajú pomocou editora Power Query. Tieto kroky sa potom vykonajú zakaždým, keď sa dotaz pripojí k zdroju údajov, takže sa údaje vždy vytvarujú tak, ako ste určili. Tento proces sa uplatní vždy, keď v aplikácii Power BI Desktop použijete dotaz, alebo keď niekto iný použije vami zdieľaný dotaz (napríklad v službe Power BI). Kroky sa zaznamenajú v príslušnom poradí v časti Použité kroky na table Nastavenia Power Query.
Na nasledujúcom obrázku je zobrazená tabla Nastavenia dotazu pre tvarovaný dotaz. V nasledujúcich odsekoch sa budeme venovať každému z jednotlivých krokov.

Vráťme sa späť k údajom o dôchodkoch, ktoré sme získali po pripojení k webovému zdroju údajov, a tvarujme ich tak, aby vyhovovali našim potrebám.
Poznámka
Ak ste si nestiahli vzorovú množinu údajov, pozrite si predchádzajúcu stránku lekcie.
Chceme, aby mali údaje číselnú podobu. Pre tento prípad sú v poriadku, ale ak by ste niekedy potrebovali zmeniť typ údajov, stačí kliknúť pravým tlačidlom myši na hlavičku stĺpca a vybrať položky Zmeniť typ > Celé číslo. Ak musíte zmeniť viac ako jeden stĺpec, vyberte jeden zo stĺpcov, potom podržte stlačený kláves Shift a vyberte ďalšie susedné stĺpce. Potom kliknite pravým tlačidlom na hlavičku stĺpca a zmenia sa všetky vybraté stĺpce. Ak chcete vybrať iné stĺpce než susedné, môžete použiť kláves Ctrl.

Poznámka
Power Query často zistí, že v stĺpci s textom by mali byť čísla. Okamžite a automaticky po prenesení tabuľky do editora Power Query preto zmení typ údajov. V tomto prípade krok v časti Použité kroky identifikuje, ktoré úkony služba Power Query vykonala za vás.
Obsah daných stĺpcov môžete tiež zmeniť alebo transformovať z textu na hlavičku pomocou karty Transformovať na páse s nástrojmi. Karta Transformovať je znázornená na tomto obrázku. Červené pole zvýrazní tlačidlo Typ údajov , ktoré vám umožní transformovať aktuálny typ údajov na iný.

Všimnite si, že v zozname Použité kroky na table Nastavenia dotazu sa odrážajú všetky vykonané zmeny. Z procesu tvarovania odstránite ľubovoľný krok výberom daného kroku a následne kliknutím na položku X naľavo od neho.

Pripojenie k údajom
Tieto údaje o rozličných štátoch sú zaujímavé a budú užitočné pri práci na ďalšej analytickej úlohe alebo dotaze. Je tu však jeden problém. Väčšina daných údajov používa dvojpísmenové kódy štátov ako skratky, nie celé názvy štátov. Preto je potrebné nejakým spôsobom priradiť názvy štátov ku skratkám.
Máme šťastie: existuje ďalší verejný zdroj údajov, ktorý nám na to poslúži, ale je potrebné pomerne rozsiahle tvarovanie predtým, než ho budeme môcť pripojiť k našej tabuľke s informáciami o dôchodkoch. Tu je internetový zdroj so skratkami štátov:
http://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations
V editore Power Query na karte Domov na páse s nástrojmi vyberte položky Nový zdroj > Web. Potom zadajte adresu a vyberte tlačidlo OK. V okne Navigátor sa zobrazia výsledky nájdené na danej webovej stránke.

Vyberte tabuľku Codes and abbreviations... (Kódy a skratky...), pretože zahŕňa údaje, ktoré nás zaujímajú, hoci si bude vyžadovať intenzívne tvarovanie, aby bolo možné zredukovať dané údaje.
Výberom tlačidla Načítať sa údaje prenesú do editora Power Query a je možné ich tvarovať. Potom postupujte podľa týchto krokov:
Odstráňte tri najvrchnejšie riadky – dané riadky vznikli ako výsledok procesu vytvárania tabuľky webovej stránky a nepotrebujeme ich. Odstránite ich tak, že na karte Domov na páse s nástrojmi vyberiete položky Odstrániť riadky > Odstrániť najvrchnejšie riadky. V zobrazenom dialógovom okne zadajte hodnotu 3 ako počet riadkov na odstránenie.

Odstránenie 26 spodných riadkov – dané riadky predstavujú teritóriá, a tie nie je potrebné zahrnúť. Proces je rovnaký, ale tentoraz vyberte položky Odstrániť riadky > Odstrániť spodné riadky a ako počet riadkov na odstránenie zadajte hodnotu 26.

Odfiltrovanie štátu Washington DC – štatistiky o penziách neobsahujú štát Washington DC, takže ho vylúčime zo zoznamu. Vyberte rozbaľovaciu šípku vedľa stĺpca Federal state (Federálny štát ) a zrušte začiarknutie políčka Federal district (Federálny dištrikt ).

Odstránenie niekoľkých nepotrebných stĺpcov – potrebujeme len priradiť štát k jeho oficiálnej dvojpísmenovej skratke a daná informácia sa uvádza v prvom a štvrtom stĺpci. Preto si potrebujeme ponechať len tieto dva stĺpce a môžeme odstrániť všetky ostatné. Vyberte prvý stĺpec na odstránenie, potom podržte stlačený kláves Ctrl a vyberte ďalšie stĺpce na odstránenie (týmto spôsobom môžete vybrať viaceré nesusedné stĺpce). Potom na karte Domov na páse s nástrojmi vyberte položky Odstrániť stĺpce > Odstrániť stĺpce.

Použitie prvého riadku ako hlavičiek – keďže sme odstránili tri najvrchnejšie riadky, aktuálny najvrchnejší riadok je požadovaná hlavička. Vyberte tlačidlo Použiť prvý riadok ako hlavičky.

Poznámka
Teraz je správny čas na poukázanie na to, že postupnosť použitých krokov v editore Power Query je dôležitá a môže ovplyvniť tvarovanie údajov. Tiež je dôležité vziať do úvahy to, ako môže jeden krok ovplyvniť aj ďalší nasledujúci krok. Ak zo zoznamu Použité kroky nejaký krok odstránite, nasledujúce kroky sa možno nebudú správať podľa pôvodného zámeru pre vplyv postupnosti krokov dotazu.
Premenovanie stĺpcov a samotnej tabuľky – ako zvyčajne, stĺpec je možné premenovať niekoľkými spôsobmi. Môžete si vybrať ten, ktorý preferujete. Premenujme ich na Názov štátu a Kód štátu. Ak chcete premenovať tabuľku, jednoducho zadajte názov do poľa Názov v table Nastavenia dotazu. Túto tabuľku nazvime Kódyštátov.

Kombinovanie údajov
Teraz, keď je tabuľka Kódyštátov tvarovaná, môžeme skombinovať naše dve tabuľky do jednej. Keďže tabuľky, ktoré máme teraz, sú výsledkom dotazov použitých na údaje, často sa označujú ako dotazy.
Existujú dva základné spôsoby kombinovania dotazov, a to zlučovanie a pripájanie.
Keď máte jeden alebo viacero stĺpcov, ktoré chcete pridať do ďalšieho dotazu, dané dotazy zlúčte. Pokiaľ máte ďalšie riadky údajov, ktoré chcete pridať do existujúceho dotazu, dotaz pripojte.
V tomto prípade chceme dotazy zlúčiť. Na začiatok vyberte dotaz, ktorý sa má zlúčiť do ďalšieho dotazu. Následne na karte Domov na páse s nástrojmi vyberte možnosť Zlúčiť dotazy. Dotaz s informáciami o dôchodkoch chceme vybrať ako prvý. Keď už sme pri ňom, premenujeme ho na Dôchodkovéštatistiky.

Zobrazí sa dialógové okno Zlúčiť s výzvou, aby sme vybrali tabuľku na zlúčenie do vybratej tabuľky a zhodujúce sa stĺpce, ktoré sa použijú na zlúčenie.
Vyberte stĺpec Štát z tabuľky (z dotazu) Dôchodkovéštatistiky a potom vyberte dotaz Kódyštátov. (V tomto prípade je výber jednoduchý, pretože sa tu nachádza len jeden ďalší dotaz. Keď sa však pripojíte k mnohým zdrojom údajov, budete mať na výber množstvo dotazov.) Po výbere správnych zodpovedajúcich stĺpcov, čiže stĺpca Štát z tabuľky Dôchodkovéštatistiky a stĺpca Názov štátu z tabuľky Kódyštátov bude dialógové okno Zlúčiť vyzerať nasledovne a tlačidlo OK bude k dispozícii.

Na konci tohto dotazu sa vytvorí stĺpec Novýstĺpec a zároveň tvorí obsah tabuľky (dotazu) zlúčenej s existujúcim dotazom. Všetky stĺpce zo zlúčeného dotazu sú zhustené do stĺpca Novýstĺpec, ale tabuľku môžete rozbaliť a zahrnúť vami vybraté stĺpce. Ak chcete rozbaliť zlúčenú tabuľku a vybrať stĺpce, ktoré chcete zahrnúť, vyberte ikonu Rozbaliť (
). Zobrazí sa dialógové okno Rozbaliť.

V tomto prípade potrebujeme len stĺpec Kód štátu. Vyberte preto len tento stĺpec a potom vyberte tlačidlo OK. Môžete tiež zrušiť začiarknutie políčka Použiť ako predponu pôvodný názov stĺpca. Ak políčko ponecháte začiarknuté, zlúčený stĺpec získa názov Novýstĺpec.Kód Štátu (pôvodný názov stĺpca alebo Novýstĺpec, bodka a nakoniec názov stĺpca preneseného do dotazu).
Poznámka
Ak chcete, môžete si vyskúšať, ako preniesť tabuľku NovýStĺpec. Ak sa vám výsledky nepáčia, stačí odstrániť krok Rozbaliť zo zoznamu Použité kroky na table Nastavenia dotazu. Váš dotaz sa vráti do stavu pred použitím daného kroku. Môžete tento postup opakovať, koľkokrát chcete, kým proces rozbalenia nevyzerá podľa vašich predstáv.
Teraz máme jeden dotaz (tabuľku), ktorý kombinuje dva zdroje údajov. Každý z nich sme vytvarovali podľa našich potrieb. Tento dotaz môže slúžiť ako základ pre množstvo ďalších zaujímavých prepojení údajov, ako je napríklad štatistika nákladov na bývanie, demografické parametre alebo pracovné príležitosti v jednotlivých štátoch.
Ak chcete zmeny použiť v editore Power Query a načítať ich do aplikácie Power BI Desktop, vyberte možnosť Zavrieť a použiť na karte Domov na páse s nástrojmi.

Údaje vo vašom modeli sú teraz pripravené na ďalšie použitie. Následne vytvoríme pre vašu zostavu niekoľko vizuálov.
Nateraz máme dostatok údajov na vytvorenie niekoľkých zaujímavých zostáv, a to všetko v aplikácii Power BI Desktop. Keďže ide o medzník, poďme tento súbor aplikácie Power BI Desktop uložiť. Vyberte položky Súbor > Uložiť na karte Domov na páse s nástrojmi a uložte zostavu. Nazveme ju Začíname s aplikáciou Power BI Desktop.
Skvelé! Prejdite do ďalšej lekcie, v ktorej vytvoríme niekoľko zaujímavých vizuálov.
Potrebujete pomoc? Pozrite si nášho sprievodcu riešením problémov alebo odošlite konkrétne pripomienky nahlásením problému.