Kurz: Tvarovanie a kombinovanie údajov v aplikácii Power BI Desktop

S aplikáciou Power BI Desktop sa môžete pripojiť k mnohým rôznym typom zdrojov údajov a potom údaje tvarovať tak, aby vyhovovali vašim potrebám. Umožní vám to vytvárať vizuálne zostavy, ktoré môžete zdieľať s ostatnými. Tvarovanie údajov označuje transformáciu údajov: premenovanie stĺpcov alebo tabuliek, prevedenie textu do číselných hodnôt, odstránenie riadkov, nastavenie prvých riadkov ako hlavičiek a podobne. Kombinovanie údajov označuje prepojenie dvoch alebo viacerých zdrojov údajov, ich tvarovanie podľa potreby a ich následnú konsolidáciu do uplatniteľného dotazu.

V tomto kurze sa naučíte:

  • Tvarovať údaje pomocou Power Query Editora.
  • Pripojiť sa k rôznym zdrojom údajov.
  • Skombinovať tieto zdroje údajov a vytvoriť dátový model na použitie v zostavách.

Tento kurz ukazuje, ako tvarovať dotaz pomocou aplikácie Power BI Desktop, a popisuje najčastejšie úlohy. Tu uplatnený dotaz je podrobnejšie popísaný, a to vrátane kompletného postupu vytvorenia dotazu, v časti Začíname s aplikáciou Power BI Desktop.

Power Query Editor Power BI Desktop umožňuje veľa používať ponuky po kliknutí pravým tlačidlom aj pás s nástrojmi Transformovať. Väčšina položiek na páse s nástrojmi Transformovať je k dispozícii aj po kliknutí na položku (napríklad stĺpec) pravým tlačidlom myši a výbere zo zobrazenej ponuky.

Tvarovanie údajov

Pri tvarovanie údajov v editore Power Query podrobné pokyny, ktoré za vás editor vykoná, aby ste upravili načítané Power Query údaje tak, ako ich načítava a zobrazuje. Pôvodný zdroj údajov sa nijakým spôsobom nemení. Upravuje sa (alebo tvaruje) iba príslušné zobrazenie údajov.

Kroky, ktoré ste zadali (napríklad premenovanie tabuľky, transformácia typu údajov alebo odstránenie stĺpca), sa zaznamenávajú pomocou Power Query Editora. Vždy, keď sa dotaz pripojí k zdroju údajov, Power Query tieto kroky vykoná Editor, aby boli údaje vždy tvarované tak, ako ste špecifikovali. Tento proces sa vyskytne vždy, Power Query použijete Editor alebo keď ktokoľvek použije vami zdieľaný dotaz, napríklad v služba Power BI. Tieto kroky sa v sekvenčnom tabuľke dotazov zaznamenajú Nastavenia table Použité kroky. Jednotlivým krokom sa budeme venovať v niekoľkých ďalších odsekoch.

Použité kroky na table Nastavenia dotazu

Vezmime si údaje o dôchodkoch z časti Začíname s aplikáciou Power BI Desktop, ktoré sme získali pripojením k webovému zdroju údajov, a prispôsobme ich našim potrebám. Pridáme vlastný stĺpec na vypočítanie poradia na základe rovnocenného postavenia všetkých údajov a tento výsledok porovnáme s existujúcim stĺpcom Rank (Poradie).

  1. Na páse s nástrojmi Pridať stĺpec vyberte položku Vlastný stĺpec, pomocou ktorej môžete pridať vlastný stĺpec.

    Vyberte položku Vlastný stĺpec

  2. V okne Vlastný stĺpec zadajte do poľa Názov nového stĺpca text New Rank (Nové poradie). Do poľa Vzorec vlastného stĺpca zadajte nasledujúce údaje:

    ([Cost of living] + [Weather] + [Health care quality] + [Crime] + [Tax] + [Culture] + [Senior] + [#"Well-being"]) / 8
    
  3. Uistite sa, že hlásenie stavu uvádza hodnotu Nezistili sa žiadne syntaktické chyby, a potom vyberte tlačidlo OK.

    Stránka Vlastný stĺpec bez syntaktických chýb

  4. V záujme zachovania konzistencie údajov stĺpca je potrebné transformovať hodnoty nového stĺpca na celé čísla. Ak ich chcete zmeniť, kliknite na hlavičku stĺpca pravým tlačidlom myši a vyberte položky Zmeniť typ > Celé číslo.

    Ak chcete vybrať viac ako jeden stĺpec, vyberte stĺpec, podržte stlačený kláves SHIFT, vyberte ďalšie susediace stĺpce a kliknite pravým tlačidlom myši na hlavičku stĺpca. Pomocou klávesu CTRL môžete vybrať aj stĺpce, ktoré priamo nesusedia.

    Výber možnosti Celé číslo pre údaje stĺpca

  5. Ak chcete transformovať typy údajov stĺpcov, aby sa aktuálny typ údajov zmenil na iný, vyberte na páse s nástrojmi Transformovať položku Typ údajov: Text.

    Výber položky Typ údajov: Text

  6. Zoznam Použité krokyNastaveniach dotazu uvádza všetky kroky tvarovania použité na údaje. Ak chcete ktorýkoľvek krok z procesu tvarovania odstrániť, vyberte ikonu X naľavo od kroku.

    Na nasledujúcom obrázku sa v zozname Použité kroky zobrazujú doposiaľ vykonané kroky:

    • Zdroj: Pripojenie k webovej lokalite.

    • Extrahovaná tabuľka z Html: Výber tabuľky.

    • Zmenený typ: Zmena stĺpcov čísel založených na texte z typu Text na Celé číslo.

    • Pridané vlastné: pridanie vlastného stĺpca.

    • Zmenený typ1: Posledný použitý krok.

      Zoznam použitých krokov

Úprava údajov

Skôr než s týmto dotazom začneme pracovať, musíme vykonať niekoľko zmien, aby sme údajov upravili:

  • Úprava poradí odstránením stĺpca.

    Rozhodli sme sa, že stĺpec Cost of living (Životné náklady) nie je pre naše výsledky dôležitý. Po jeho odstránení zistíme, že údaje zostanú nezmenené.

  • Oprava niekoľkých chýb.

    Vzhľadom na to, že sme odstránili stĺpec, musíme prispôsobiť naše výpočty v stĺpci New Rank (Nové poradie), a to zmenou vzorca.

  • Zoradenie údajov.

    Údaje zoradíme na základe stĺpcov New Rank (Nové poradie) a Rank (Poradie).

  • Nahradenie údajov.

    Zdôrazníme spôsob nahradenia konkrétnej hodnoty a potrebu vloženia použitého kroku.

  • Zmena názvu tabuľky.

    Keďže Table 0 (Tabuľka 0) nie je práve užitočný popis, zmeníme ho.

  1. Stĺpec Cost of living (Životné náklady) odstránite tak, že ho najskôr vyberiete, na páse s nástrojmi vyberiete kartu Domov a potom vyberiete položku Odstrániť stĺpce.

    Výber možnosti Odstrániť stĺpce

    Všimnite si, že hodnoty stĺpca New Rank (Nové poradie) sa nezmenili, čo je spôsobené poradím jednotlivých krokov. Keďže Power Query Editor zaznamenáva kroky v postupnosti, no zároveň vzájomne nezávisle, každý Použitý krok je možné posúvať v postupnosti nahor alebo nadol.

  2. Kliknite pravým tlačidlom myši na krok. Power Query Editor zobrazí ponuku, ktorá vám umožní vykonávať nasledujúce úlohy:

    • Premenovať: Premenuje krok.
    • Odstrániť: Odstrániť krok.
    • Odstrániť do konca: Odstráňte aktuálny krok a všetky nasledujúce kroky.
    • Prejsť pred: Posunie krok nahor v zozname.
    • Presunúť po: Posunie krok nadol v zozname.
  3. Posuňte posledný krok Odstránené stĺpce hneď nad krok Pridané vlastné.

    Posunutie kroku nahor v zozname Použité kroky

  4. Vyberte krok Pridané vlastné.

    Všimnite si, že údaje teraz uvádzajú hodnotu Chyba, ktorú budeme musieť vyriešiť.

    Chybný výsledok v údajoch stĺpca

    Existuje niekoľko spôsobov, ako získať ďalšie informácie o jednotlivých chybách. Ak vyberiete bunku bez kliknutia na slovo Chyba, v editore Power Query informácie o chybe.

    Informácie o chybe v Power Query Editore

    Ak priamo vyberiete slovo Chyba, editor Power Query použitý krok na table Dotaz Nastavenia a zobrazí informácie o tejto chybe.

  5. Keďže nepotrebujeme zobraziť informácie o chybách, vyberte možnosť Zrušiť.

  6. Ak chcete chyby opraviť, vyberte stĺpec New Rank (Nové poradie) a potom zobrazte vzorec údajov stĺpca začiarknutím políčka Riadok vzorcov na karte Zobraziť.

    Začiarknutie políčka Riadok vzorcov

  7. Odstráňte parameter Cost of living (Životné náklady) a zmenšite deliteľ pomocou nasledujúcej zmeny vzorca:

     Table.AddColumn(#"Removed Columns", "New Rank", each ([Weather] + [Health care quality] + [Crime] + [Tax] + [Culture] + [Senior] + [#"Well-being"]) / 7)
    
  8. Vyberte zelený symbol začiarknutia naľavo od poľa vzorcov alebo stlačte kláves Enter.

Power Query Editor nahradí údaje upravenými hodnotami a krok Pridané vlastné sa dokončí bez chýb.

Poznámka

Pomocou pásu s nástrojmi alebo ponuky zobrazenej kliknutím pravým tlačidlom myši môžete tiež vybrať možnosť Odstrániť chyby. Odstránia sa tým všetky riadky, ktoré obsahujú chyby. V tomto kurze však takýto postup neukazujeme, pretože chceme údaje v tabuľke zachovať.

  1. Zoraďte údaje na základe stĺpca New Rank (Nové poradie). Najskôr vyberte posledný použitý krok Zmenený typ1, čím sa zobrazia najnovšie údaje. Potom kliknite na rozbaľovaciu ponuku vedľa hlavičky stĺpca New Rank (Nové poradie) a vyberte možnosť Zoradiť vzostupne.

    Zoradenie údajov v stĺpci New Rank (Nové poradie)

    Údaje sú teraz zoradené podľa stĺpca New Rank (Nové poradie). Ak sa však pozriete na stĺpec Rank (Poradie), zistíte, že údaje nie sú zoradené správne, ak dochádza k zhode s hodnotou New Rank (Nové poradie). Vyriešime to v ďalšom kroku.

  2. Ak chcete vyriešiť problém so zoradením údajov, vyberte stĺpec New Rank (Nové poradie) a zmeňte vzorec v riadku vzorcov takto:

     = Table.Sort(#"Changed Type1",{{"New Rank", Order.Ascending},{"Rank", Order.Ascending}})
    
  3. Vyberte zelený symbol začiarknutia naľavo od poľa vzorcov alebo stlačte kláves Enter.

    Riadky sa zoradia podľa stĺpca New Rank (Nové poradie) aj Rank (Poradie). Okrem toho môžete vybrať Použitý krok hocikde v zozname a pokračovať v tvarovaní údajov v tomto mieste postupu. Power Query Editor automaticky vloží nový krok priamo za aktuálne vybratý Použitý krok.

  4. V zozname Použité kroky vyberte krok pred vlastným stĺpcom (krok Odstránené stĺpce). Tu nahradíme hodnotu Weather (Počasie) v štáte Arizona. Pravým tlačidlom myši kliknite na bunku obsahujúcu hodnotenie Weather (Počasie) v Arizone a potom vyberte položku Nahradiť hodnoty. Všimnite si, ktorý použitý krok je v tejto chvíli vybratý.

    Výber možnosti Nahradiť hodnoty v stĺpci

  5. Vyberte možnosť Vložiť.

    Keďže vkladáme krok, editor Power Query nás varuje pred nebezpečenstvom, že tak urobíme. nasledujúce kroky môžu spôsobiť prerušenie dotazu.

    Overenie vloženia kroku

  6. Zmeňte hodnotu údajov na 51.

    Power Query Editor nahrádza údaje pre Arizonu. Keď vytvoríte nový použitý krok , Editor Power Query ho pomenuje na základe akcie. v tomto prípade nahradená hodnota. Ak máte v dotaze viac ako jeden krok s rovnakým názvom, Editor Power Query pridá číslo (v poradí) ku každému nasledujúcemu použitému kroku, aby sa medzi nimi rozlišovalo.

  7. Vyberte posledný použitý krok: Zoradené riadky.

    Všimnite si, že údaje súvisiace s novým hodnotením štátu Arizona sa zmenili. Je to preto, lebo sme vložili krok Nahradená hodnota na správne miesto – pred krok Pridané vlastné.

  8. Nakoniec by sme radi zmenili názov danej tabuľky na niečo výstižnejšie. Na table Nastavenia dotazu v časti Vlastnosti zadajte nový názov tabuľky a potom stlačte kláves Enter. Tabuľku pomenujte RetirementStats (Dôchodkové štatistiky).

    Premenovanie tabuľky na table Nastavenia dotazu

    Keď začneme vytvárať zostavy, je užitočné mať popisné názvy tabuliek, najmä keď sa pripájame k viacerým zdrojom údajov, ktoré sú uvedené na table Polia zobrazenia Zostava.

    Údaje sme vytvarovali v rozsahu, v akom potrebujeme. Teraz sa pripojme k inému zdroju údajov a údaje skombinujme.

Kombinovanie údajov

Zaujímavé údaje, ktoré máme o rôznych štátoch, budú užitočné pri vytváraní ďalších analýz a dotazov. Je tu však jeden problém: väčšina dostupných údajov namiesto celých názvov štátov používa ich dvojpísmenové kódy. Kódy štátov preto potrebujeme nejakým spôsobom priradiť k ich celým názvom.

Máme šťastie: existuje verejný zdroj, ktorý presne toto umožňuje, no pred pripojením do našej tabuľky s dôchodkami ho potrebujeme trochu vytvarovať. Pri tvarovaní údajov postupujte takto:

  1. Na páse s nástrojmi Domov v editore Power Query vyberte položku Nový zdroj > webu.

  2. Zadajte adresu webovej lokality pre štátne skratky a https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations potom vyberte položku Pripojenie.

    Navigátor zobrazí obsah webovej lokality.

    Stránka Navigátor

  3. Vyberte položku Codes and abbreviations (Kódy a skratky).

    Tip

    Zredukovanie údajov tejto tabuľky do požadovanej podoby bude vyžadovať trochu tvarovania. Existuje rýchlejší alebo jednoduchší spôsob na dosiahnutie nižšie uvedených krokov? Áno, mohli by sme vytvoriť vzťah medzi dvoma tabuľkami a údaje vytvarovať na základe tohto vzťahu. Naučiť sa nasledujúce kroky je pre prácu s tabuľkami stále dobré – vzťahy vám však možno pomôžu rýchlo použiť údaje z viacerých tabuliek.

Pri tvarovaní údajov postupujte takto:

  1. Odstráňte horný riadok. Tento riadok súvisí s tým, ako bola vytvorená tabuľka webovej stránky, a preto ho nepotrebujeme. Na páse s nástrojmi Domov vyberte položku Odstrániť riadky a > odstráňte najvrchné riadky.

    Výber možnosti Odstrániť najvrchnejšie riadky

    Zobrazí sa okno Odstrániť najvrchnejšie riadky, v ktorom môžete zadať počet riadkov, ktorý by ste chceli odstrániť.

    Poznámka

    Ak Power BI omylom vloží aj hlavičky tabuliek ako riadok tabuľky s údajmi, tabuľku môžete opraviť výberom možnosti Použiť prvý riadok ako hlavičky na karte Domov, prípadne na karte Transformovať na páse s nástrojmi.

  2. Odstráňte spodných 26 riadkov. Tieto riadky predstavujú územia USA, ktoré nepotrebujeme zahrnúť. Na páse s nástrojmi Domov vyberte položku Odstrániť riadky a > odstráňte spodné riadky.

    Výber možnosti Odstrániť spodné riadky

  3. Keďže tabuľka RetirementStats neobsahuje informácie pre Washington DC, musíme ho zo zoznamu odfiltrovať. Vyberte rozbaľovací zoznam Region Status (Stav oblasti) a potom zrušte začiarknutie políčka Federal district (Federálny dištrikt).

    Zrušenie začiarknutia políčka Federal district (Federálny dištrikt)

  4. Odstráňte niekoľko nepotrebných stĺpcov. Pretože potrebujeme len priradenie každého štátu k jeho oficiálnej dvojpísmenovej skratke, môžeme odstrániť niekoľko stĺpcov. Najprv vyberte stĺpec, potom podržte stlačený kláves CTRL a vyberte každý z ostatných stĺpcov, ktoré chcete odstrániť. Na karte Domov na páse s nástrojmi vyberte položky Odstrániť stĺpce > Odstrániť stĺpce.

    Odstránenie stĺpca

    Poznámka

    Teraz je ten čas poukázať na to, že postupnosť použitých krokov v editore Power Query je dôležitá a môže ovplyvniť spôsob tvarovania údajov. Tiež je dôležité vziať do úvahy, že jeden krok môže ovplyvňovať aj nasledujúce kroky. Ak odstránite krok z okna Použité kroky, nasledujúce kroky sa vzhľadom na účinok postupnosti krokov nemusia správať podľa pôvodných predstáv.

    Poznámka

    Keď zmenšíte veľkosť okna editora Power Query tak, aby sa šírka zmenšila, niektoré položky pása s nástrojmi sa zhutnia, aby sa čo najlepšie vyuloil viditeľný priestor. Keď zväčšíte šírku okna Editora Power Query, položky pása s nástrojmi sa rozbalia, aby sa čo najviac vyušli zväčšená oblasť pása s nástrojmi.

  5. Premenujte stĺpce a tabuľku. Existuje niekoľko spôsobov premenovania stĺpca: Najprv vyberte stĺpec a potom buď vyberte položku Premenovať na karte Transformácia na páse s nástrojmi, alebo kliknite pravým tlačidlom myši a vyberte položku Premenovať. Šípky na nasledujúcom obrázku označujú obidve možnosti, no stačí vám vybrať si jednu z nich.

    Premenovanie stĺpca v editore Power Query

  6. Premenujte stĺpce na State Name (Názov štátu) a State Code (Kód štátu). Ak chcete premenovať tabuľku, zadajte jej názov na table Nastavenia dotazu. Túto tabuľku pomenujte StateCodes (KódyŠtátov).

Kombinovanie dotazov

Keď teraz máme tabuľku StateCodes vytvarovanú podľa našich predstáv, zlúčime obidve tabuľky (alebo dotazy) do jednej. Keďže sú naše tabuľky výsledkom dotazov, ktoré sme na údaje použili, často sa označujú ako dotazy.

Existujú dva základné spôsoby kombinovania dotazov, a to zlučovanie a pripájanie.

  • Keď máte aspoň jeden stĺpec, ktorý by ste chceli pridať do iného dotazu, dotazy zlúčte.
  • Ak chcete do existujúceho dotazu vložiť ďalšie riadky s údajmi, takýto dotaz pripojte.

V tomto prípade chceme dotazy zlúčiť. Môžete to urobiť podľa nasledujúceho postupu:

  1. Na ľavej table Editora Power Query vyberte dotaz, do ktorého sa má druhý dotaz zlúčiť. V tomto prípade je to dotaz RetirementStats (Dôchodkové štatistiky).

  2. Na karte Domov na > páse s nástrojmi vyberte položku Zlúčiť dotazy na zlúčenie dotazov.

    Výber možnosti Zlúčiť dotazy

    Môže sa zobraziť výzva na nastavenie úrovne ochrany osobných údajov, aby sa pri skombinovaní nevložili alebo nepreniesli údaje, ktoré nechcete preniesť.

    Zobrazí sa okno Zlúčiť. Vyzve vás na výber tabuľky, ktorú chcete zlúčiť do vybranej tabuľky, a zodpovedajúcich stĺpcov, ktoré sa majú pri zlúčení použiť.

  3. V tabuľke RetirementStats (Dôchodkové štatistiky) vyberte stĺpec State (Štát) a potom vyberte dotaz StateCodes (KódyŠtátov).

    Po výbere správnych zodpovedajúcich stĺpcov sa aktivuje tlačidlo OK.

    Okno Zlúčiť

  4. Vyberte položku OK.

    Power Query Editor vytvorí nový stĺpec na konci dotazu, ktorý obsahuje obsah tabuľky (dotazu), ktorý bol zlúčený s existujúcim dotazom. Všetky stĺpce z zlúčeného dotazu sú zhustené do stĺpca, ale môžete rozbaliť tabuľku a zahrnúť ľubovoľné stĺpce.

    Stĺpec NewColumn

  5. Ak chcete rozbaliť zlúčenú tabuľku a vybrať požadované stĺpce, vyberte ikonu rozbalenia (Ikona rozbalenia).

    Zobrazí sa okno Rozbalenie.

    Stĺpec NewColumn v dotaze

  6. V tomto prípade chceme len stĺpec State Code (Kód štátu). Vyberte ho, zrušte začiarknutie políčka Použiť ako predponu pôvodný názov stĺpca a potom vyberte OK.

    Ak by sme nechali políčko Použiť ako predponu pôvodný názov stĺpca začiarknuté, zlúčený stĺpec by mal názov NewColumn.State Code.

    Poznámka

    Chcete zistiť, ako pridať tabuľku NewColumn (Nový stĺpec)? Môžete trochu experimentovať a ak sa vám výsledok nebude páčiť, stačí daný krok odstrániť zo zoznamu Použité kroky na table Nastavenia dotazu. Tabla sa vráti do stavu pred použitím tohto kroku Rozbaliť. Môžete to opakovať, koľkokrát chcete, kým proces rozbalenia nebude vyzerať podľa vašich predstáv.

    Teraz máme jeden dotaz (tabuľku), ktorý kombinuje dva zdroje údajov. Každý z nich sme vytvarovali podľa našich potrieb. Tento dotaz môže slúžiť ako základ pre množstvo ďalších zaujímavých prepojení údajov – napríklad štatistiku nákladov na bývanie, demografické údaje alebo pracovné príležitosti v ľubovoľnom štáte.

  7. Ak chcete použiť zmeny a zavrieť Power Query editor, vyberte položku Zavrieť & použiť na karte Domov na páse s nástrojmi.

    Transformovaná množina údajov sa zobrazí v aplikácii Power BI Desktop, kde ju môžete použiť na vytváranie zostáv.

    Výber položky Zavrieť a použiť

Ďalšie kroky

Ďalšie informácie o aplikácii Power BI Desktop a jej možnostiach nájdete v nasledujúcich témach: