Kurz: Tvarovanie a kombinovanie údajov v aplikácii Power BI Desktop
S aplikáciou Power BI Desktop sa môžete pripojiť k mnohým rôznym typom zdrojov údajov a potom údaje tvarovať tak, aby vyhovovali vašim potrebám. Umožní vám to vytvárať vizuálne zostavy, ktoré môžete zdieľať s ostatnými. Tvarovanie údajov označuje transformáciu údajov: premenovanie stĺpcov alebo tabuliek, premenovanie textu na čísla, odstránenie riadkov, nastavenie prvých riadkov ako hlavičiek a podobne. Kombinovanie údajov označuje prepojenie dvoch alebo viacerých zdrojov údajov, ich tvarovanie podľa potreby a ich následnú konsolidáciu do jedného dotazu.
V tomto kurze sa naučíte:
- Tvarovať údaje pomocou Editor Power Query.
- Pripojenie k rôznym zdrojom údajov.
- Skombinovať tieto zdroje údajov a vytvoriť dátový model na použitie v zostavách.
Tento kurz ukazuje, ako tvarovať dotaz pomocou aplikácie Power BI Desktop, a popisuje najčastejšie úlohy. Tu ubraný dotaz je podrobnejšie popísaný, a to vrátane postupu vytvorenia dotazu úplne od začiatku, v časti Začíname s aplikáciou Power BI Desktop.
Editor Power Query v aplikácii Power BI Desktop používa ponuky, ktoré saTransformovať pás s nástrojmi. Väčšina položiek na páse s nástrojmi je k dispozícii aj po kliknutí na položku (napríklad stĺpec) pravým tlačidlom myši a výbere zo zobrazenej ponuky.
Tvarovanie údajov
Ak chcete tvarovať údaje v Editor Power Query, zadajte podrobné pokyny na Editor Power Query na úpravu údajov pri načítavaní a zobrazení údajov. Pôvodný zdroj údajov sa neovplyvní. Upravuje sa alebo tvaruje iba toto konkrétne zobrazenie údajov.
Zadané kroky, ako je napríklad premenovanie tabuľky, transformovanie typu údajov alebo odstránenie stĺpca, sa zaznamenávajú na základe Editor Power Query. Vždy, keď sa dotaz pripojí k zdroju údajov, Editor Power Query tieto kroky vykoná, aby boli údaje vždy tvarované určeným spôsobom. Tento proces sa vykoná vždy, keď použijete Editor Power Query, alebo keď ktokoľvek použije vami zdieľaný dotaz, napríklad na služba Power BI. Tieto kroky sa v príslušnom poradí zaznamenajú na table Nastavenia dotazu v časti POUŽITÉ KROKY. V tomto článku sa pozrieme na jednotlivé kroky.
Import údajov z webového zdroja. Vyberte rozbaľovací zoznam Získať údaje a potom vyberte položku Web.
Prilepte túto URL adresu do dialógového okna Z webu a vyberte tlačidlo OK.
https://www.fool.com/research/best-states-to-retire
V dialógovom okne Navigátor vyberte položku
Table 1
a potom položku Transformovať údaje.
Prepitné
Niektoré informácie v tabuľkách z predchádzajúcej URL adresy sa môžu príležitostne zmeniť alebo aktualizovať. V dôsledku toho možno budete musieť podľa toho upraviť výbery alebo kroky v tomto článku.
Otvorí sa okno Editor Power Query. Doposiaľ použité kroky môžete zobraziť na table Nastavenia dotazu v časti POUŽITÉ KROKY.
- Zdroj: Pripojenie na webovú lokalitu.
- Extrahovaná tabuľka z Html: výber tabuľky.
- Hlavičky so propagovaným úroveňou: Zmena horného riadka údajov na hlavičky stĺpcov.
- Zmenený typ: zmena typov stĺpcov, ktoré sa importujú ako text, na odvodené typy.
Zmeňte názov tabuľky z predvoleného
Table 1
nastavenia naRetirement Data
a potom stlačte kláves Enter.Existujúce údaje sa zoradia podľa váženého skóre, ako je to popísané na zdrojovej webovej stránke v časti Metodika. Pridajme vlastný stĺpec na výpočet iného skóre. Potom zoradíme tabuľku v tomto stĺpci, aby sme porovnali poradie vlastného skóre s existujúcim poradím.
Na páse s nástrojmi Pridať stĺpec vyberte položku Vlastný stĺpec.
V dialógovom okne Vlastný stĺpec zadajte do poľa Názov nového stĺpca hodnotu Nové skóre. Pre vzorec vlastného stĺpca zadajte nasledujúce údaje:
( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
Uistite sa, že hlásenie stavu obsahuje hodnotu Nezistili sa žiadne syntaktické chyby, a vyberte tlačidlo OK.
V Nastavenia dotazu sa v zozname POUŽITÉ KROKY teraz zobrazuje krok Pridané vlastné, ktorý sme práve definovali.
Úprava údajov
Skôr než s týmto dotazom začneme pracovať, vykonajte niekoľko zmien na úpravu údajov:
Úprava poradia odstránením stĺpca.
Predpokladajme napríklad, že pole Počasie nie je faktorom našich výsledkov. Odstránenie tohto stĺpca z dotazu nemá vplyv na ostatné údaje.
Opravte všetky chyby.
Keďže sme odstránili stĺpec, musíme upraviť naše výpočty v stĺpci Nové skóre tak, že zmeníme jeho vzorec.
Zoradenie údajov.
Zoraďte údaje na základe stĺpca New score (Nové skóre ) a porovnajte existujúce stĺpce Rank (Poradie ).
Nahradenie údajov.
Zdôrazníme, ako nahradiť konkrétnu hodnotu a ako vložiť použitý krok.
Tieto zmeny sú popísané v nasledujúcich krokoch.
Ak chcete odstrániť stĺpec Počasie , vyberte stĺpec, na páse s nástrojmi vyberte kartu Domov a potom vyberte položku Odstrániť stĺpce.
Poznámka
Hodnoty nového skóre sa nezmenili, čo je spôsobené poradím jednotlivých krokov. Editor Power Query zaznamenáva kroky v príslušnom poradí, no zároveň vzájomne nezávisle. Ak chcete použiť akcie v inom poradí, každý použitý krok môžete posúvať nahor alebo nadol.
Kliknutím pravým tlačidlom myši na krok zobrazíte jeho kontextovú ponuku.
Posuňte posledný krok Odstránené stĺpce hneď nad krok Pridané vlastné .
Vyberte krok Pridané vlastné.
Všimnite si, že v stĺpci Nové skóre sa teraz namiesto vypočítanej hodnoty zobrazuje chyba .
Existuje niekoľko spôsobov, ako získať ďalšie informácie o jednotlivých chybách. Ak vyberiete bunku bez kliknutia na slovo Chyba, Editor Power Query zobrazí informácie o chybe.
Ak vyberiete slovo Chyba, Editor Power Query vytvorí použitý krok na table Nastavenia dotazu a zobrazí informácie o danej chybe. Keďže informácie o chybách nepotrebujeme zobraziť nikde inde, vyberte položku Zrušiť.
Na opravu chýb sú potrebné dve zmeny, pričom sa odstráni názov stĺpca Weather (Počasie ) a rozdelí deliteľ z 8 na 7. Tieto zmeny môžete vykonať dvoma spôsobmi:
Kliknite pravým tlačidlom myši na krok Vlastný stĺpec a vyberte položku Upraviť Nastavenia. Zobrazí sa dialógové okno Vlastný stĺpec, ktoré ste použili na vytvorenie stĺpca Nové skóre . Upravte vzorec tak, ako bol popísaný vyššie, kým nebude vyzerať takto:
Vyberte stĺpec Nové skóre a potom zobrazte vzorec údajov stĺpca začiarknutím políčka Riadok vzorcov na karte Zobraziť.
Upravte vzorec tak, ako bol opísaný vyššie, kým nevyzerá takto, potom stlačte kláves Enter.
= Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)
Editor Power Query nahradí údaje revidovanými hodnotami a aby Pridaný vlastný krok sa dokončí bez chýb.
Poznámka
Pomocou pásu s nástrojmi alebo ponuky zobrazenej kliknutím pravým tlačidlom myši môžete tiež vybrať položku Odstrániť chyby. Odstránia sa tým všetky riadky obsahujúce chyby. V tomto kurze však chceme zachovať všetky údaje v tabuľke.
Zoraďte údaje na základe stĺpca Nové skóre . Najprv vyberte posledný použitý krok Pridané vlastné, čím sa zobrazia najnovšie údaje. Potom vyberte rozbaľovaciu ponuku vedľa hlavičky stĺpca Nové skóre a vyberte položku Zoradiť zostupne.
Údaje sú teraz zoradené podľa stĺpca New score (Nové skóre). Použitý krok môžete vybrať kdekoľvek v zozname a pokračovať v tvarovaní údajov v danom bode postupnosti. Editor Power Query automaticky vloží nový krok priamo za aktuálne vybratý použitý krok.
V časti POUŽITÉ KROKY vyberte krok pred vlastným stĺpcom ( krok Odstránené stĺpce ). Tu nahradíme hodnotu poradia Náklady na bývanie v Oregone. Kliknite pravým tlačidlom myši na príslušnú bunku, ktorá obsahuje hodnotu nákladov na bývanie v Oregone, a potom vyberte položku Nahradiť hodnoty. Všimnite si, ktorý použitý krok je aktuálne vybratý.
Vyberte položku Vložiť.
Keďže vkladáme krok, Editor Power Query nám pripomína, že následné kroky by mohli dotaz prerušiť.
Zmeňte hodnotu údajov na 100,0.
Editor Power Query nahradí údaje pre Oregon. Keď vytvoríte nový použitý krok, Editor Power Query nazvite ho na základe akcie, v tomto prípade Nahradená hodnota. Ak máte v dotaze viac ako jeden krok s rovnakým názvom, Editor Power Query k názvu každého nasledujúceho použitého kroku pripojí vyšší počet.
Vyberte posledný použitý krok: Zoradené riadky.
Všimnite si, že údaje týkajúce sa nového poradia Oregonu sa zmenili. Táto zmena nastane, pretože sme krok Nahradená hodnota vložili na správne miesto – pred krok Pridané vlastné.
Údaje sme vytvarovali v rozsahu, v akom potrebujeme. Teraz sa pripojme k inému zdroju údajov a údaje skombinujme.
Kombinovanie údajov
Zaujímavé údaje, ktoré sú o rôznych štátoch, budú užitočné pri vytváraní ďalších analýz a dotazov. Väčšina údajov o štátoch však používa dvojpísmenové skratky pre kódy štátov, nie celé názvy štátov. Kódy štátov preto potrebujeme nejakým spôsobom priradiť k ich celým názvom.
Existuje aj ďalší verejný zdroj údajov, ktorý toto priradenie umožňuje, no pred pripojením do našej tabuľky s dôchodkami ho potrebujeme trochu vytvarovať. Pri tvarovaní údajov postupujte takto:
Na páse s nástrojmi Domov v Editor Power Query vyberte položky Nový zdroj > Web.
Zadajte adresu webovej lokality so skratkami https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviationsštátov () a potom vyberte položku Pripojenie.
Navigátor zobrazí obsah webovej lokality.
Vyberte položku Kódy a skratky pre štáty USA, federálne okresy, územia a ďalšie oblasti.
Prepitné
Zparovanie údajov tejto tabuľky do požadovanej podoby bude trvať trochu tvarovania. Existuje rýchlejší alebo jednoduchší spôsob na dosiahnutie nasledujúcich krokov? Áno, mohli by sme vytvoriť vzťah medzi týmito dvoma tabuľkami a údaje tvarovať na základe tohto vzťahu. Nasledujúce kroky z nasledujúceho príkladu sú užitočné na učenie sa pri práci s tabuľkami. Vzťahy vám však môžu pomôcť rýchlo použiť údaje z viacerých tabuliek.
Ak chcete tvarovať údaje, postupujte podľa týchto krokov:
Odstráňte horný riadok. Keďže je to výsledok spôsobu vytvorenia tabuľky webovej stránky, nepotrebujeme ju. Na páse s nástrojmi Domov vyberte položky Odstrániť riadky Odstrániť najvrchnejšie > riadky.
Zobrazí sa dialógové okno Odstrániť najvrchnejšie riadky . Zadajte 1 riadok, ktorý sa má odstrániť.
Úroveň nového horného riadka na hlavičky s položkou Použiť prvý riadok ako hlavičky na karte Domov alebo na karte Transformovať na páse s nástrojmi.
Keďže tabuľka Údaje o dôchodkoch neobsahuje informácie pre Washington DC ani územia, potrebujeme ich zo zoznamu odfiltrovať. Vyberte názov a stav rozbaľovacieho zoznamu region_1 stĺpca a zrušte začiarknutie všetkých políčok okrem stĺpca Štát.
Odstráňte všetky nepotrepné stĺpce. Keďže potrebujeme len namapovať štát na jeho oficiálnu dvojpísmenovú skratku (Názov a stav oblasti a stĺpce ANSI ), ostatné stĺpce môžeme odstrániť. Najskôr vyberte stĺpec Name and status of region (Názov a stav oblasti ), potom podržte stlačený kláves CTRL a vyberte stĺpec ANSI . Na karte Domov na páse s nástrojmi vyberte položky Odstrániť stĺpce > Odstrániť ostatné stĺpce.
Poznámka
Postupnosť použitých krokov v Editor Power Query je dôležitá a ovplyvňuje spôsob tvarovania údajov. Tiež je dôležité vziať do úvahy, ako môže jeden krok ovplyvniť aj ďalší nasledujúci krok. Ak napríklad odstránite krok z použitých krokov, nasledujúce kroky sa možno nebudú správať podľa pôvodného zámeru.
Poznámka
Po zmene veľkosti okna Editor Power Query zmenšite šírku, niektoré položky pásu s nástrojmi sa zhustia, aby čo najlepšie využili viditeľný priestor. Keď rozšírite šírku okna Editor Power Query, položky na páse s nástrojmi sa rozbalia, aby čo najviac využili zväčšenú oblasť pása s nástrojmi.
Premenujte stĺpce a tabuľku. Existuje niekoľko spôsobov premenovania stĺpca: Najskôr vyberte stĺpec, potom buď na karte Transformovať na páse s nástrojmi vyberte položku Premenovať, alebo kliknite pravým tlačidlom myši a vyberte položku Premenovať. Nasledujúci obrázok zobrazuje obe možnosti, ale musíte si vybrať len jednu.
Premenujte stĺpce na State Name (Názov štátu) a State Code (Kód štátu). Ak chcete premenovať tabuľku, zadajte názovKódy štátov na table Nastavenia dotazu.
Kombinovanie dotazov
Keď sme tabuľku Kódy štátov vytvarovali podľa vizuálu, spojme tieto dve tabuľky (alebo dotazy) do jednej. Keďže tabuľky, ktoré máme teraz, sú výsledkom dotazov použitých na údaje, často sa označujú ako dotazy.
Existujú dva základné spôsoby kombinovania dotazov, a to zlučovanie a pripájanie.
- V prípade jedného alebo viacerých stĺpcov, ktoré by ste chceli pridať do iného dotazu, zlúčte dotazy.
- V prípade jedného alebo viacerých riadkov s údajmi, ktoré by ste chceli pridať do existujúceho dotazu, dotaz pripojte.
V tomto prípade chceme dotazy zlúčiť:
Na ľavej table Editor Power Query vyberte dotaz, do ktorého chcete dotazy zlúčiť. V tomto prípade sú to údaje o dôchodkoch.
Vyberte položky Zlúčiť dotazy > Zlučovacie dotazy na karte Domov na páse s nástrojmi.
Môže sa zobraziť výzva na nastavenie úrovne ochrany osobných údajov, aby sa pri skombinovaní nevložili alebo nepreniesli údaje, ktoré nechcete preniesť.
Zobrazí sa okno Zlúčiť . Vyzve vás na výber tabuľky, ktorú chcete zlúčiť do vybratej tabuľky, a zodpovedajúcich stĺpcov, ktoré sa majú pri zlúčení použiť.
V tabuľke Údaje o dôchodkoch vyberte položku Štát a potom vyberte dotaz Kódy štátov.
Po výbere zodpovedajúcich stĺpcov sa aktivuje tlačidlo OK .
Vyberte položku OK.
Editor Power Query na konci dotazu vytvorí nový stĺpec obsahujúci obsah tabuľky (dotazu) zlúčenej s existujúcim dotazom. Všetky stĺpce zo zlúčeného dotazu sú zhustené do stĺpca, ale tabuľku môžete rozbaliť a zahrnúť stĺpce, ktoré chcete.
Ak chcete rozbaliť zlúčenú tabuľku a vybrať požadované stĺpce, vyberte ikonu rozbalenia ( ).
Zobrazí sa okno Rozbaliť.
V tomto prípade chceme len stĺpec State Code (Kód štátu). Vyberte tento stĺpec, zrušte začiarknutie políčka Použiť ako predponu pôvodný názov stĺpca a potom vyberte tlačidlo OK.
Ak by sme nechali políčko Použiť ako predponu pôvodný názov stĺpca začiarknuté, zlúčený stĺpec by mal názov Kódy štátov.Kódy štátov.
Poznámka
Ak chcete preskúmať, ako pridať tabuľku Kódy štátov, môžete trochu experimentovať. Ak sa vám výsledky nepáčia, stačí daný krok odstrániť zo zoznamu POUŽITÉ KROKY na table Nastavenia dotazu a dotaz sa vráti do stavu pred použitím tohto kroku Rozbaliť. Môžete to opakovať, koľkokrát chcete, kým proces rozbalenia nebude vyzerať podľa válu.
Teraz máme jeden dotaz (tabuľku), ktorý kombinuje dva zdroje údajov, z ktorých každý bol tvarovaný podľa našich potrieb. Tento dotaz môže byť základom pre zaujímavé údajové prepojenia, ako je napríklad štatistika nákladov na bývanie, kvalita života alebo kriminalita v ľubovoľnom štáte.
Ak chcete použiť zmeny a zavrieť Editor Power Query, na karte Domov na páse s nástrojmi vyberte položku Zavrieť a použiť.
Transformovaný sémantický model sa zobrazí v aplikácii Power BI Desktop, kde ho môžete použiť na vytváranie zostáv.
Súvisiaci obsah
Ďalšie informácie o aplikácii Power BI Desktop a jej možnostiach nájdete v nasledujúcich témach: