Kurz: Tvarovanie a kombinovanie údajov v aplikácii Power BI Desktop

S aplikáciou Power BI Desktop sa môžete pripojiť k mnohým rôznym typom zdrojov údajov a potom údaje tvarovať tak, aby vyhovovali vašim potrebám. Umožní vám to vytvárať vizuálne zostavy, ktoré môžete zdieľať s ostatnými. Tvarovanie údajov označuje transformáciu údajov: premenovanie stĺpcov alebo tabuliek, premenovanie textu na čísla, odstránenie riadkov, nastavenie prvých riadkov ako hlavičiek a podobne. Kombinovanie údajov označuje prepojenie dvoch alebo viacerých zdrojov údajov, ich tvarovanie podľa potreby a ich následnú konsolidáciu do jedného dotazu.

V tomto kurze sa naučíte:

  • Tvarovať údaje pomocou Editor Power Query.
  • Pripojenie k rôznym zdrojom údajov.
  • Skombinovať tieto zdroje údajov a vytvoriť dátový model na použitie v zostavách.

Tento kurz ukazuje, ako tvarovať dotaz pomocou aplikácie Power BI Desktop, a popisuje najčastejšie úlohy. Tu ubraný dotaz je podrobnejšie popísaný, a to vrátane postupu vytvorenia dotazu úplne od začiatku, v časti Začíname s aplikáciou Power BI Desktop.

Editor Power Query v aplikácii Power BI Desktop používa ponuky, ktoré saTransformovať pás s nástrojmi. Väčšina položiek na páse s nástrojmi je k dispozícii aj po kliknutí na položku (napríklad stĺpec) pravým tlačidlom myši a výbere zo zobrazenej ponuky.

Tvarovanie údajov

Ak chcete tvarovať údaje v Editor Power Query, zadajte podrobné pokyny na Editor Power Query na úpravu údajov pri načítavaní a zobrazení údajov. Pôvodný zdroj údajov sa neovplyvní. Upravuje sa alebo tvaruje iba toto konkrétne zobrazenie údajov.

Zadané kroky, ako je napríklad premenovanie tabuľky, transformovanie typu údajov alebo odstránenie stĺpca, sa zaznamenávajú na základe Editor Power Query. Vždy, keď sa dotaz pripojí k zdroju údajov, Editor Power Query tieto kroky vykoná, aby boli údaje vždy tvarované určeným spôsobom. Tento proces sa vykoná vždy, keď použijete Editor Power Query, alebo keď ktokoľvek použije vami zdieľaný dotaz, napríklad na služba Power BI. Tieto kroky sa v príslušnom poradí zaznamenajú na table Nastavenia dotazu v časti POUŽITÉ KROKY. V tomto článku sa pozrieme na jednotlivé kroky.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Import údajov z webového zdroja. Vyberte rozbaľovací zoznam Získať údaje a potom vyberte položku Web.

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Prilepte túto URL adresu do dialógového okna Z webu a vyberte tlačidlo OK.

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. V dialógovom okne Navigátor vyberte položku Table 1a potom položku Transformovať údaje.

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Prepitné

Niektoré informácie v tabuľkách z predchádzajúcej URL adresy sa môžu príležitostne zmeniť alebo aktualizovať. V dôsledku toho možno budete musieť podľa toho upraviť výbery alebo kroky v tomto článku.

  1. Otvorí sa okno Editor Power Query. Doposiaľ použité kroky môžete zobraziť na table Nastavenia dotazu v časti POUŽITÉ KROKY.

    • Zdroj: Pripojenie na webovú lokalitu.
    • Extrahovaná tabuľka z Html: výber tabuľky.
    • Hlavičky so propagovaným úroveňou: Zmena horného riadka údajov na hlavičky stĺpcov.
    • Zmenený typ: zmena typov stĺpcov, ktoré sa importujú ako text, na odvodené typy.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Zmeňte názov tabuľky z predvoleného Table 1 nastavenia na Retirement Dataa potom stlačte kláves Enter.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. Existujúce údaje sa zoradia podľa váženého skóre, ako je to popísané na zdrojovej webovej stránke v časti Metodika. Pridajme vlastný stĺpec na výpočet iného skóre. Potom zoradíme tabuľku v tomto stĺpci, aby sme porovnali poradie vlastného skóre s existujúcim poradím.

  4. Na páse s nástrojmi Pridať stĺpec vyberte položku Vlastný stĺpec.

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. V dialógovom okne Vlastný stĺpec zadajte do poľa Názov nového stĺpca hodnotu Nové skóre. Pre vzorec vlastného stĺpca zadajte nasledujúce údaje:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Uistite sa, že hlásenie stavu obsahuje hodnotu Nezistili sa žiadne syntaktické chyby, a vyberte tlačidlo OK.

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. V Nastavenia dotazu sa v zozname POUŽITÉ KROKY teraz zobrazuje krok Pridané vlastné, ktorý sme práve definovali.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

Úprava údajov

Skôr než s týmto dotazom začneme pracovať, vykonajte niekoľko zmien na úpravu údajov:

  • Úprava poradia odstránením stĺpca.

    Predpokladajme napríklad, že pole Počasie nie je faktorom našich výsledkov. Odstránenie tohto stĺpca z dotazu nemá vplyv na ostatné údaje.

  • Opravte všetky chyby.

    Keďže sme odstránili stĺpec, musíme upraviť naše výpočty v stĺpci Nové skóre tak, že zmeníme jeho vzorec.

  • Zoradenie údajov.

    Zoraďte údaje na základe stĺpca New score (Nové skóre ) a porovnajte existujúce stĺpce Rank (Poradie ).

  • Nahradenie údajov.

    Zdôrazníme, ako nahradiť konkrétnu hodnotu a ako vložiť použitý krok.

Tieto zmeny sú popísané v nasledujúcich krokoch.

  1. Ak chcete odstrániť stĺpec Počasie , vyberte stĺpec, na páse s nástrojmi vyberte kartu Domov a potom vyberte položku Odstrániť stĺpce.

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Poznámka

    Hodnoty nového skóre sa nezmenili, čo je spôsobené poradím jednotlivých krokov. Editor Power Query zaznamenáva kroky v príslušnom poradí, no zároveň vzájomne nezávisle. Ak chcete použiť akcie v inom poradí, každý použitý krok môžete posúvať nahor alebo nadol.

  2. Kliknutím pravým tlačidlom myši na krok zobrazíte jeho kontextovú ponuku.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Posuňte posledný krok Odstránené stĺpce hneď nad krok Pridané vlastné .

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Vyberte krok Pridané vlastné.

    Všimnite si, že v stĺpci Nové skóre sa teraz namiesto vypočítanej hodnoty zobrazuje chyba .

    Screenshot of Power Query Editor and the New score column containing Error values.

    Existuje niekoľko spôsobov, ako získať ďalšie informácie o jednotlivých chybách. Ak vyberiete bunku bez kliknutia na slovo Chyba, Editor Power Query zobrazí informácie o chybe.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Ak vyberiete slovo Chyba, Editor Power Query vytvorí použitý krok na table Nastavenia dotazu a zobrazí informácie o danej chybe. Keďže informácie o chybách nepotrebujeme zobraziť nikde inde, vyberte položku Zrušiť.

  5. Na opravu chýb sú potrebné dve zmeny, pričom sa odstráni názov stĺpca Weather (Počasie ) a rozdelí deliteľ z 8 na 7. Tieto zmeny môžete vykonať dvoma spôsobmi:

    1. Kliknite pravým tlačidlom myši na krok Vlastný stĺpec a vyberte položku Upraviť Nastavenia. Zobrazí sa dialógové okno Vlastný stĺpec, ktoré ste použili na vytvorenie stĺpca Nové skóre . Upravte vzorec tak, ako bol popísaný vyššie, kým nebude vyzerať takto:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Vyberte stĺpec Nové skóre a potom zobrazte vzorec údajov stĺpca začiarknutím políčka Riadok vzorcov na karte Zobraziť.

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Upravte vzorec tak, ako bol opísaný vyššie, kým nevyzerá takto, potom stlačte kláves Enter.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    Editor Power Query nahradí údaje revidovanými hodnotami a aby Pridaný vlastný krok sa dokončí bez chýb.

    Poznámka

    Pomocou pásu s nástrojmi alebo ponuky zobrazenej kliknutím pravým tlačidlom myši môžete tiež vybrať položku Odstrániť chyby. Odstránia sa tým všetky riadky obsahujúce chyby. V tomto kurze však chceme zachovať všetky údaje v tabuľke.

  6. Zoraďte údaje na základe stĺpca Nové skóre . Najprv vyberte posledný použitý krok Pridané vlastné, čím sa zobrazia najnovšie údaje. Potom vyberte rozbaľovaciu ponuku vedľa hlavičky stĺpca Nové skóre a vyberte položku Zoradiť zostupne.

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    Údaje sú teraz zoradené podľa stĺpca New score (Nové skóre). Použitý krok môžete vybrať kdekoľvek v zozname a pokračovať v tvarovaní údajov v danom bode postupnosti. Editor Power Query automaticky vloží nový krok priamo za aktuálne vybratý použitý krok.

  7. V časti POUŽITÉ KROKY vyberte krok pred vlastným stĺpcom ( krok Odstránené stĺpce ). Tu nahradíme hodnotu poradia Náklady na bývanie v Oregone. Kliknite pravým tlačidlom myši na príslušnú bunku, ktorá obsahuje hodnotu nákladov na bývanie v Oregone, a potom vyberte položku Nahradiť hodnoty. Všimnite si, ktorý použitý krok je aktuálne vybratý.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Vyberte položku Vložiť.

    Keďže vkladáme krok, Editor Power Query nám pripomína, že následné kroky by mohli dotaz prerušiť.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Zmeňte hodnotu údajov na 100,0.

    Editor Power Query nahradí údaje pre Oregon. Keď vytvoríte nový použitý krok, Editor Power Query nazvite ho na základe akcie, v tomto prípade Nahradená hodnota. Ak máte v dotaze viac ako jeden krok s rovnakým názvom, Editor Power Query k názvu každého nasledujúceho použitého kroku pripojí vyšší počet.

  10. Vyberte posledný použitý krok: Zoradené riadky.

    Všimnite si, že údaje týkajúce sa nového poradia Oregonu sa zmenili. Táto zmena nastane, pretože sme krok Nahradená hodnota vložili na správne miesto – pred krok Pridané vlastné.

    Údaje sme vytvarovali v rozsahu, v akom potrebujeme. Teraz sa pripojme k inému zdroju údajov a údaje skombinujme.

Kombinovanie údajov

Zaujímavé údaje, ktoré sú o rôznych štátoch, budú užitočné pri vytváraní ďalších analýz a dotazov. Väčšina údajov o štátoch však používa dvojpísmenové skratky pre kódy štátov, nie celé názvy štátov. Kódy štátov preto potrebujeme nejakým spôsobom priradiť k ich celým názvom.

Existuje aj ďalší verejný zdroj údajov, ktorý toto priradenie umožňuje, no pred pripojením do našej tabuľky s dôchodkami ho potrebujeme trochu vytvarovať. Pri tvarovaní údajov postupujte takto:

  1. Na páse s nástrojmi Domov v Editor Power Query vyberte položky Nový zdroj > Web.

  2. Zadajte adresu webovej lokality so skratkami https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviationsštátov () a potom vyberte položku Pripojenie.

    Navigátor zobrazí obsah webovej lokality.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Vyberte položku Kódy a skratky pre štáty USA, federálne okresy, územia a ďalšie oblasti.

    Prepitné

    Zparovanie údajov tejto tabuľky do požadovanej podoby bude trvať trochu tvarovania. Existuje rýchlejší alebo jednoduchší spôsob na dosiahnutie nasledujúcich krokov? Áno, mohli by sme vytvoriť vzťah medzi týmito dvoma tabuľkami a údaje tvarovať na základe tohto vzťahu. Nasledujúce kroky z nasledujúceho príkladu sú užitočné na učenie sa pri práci s tabuľkami. Vzťahy vám však môžu pomôcť rýchlo použiť údaje z viacerých tabuliek.

Ak chcete tvarovať údaje, postupujte podľa týchto krokov:

  1. Odstráňte horný riadok. Keďže je to výsledok spôsobu vytvorenia tabuľky webovej stránky, nepotrebujeme ju. Na páse s nástrojmi Domov vyberte položky Odstrániť riadky Odstrániť najvrchnejšie > riadky.

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    Zobrazí sa dialógové okno Odstrániť najvrchnejšie riadky . Zadajte 1 riadok, ktorý sa má odstrániť.

  2. Úroveň nového horného riadka na hlavičky s položkou Použiť prvý riadok ako hlavičky na karte Domov alebo na karte Transformovať na páse s nástrojmi.

  3. Keďže tabuľka Údaje o dôchodkoch neobsahuje informácie pre Washington DC ani územia, potrebujeme ich zo zoznamu odfiltrovať. Vyberte názov a stav rozbaľovacieho zoznamu region_1 stĺpca a zrušte začiarknutie všetkých políčok okrem stĺpca Štát.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Odstráňte všetky nepotrepné stĺpce. Keďže potrebujeme len namapovať štát na jeho oficiálnu dvojpísmenovú skratku (Názov a stav oblasti a stĺpce ANSI ), ostatné stĺpce môžeme odstrániť. Najskôr vyberte stĺpec Name and status of region (Názov a stav oblasti ), potom podržte stlačený kláves CTRL a vyberte stĺpec ANSI . Na karte Domov na páse s nástrojmi vyberte položky Odstrániť stĺpce > Odstrániť ostatné stĺpce.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Poznámka

    Postupnosť použitých krokov v Editor Power Query je dôležitá a ovplyvňuje spôsob tvarovania údajov. Tiež je dôležité vziať do úvahy, ako môže jeden krok ovplyvniť aj ďalší nasledujúci krok. Ak napríklad odstránite krok z použitých krokov, nasledujúce kroky sa možno nebudú správať podľa pôvodného zámeru.

    Poznámka

    Po zmene veľkosti okna Editor Power Query zmenšite šírku, niektoré položky pásu s nástrojmi sa zhustia, aby čo najlepšie využili viditeľný priestor. Keď rozšírite šírku okna Editor Power Query, položky na páse s nástrojmi sa rozbalia, aby čo najviac využili zväčšenú oblasť pása s nástrojmi.

  5. Premenujte stĺpce a tabuľku. Existuje niekoľko spôsobov premenovania stĺpca: Najskôr vyberte stĺpec, potom buď na karte Transformovať na páse s nástrojmi vyberte položku Premenovať, alebo kliknite pravým tlačidlom myši a vyberte položku Premenovať. Nasledujúci obrázok zobrazuje obe možnosti, ale musíte si vybrať len jednu.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Premenujte stĺpce na State Name (Názov štátu) a State Code (Kód štátu). Ak chcete premenovať tabuľku, zadajte názovKódy štátov na table Nastavenia dotazu.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Kombinovanie dotazov

Keď sme tabuľku Kódy štátov vytvarovali podľa vizuálu, spojme tieto dve tabuľky (alebo dotazy) do jednej. Keďže tabuľky, ktoré máme teraz, sú výsledkom dotazov použitých na údaje, často sa označujú ako dotazy.

Existujú dva základné spôsoby kombinovania dotazov, a to zlučovanie a pripájanie.

  • V prípade jedného alebo viacerých stĺpcov, ktoré by ste chceli pridať do iného dotazu, zlúčte dotazy.
  • V prípade jedného alebo viacerých riadkov s údajmi, ktoré by ste chceli pridať do existujúceho dotazu, dotaz pripojte.

V tomto prípade chceme dotazy zlúčiť:

  1. Na ľavej table Editor Power Query vyberte dotaz, do ktorého chcete dotazy zlúčiť. V tomto prípade sú to údaje o dôchodkoch.

  2. Vyberte položky Zlúčiť dotazy > Zlučovacie dotazy na karte Domov na páse s nástrojmi.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Môže sa zobraziť výzva na nastavenie úrovne ochrany osobných údajov, aby sa pri skombinovaní nevložili alebo nepreniesli údaje, ktoré nechcete preniesť.

    Zobrazí sa okno Zlúčiť . Vyzve vás na výber tabuľky, ktorú chcete zlúčiť do vybratej tabuľky, a zodpovedajúcich stĺpcov, ktoré sa majú pri zlúčení použiť.

  3. V tabuľke Údaje o dôchodkoch vyberte položku Štát a potom vyberte dotaz Kódy štátov.

    Po výbere zodpovedajúcich stĺpcov sa aktivuje tlačidlo OK .

    Screenshot of Power Query Editor's Merge dialog.

  4. Vyberte položku OK.

    Editor Power Query na konci dotazu vytvorí nový stĺpec obsahujúci obsah tabuľky (dotazu) zlúčenej s existujúcim dotazom. Všetky stĺpce zo zlúčeného dotazu sú zhustené do stĺpca, ale tabuľku môžete rozbaliť a zahrnúť stĺpce, ktoré chcete.

  5. Ak chcete rozbaliť zlúčenú tabuľku a vybrať požadované stĺpce, vyberte ikonu rozbalenia ( ).

    Zobrazí sa okno Rozbaliť.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. V tomto prípade chceme len stĺpec State Code (Kód štátu). Vyberte tento stĺpec, zrušte začiarknutie políčka Použiť ako predponu pôvodný názov stĺpca a potom vyberte tlačidlo OK.

    Ak by sme nechali políčko Použiť ako predponu pôvodný názov stĺpca začiarknuté, zlúčený stĺpec by mal názov Kódy štátov.Kódy štátov.

    Poznámka

    Ak chcete preskúmať, ako pridať tabuľku Kódy štátov, môžete trochu experimentovať. Ak sa vám výsledky nepáčia, stačí daný krok odstrániť zo zoznamu POUŽITÉ KROKY na table Nastavenia dotazu a dotaz sa vráti do stavu pred použitím tohto kroku Rozbaliť. Môžete to opakovať, koľkokrát chcete, kým proces rozbalenia nebude vyzerať podľa válu.

    Teraz máme jeden dotaz (tabuľku), ktorý kombinuje dva zdroje údajov, z ktorých každý bol tvarovaný podľa našich potrieb. Tento dotaz môže byť základom pre zaujímavé údajové prepojenia, ako je napríklad štatistika nákladov na bývanie, kvalita života alebo kriminalita v ľubovoľnom štáte.

  7. Ak chcete použiť zmeny a zavrieť Editor Power Query, na karte Domov na páse s nástrojmi vyberte položku Zavrieť a použiť.

    Transformovaný sémantický model sa zobrazí v aplikácii Power BI Desktop, kde ho môžete použiť na vytváranie zostáv.

    Screenshot of Power Query Editor's Close & Apply button.

Ďalšie informácie o aplikácii Power BI Desktop a jej možnostiach nájdete v nasledujúcich témach: