Používanie nástrojov na profilovanie údajov

Nástroje na profilovanie údajov poskytujú nové a intuitívne spôsoby vyčistenia, transformácie a pochopenia údajov v Power Query Editore. Sú to tieto:

  • Kvalita stĺpcov

  • Distribúcia stĺpcov

  • Profil stĺpca

Ak chcete povoliť nástroje profilovania údajov, prejdite na kartu Zobrazenie na páse s nástrojmi. V skupine Ukážka údajov zapnite požadované možnosti, ako je to znázornené na nasledujúcom obrázku.

Nástroje na profilovanie údajov.

Po zapnutí možností sa v editore údajov zobrazí niečo ako na nasledujúcom Power Query editore.

Povolené nástroje na profilovanie údajov.

Poznámka

Predvolene sa Power Query profilovanie údajov cez prvých 1 000 riadkov vašich údajov. Ak chcete s celou množinou údajov pracovať, pozrite si ľavý dolný roh okna editora a zmeňte spôsob profilovania stĺpcov.

Kvalita stĺpcov

Funkcia kvality stĺpcov označení hodnôt v riadkoch v troch kategóriách:

  • Valid, zobrazené zelenou farbou

  • Chyba, zobrazená červenou farbou

  • Prázdne, zobrazené v tmavosivej farbe

Tieto indikátory sa zobrazujú priamo pod názvom stĺpca ako súčasť malého pruhového grafu, ako je to znázornené na nasledujúcom obrázku.

Vylepšené zobrazenie pruhového grafu s indikátormi kvality údajov a označeniami nad každým stĺpcom v tabuľke.

Počet záznamov v jednotlivých kategórii kvality stĺpcov sa zobrazí aj ako percentuálna hodnota.

Po kurzore nad ktorýmkoľvek stĺpcom sa prezentuje číselná distribúcia kvality hodnôt v celom stĺpci. Okrem toho výberom tlačidla s tri bodky (...) sa otvoria niektoré tlačidlá rýchleho akcie na operácie s hodnotami.

Distribúcia stĺpca názvov s platnými názvami so 701 názvami (100 percent), nulové chyby a nula prázdnych s zobrazenými príkazmi rýchleho akcie.

Distribúcia stĺpcov

Táto funkcia poskytuje množinu vizuálov pod názvami stĺpcov, ktoré prezentú frekvenciu a distribúciu hodnôt v každom zo stĺpcov. Údaje v týchto vizualizáciách sú zoradené v zostupnom poradí od hodnoty s najvyššou frekvenciou.

Distribúcia stĺpcov.

Po ukážovaní na distribučné údaje v ľubovoľnom stĺpci získate informácie o celkových údajoch v stĺpci (s jedinečnými hodnotami a odlišnými hodnotami). Môžete tiež vybrať tlačidlo s tri bodky a vybrať si z ponuky dostupných operácií.

Možnosti distribúcie stĺpcov.

Profil stĺpca

Táto funkcia poskytuje podrobneejší pohľad na údaje v stĺpci. Okrem stĺpcového distribučného grafu obsahuje aj stĺpcový štatistický graf. Tieto informácie sa zobrazia pod časťou s ukážkou údajov, ako je to znázornené na nasledujúcom obrázku.

Profil stĺpca.

Filtrovať podľa hodnoty

S grafom distribúcie hodnôt na pravej strane môžete interagovať a výberom pruhov môžete po kurzore myši na jednotlivé časti grafu.

Podržte ukazovateľ myši nad pruhom v pruhovom grafe distribúcie hodnôt, ktorý zobrazuje jednotlivé údaje pre tento pruh.

Kliknutím pravým tlačidlom myši zobrazíte množinu dostupných transformácií pre túto hodnotu.

Zobrazí kontextovú ponuku s dostupnými prepismi pre jeden pruh v pruhovom grafe distribúcie hodnôt.

Kopírovanie údajov

V pravom hornom rohu sekcií štatistika stĺpcov aj distribúcia hodnôt môžete vybrať tlačidlo tri bodky (...), aby ste si mohli zobraziť ponuku Kopírovať odkaz. Vyberte ho a skopírujte údaje zobrazené v oboch sekcií do Schránky.

Skopírujte štatistiky stĺpcov.

Zoskupiť podľa hodnoty

Po výbere tlačidla tri bodky (...) v pravom hornom rohu grafu distribúcie hodnoty okrem možnosti Kopírovať môžete vybrať možnosť Zoskupiť podľa. Táto funkcia zoskupí hodnoty v grafe podľa množiny dostupných možností.

Zoskupiť podľa distribúcie hodnôt.

Na obrázku nižšie je znázornený stĺpec názvov produktov, ktoré boli zoskupené podľa dĺžky textu. Po zoskupení hodnôt v grafe môžete pracovať s jednotlivými hodnotami v grafe tak, ako je to popísané v časti Filtrovanie podľa hodnoty.

Nový pruhový graf zobrazujúci distribúciu textovej dĺžky názvov predají v stĺpci Names (Názvy) tabuľky.