Cvičenie – príprava údajov v aplikácii Power BI Desktop
Získanie prístupu k prostrediu
Skôr než začnete toto cvičenie (ak nepokračujete z predchádzajúceho cvičenia), vyberte položku Spustiť cvičenie vyššie.
Do cvičného prostredia ste automaticky prihlásení ako používatelia s údajmi– ai\študentmi.
Teraz môžete začať s týmto cvičením pracovať.
Tip
Ak chcete cvičenie ukotviť, aby sa vyplnil okno, vyberte v hornej časti ikonu PC a potom vyberte položku Prispôsobiť okno do počítača.
Odhadovaný čas na absolvovanie cvičenia je 45 minút.
V tomto cvičení začnete vyvíjať riešenie v aplikácii Power BI Desktop pre spoločnosť Adventure Works. Dozviete sa v ňom, ako sa pripojiť k zdrojovým údajom, zobraziť ukážku údajov a ako sa pomocou techník ukážky údajov oboznámiť s vlastnosťami a kvalitou zdrojových údajov.
Čo sa naučíte v tomto cvičení:
otvoriť Power BI Desktop,
nastaviť možnosti aplikácie Power BI Desktop,
pripojiť sa k zdrojovým údajom,
zobraziť ukážku zdrojových údajov,
použiť techniky ukážky údajov na lepšie pochopenie údajov.
Cvičný príbeh
Toto cvičenie je jedným z mnohých zo série cvičení, ktoré boli navrhnuté ako kompletný príbeh od prípravy údajov až po publikovanie ako zostavy a tabule. Cvičenia môžete dokončiť v ľubovoľnom poradí. Ak však máte v úmysle pracovať prostredníctvom viacerých cvičení, odporúčame vám ich vykonať v tomto poradí:
Pripravte údaje v Power BI Desktop << ste tu. Toto je cvičenie aktuálneho modulu.
Poznámka
Každé cvičenie začína súborom PBIX, ktorý obsahuje dokončené všetky predchádzajúce cvičenia. Ak by ste mali z akéhokoľvek dôvodu prísť o prácu, môžete otvoriť súbor PBIX, ktorý obsahuje pokrok do tohto bodu z priečinka uvedeného na začiatku ďalšieho cvičenia.
Cvičenie č. 1: Príprava údajov
V tomto cvičení vytvoríte osem Power BI Desktop dotazov. Šesť dotazov získa údaje z SQL Servera a dva zo súborov CSV.
Úloha 1: Uloženie súboru Power BI Desktop
V tejto úlohe najprv uložíte súbor aplikácie Power BI Desktop.
Ak chcete otvoriť Power BI Desktop, na paneli úloh vyberte odkaz Microsoft Power BI Desktop.
Ak chcete zavrieť okno Začíname, v ľavom hornom rohu okna vyberte položku X.
Ak chcete súbor uložiť, vyberte kartu Súbor na páse s nástrojmi a otvorte zobrazenie Backstage.
Vyberte položku Uložiť.
V okne Uložiť ako prejdite do priečinka D:\DA100\MySolution .
Do poľa Názov súboru zadajte názov Analýza predaja.
Vyberte položku Uložiť.
Tip
Súbor môžete uložiť aj výberom ikony Uložiť , ktorá sa nachádza v ľavom hornom rohu.
Úloha 2: Nastavenie možností Power BI Desktop
V tejto úlohe nastavíte možnosti aplikácie Power BI Desktop.
V Power BI Desktop vyberte kartu Súbor na páse s nástrojmi a otvorte zobrazenie Backstage.
Na ľavej strane vyberte položku Možnosti a nastavenia a potom vyberte položku Možnosti.
V okne Možnosti na ľavej strane vyberte v skupine Aktuálny súbor položku Načítavanie údajov.
V časti Načítavanie údajov pre aktuálny súbor môžete nastaviť možnosti, ktoré určujú predvolené správanie pri modelovaní.
V skupine Vzťahy zrušte začiarknuté dve vybraté možnosti.
Tieto dve možnosti môžu byť užitočné pri vývoji dátového modelu, na účely tohto cvičenia sú však vypnuté. Pri vytváraní vzťahov v cvičení Lab 03A sa dozviete, prečo pridávate jednotlivé vzťahy.
Vyberte položku OK.
Uložte súbor aplikácie Power BI Desktop.
Úloha 3: Získanie údajov z SQL Server
V tejto úlohe vytvoríte dotazy na základe tabuliek SQL Servera.
Na karte Domov na páse s nástrojmi v skupine Údaje vyberte položku SQL Server.
V okne Databáza SQL Servera zadajte do poľa Server názov localhost.
V rámci cvičení sa pripojíte k databáze SQL Servera s použitím názvu localhost. Takýto postup sa však neodporúča pri vytváraní vlastných riešení. Dôvodom je, že zdroje údajov brány nemôžu rozpoznať názov localhost.
Vyberte položku OK.
Všimnite si, že overenie je predvolene nastavené na možnosť Použiť aktuálne poverenia.
Vyberte možnosť Pripojiť.
Po zobrazení výzvy týkajúcej sa podpory šifrovania vyberte položku OK.
V okne Navigátor na ľavej strane rozbaľte databázu AdventureWorksDW2020.
Databáza AdventureWorksDW2020 je založená na vzorovej databáze AdventureWorksDW2017. Bola upravená tak, aby podporovala vzdelávacie ciele cvičení kurzu.
Vyberte tabuľku DimEmployee, ale nezačiarknite ju.
Na pravej table si všimnite ukážku tabuľky.
Ukážka vám umožňuje určiť stĺpce a ukážku riadkov.
Ak chcete vytvoriť dotazy, vyberte nasledujúcich šesť tabuliek:
- DimEmployee
- DimEmployeeSalesTerritory
- DimProduct
- DimReseller
- DimSalesTerritory
- FactResellerSales
Ak chcete použiť transformácie na údaje vybratých tabuliek, vyberte položku Transformovať údaje.
V tomto cvičení nebudete transformovať údaje. Cieľom tohto cvičenia je preskúmať a profilovať údaje v okne Editora Power Query.
Úloha č. 4: Ukážka SQL Server dotazov
V tejto úlohe zobrazíte ukážku údajov dotazov SQL Servera. Najprv zistíte relevantné informácie o údajoch. Použijete tiež nástroje kvality stĺpcov, distribúcie stĺpcov a profilu stĺpca na pochopenie údajov a vyhodnotenie ich kvality.
V okne Editora Power Query si na ľavej strane všimnite tablu Dotazy.
Tabla Dotazy obsahuje jeden dotaz na každú vybratú tabuľku.
Vyberte prvý dotaz DimEmployee.
Tabuľka DimEmployee obsahuje jeden riadok na každého zamestnanca. Podmnožina riadkov predstavuje predajcov, ktorý budú dôležití pre model, ktorý vytvoríte.
V ľavom dolnom rohu v stavovom riadku si všimnite štatistiku tabuľky – tabuľka obsahuje 33 stĺpcov a 296 riadkov.
Na table s ukážkou údajov sa posúvajte vodorovne a skontrolujte všetky stĺpce.
Všimnite si, že posledných päť stĺpcov obsahuje prepojenia Tabuľka alebo Hodnota.
Týchto päť stĺpcov predstavuje vzťahy s inými tabuľkami v databáze. Môžu sa použiť na spájanie tabuliek. Spájať tabuľky budete v cvičení Lab 03A.
Vyhodnoťte kvalitu stĺpcov tak, že na karte Zobrazenie na páse s nástrojmi v skupine Ukážka údajov vyberiete položku Kvalita stĺpcov.
Nástroj Kvalita stĺpcov vám umožňuje ľahko zistiť percento platných, chybných alebo prázdnych hodnôt.
V stĺpci Position (šiesty stĺpec od konca) si všimnite, že 94 % riadkov je prázdnych (null).
Vyhodnoťte distribúciu stĺpcov tak, že na karte Zobrazenie na páse s nástrojmi v skupine Ukážka údajov vyberiete možnosť Distribúcia stĺpcov.
Znova skontrolujte stĺpec Position a všimnite si, že existujú štyri odlišné hodnoty a jedna jedinečná hodnota.
Skontrolujte distribúciu stĺpcov pre (prvý) stĺpec EmployeeKey – existuje 296 jedinečných hodnôt a 296 jedinečných hodnôt.
Keď sú počty odlišných a jedinečných hodnôt rovnaké, znamená to, že stĺpec obsahuje jedinečné hodnoty. Pri modelovaní je dôležité, že niektoré tabuľky obsahujú jedinečné stĺpce. Tieto jedinečné stĺpce môžete použiť na vytvorenie vzťahov typu one-to-many, ktoré budete robiť v údajoch modelu v Power BI Desktop, 1. časti cvičenia.
Na table Dotazy vyberte dotaz DimEmployeeSalesTerritory (DimOblasťPredajaZamestnanca).
Tabuľka DimEmployeeSalesTerritory obsahuje jeden riadok na každého zamestnanca a oblasti území predaja, ktoré zamestnanci spravujú. Tabuľka podporuje vytvorenie vzťahu jedného zamestnanca s mnohými oblasťami. Niektorí zamestnanci spravujú jednu a niektorí dve alebo aj viac oblastí. Pri modelovaní týchto údajov budete musieť definovať vzťah typu many-to-many, ktorý budete robiť v modelových údajoch v cvičení Power BI Desktop 2. časti.
Na table Dotazy vyberte dotaz DimProduct.
Tabuľka DimProduct obsahuje jeden riadok na každý produkt, ktorý spoločnosť predáva.
Posuňte sa vodorovne, aby sa zobrazili posledné stĺpce.
Všimnite si stĺpec DimProductSubcategory.
Keď do tohto dotazu pridáte transformácie v cvičení Načítať údaje v Power BI Desktop, stĺpec DimProductSubcategory použijete na spojenie tabuliek.
Na table Dotazy vyberte dotaz DimReseller.
Tabuľka DimReseller obsahuje jeden riadok na každého predajcu. Predajcovia predávajú produkty spoločnosti Adventure Works, distribuujú ich alebo ich pridávajú.
Ak chcete zobraziť hodnoty stĺpcov, na karte Zobrazenie na páse s nástrojmi v skupine Ukážka údajov vyberte položku Profil stĺpca.
Vyberte hlavičku stĺpca BusinessType.
Všimnite si, že pod tablou ukážky údajov sa otvorí nová tabla.
Skontrolujte štatistiku stĺpcov a distribúciu hodnôt.
Všimnite si problém s kvalitou údajov: existujú dve označenia pre sklad (Warehouse a nesprávne napísané označenie Ware House).
Ukážte kurzorom na pruh Ware House a všimnite si, že existuje päť riadkov s touto hodnotou.
Transformáciu použijete na opätovné označenie týchto piatich riadkov v časti Načítanie údajov v cvičení Power BI Desktop.
Na table Dotazy vyberte dotaz DimSalesTerritory.
Tabuľka DimSalesTerritory obsahuje jeden riadok na každú oblasť predaja vrátane oblasti Corporate HQ (sídlo). Oblasti sú priradené ku krajine a krajiny sú priradené k skupinám. V cvičení Údaje modelu v Power BI Desktop, 1. časť, vytvoríte hierarchiu na podporu analýzy na úrovni oblasti, krajiny alebo skupiny.
Na table Dotazy vyberte dotaz FactResellerSales.
Tabuľka FactResellerSales obsahuje jeden riadok na každý riadok predajnej objednávky – predajná objednávka obsahuje jednu alebo viac riadkových položiek.
Skontrolujte kvalitu stĺpca TotalProductCost a všimnite si, že 8 % riadkov je prázdnych.
Chýbajúce hodnoty stĺpca TotalProductCost predstavujú problém s kvalitou údajov. Ak chcete vyriešiť problém v cvičení Načítať údaje v službe Power BI Desktop, použijete transformácie na vyplnenie chýbajúcich hodnôt pomocou štandardnej ceny produktu, ktorá je uložená v tabuľke DimProduct.
Úloha 5: Získanie údajov zo súboru CSV
V tejto úlohe vytvoríte dotaz založený na súbore CSV.
Ak chcete pridať nový dotaz, v okne Editor Power Query na karte Domov na páse s nástrojmi v skupine Nový dotaz vyberte šípku nadol v položke Nový zdroj a potom vyberte položku Text/CSV.
V okne Otvoriť prejdite do priečinka D:\DA100\Resources a vyberte súborResellerSalesTargets.csv .
Vyberte položku Otvoriť.
V okne ResellerSalesTargets.csv skontrolujte ukážku údajov.
Vyberte položku OK.
Všimnite si, že na tablu Dotazy sa pridal dotaz ResellerSalesTargets.
Súbor CSV ResellerSalesTargets obsahuje jeden riadok na každého predajcu na každý rok. Každý riadok obsahuje 12 záznamov s cieľmi mesačného predaja (vyjadrenými v tisícoch). Obchodný rok pre spoločnosť Adventure Works sa začína na 1. júla.
Všimnite si, že žiadne stĺpce neobsahujú prázdne hodnoty. V prípadoch, kde nie je stanovený cieľ mesačného predaja, je namiesto prázdnej hodnoty uložený znak spojovníka.
Skontrolujte ikony v jednotlivých hlavičkách stĺpcov naľavo od názvu stĺpca.
Ikony predstavujú typ údajov stĺpca. 123 je celé číslo a ABC je text.
Na dosiahnutie iného tvarovaného výsledku, ktorý pozostáva len z troch stĺpcov, použijete mnohé transformácie: Dátum, KódZamestnanca a TargetAmount v cvičení Načítať údaje v cvičení Power BI Desktop.
Úloha 6: Získanie ďalších údajov zo súboru CSV
V tejto úlohe vytvoríte ďalší dotaz na základe iného súboru CSV.
Pomocou krokov v predchádzajúcej úlohe vytvorte dotaz založený na súboreD:\DA100\Resources\ColorFormats.csv .
Súbor CSV ColorFormats obsahuje jeden riadok na každú farbu produktu. Každý riadok obsahuje záznam so šestnástkovými kódmi na formátovanie pozadia a farby písma. Tieto údaje integrujete s údajmi dotazu DimProduct do poľa Načítať údaje v cvičení Power BI Desktop.
Úloha 7: Dokončenie
V tejto úlohe dokončíte cvičenie.
Na karte Zobrazenie na páse s nástrojmi v skupine Ukážka údajov zrušte začiarknutie troch možností ukážky údajov:
- Kvalita stĺpcov
- Distribúcia stĺpcov
- Profil stĺpca
Uložte súbor aplikácie Power BI Desktop výberom položky Uložiť v zobrazení Backstage Súbor.
Po zobrazení výzvy na použitie dotazov vyberte položku Použiť neskôr.
Použitím dotazov sa načítajú ich údaje do dátového modelu. To ešte nie ste pripravení urobiť, pretože najprv treba použiť mnohé transformácie.
Ak plánujete spustiť ďalšie cvičenie, môžete sa rozhodnúť ponechať Power BI Desktop otvorenú.
Upozornenie
Ak cvičenie necháte otvorené, časový rozsah uplynie po jednej až štyroch hodinách. Vaša práca v cvičení aktuálneho modulu sa stratí, ale každé cvičenie po prvom obsahuje súbor PBIX s prácou z všetkých predchádzajúcich cvičení, aby ste nemuseli začínať odznova.
Na dotazy použijete rôzne transformácie a potom ich pomocou dotazov načítate do dátového modelu v cvičení Načítať údaje v službe Power BI Desktop.
Potrebujete pomoc? Pozrite si nášho sprievodcu riešením problémov alebo odošlite konkrétne pripomienky nahlásením problému.





























