Rensa och transformera data med Power Query-redigeraren

Slutförd

Nu när vi har anslutit till en datakälla med Microsoft Power BI Desktop måste vi justera data efter våra behov. Ibland betyder justering att transformera data genom att till exempel byta namn på kolumner eller tabeller, ändra text till siffror, ta bort rader eller ange första raden som rubrik.

Power Query-redigeraren i Power BI Desktop använder snabbmenyer i stor utsträckning (även kallat högerklicka eller kontextmenyer), förutom att uppgifter finns tillgängliga i menyfliksområdet. Det mesta av det du kan välja på fliken Transformera i menyfliksområdet finns också tillgängligt genom att högerklicka på ett objekt (t.ex. en kolumn) och sedan välja ett kommando på snabbmenyn som visas.

Forma data

När du formar data i Power Query -redigeraren, anger du stegvisa instruktioner som Power Query-redigeraren utför för att justera data då den läser in och visa dem. Den ursprungliga datakällan påverkas inte. Endast den här specifika vyn av data justeras eller formas.

De steg som du anger (till exempel byta namn på en tabell, transformerar datatypen eller ta bort kolumner) registreras av Power Query-redigeraren. De här stegen utförs sedan varje gång frågan ansluter till datakällan, så att data alltid utformas på det sätt som du anger. Den här processen sker varje gång du använder frågan i Power BI Desktop, eller när någon annan använder din delade fråga, (till exempel i Power BI-tjänsten). Stegen registreras sekventiellt under Använda steg i fönstret Power Query-inställningar.

Följande bild visar fönstret Frågeinställningar för en fråga som har formats. Vi ska gå igenom varje steg i nästkommande stycken.

Frågeinställningar

Vi går tillbaka till våra pensionsdata, som vi hittade genom att ansluta till en webbdatakälla, och formar dessa data efter våra behov.

Anteckning

Gå till den föregående enhetens sida om du inte har laddat ned exempeldatamängden.

Vi behöver data som siffror. De ser helt OK ut i det här fallet, men om du skulle behöva ändra datatypen, så är det bara att högerklicka på kolumnrubriken och sedan välja Ändra typ> Heltal. Om du måste ändra mer än en kolumn, så markera en av dem och håll sedan ned Skift-tangenten medan du markerar fler intilliggande kolumner. Högerklicka på en kolumnrubrik för att ändra de markerade kolumnerna. Du kan även använda CTRL-tangenten om du vill markera kolumner som inte är intilliggande.

Ändrad typ av tillämpat steg

Anteckning

Ofta identifierar Power Query att en kolumn med texten bör vara siffror och kommer automatiskt att ändra datatypen när den för över tabellen till Power Query-redigeraren. I det här fallet identifieras vad Power Query gjorde för dig i ett steg under Tillämpade steg.

Du kan även ändra, eller transformera, dessa kolumner från text till rubrik via fliken Transformera i menyfliksområdet. Följande bild visar fliken Transformera . Den röda rutan markerar knappen Datatyp , där du kan transformera den aktuella datatypen till en annan.

Menyfliksområdet Transformera och knappen Datatyp

Observera att listan Tillämpade steg i Frågeinställningar återspeglar alla ändringar som gjorts. Om du vill ta bort något steg från formningsprocessen, markerar du det och välj sedan X till vänster om det.

Fönstret Frågeinställningar

Ansluta till data

Data om olika delstater är intressanta, och är användbara för att skapa ytterligare analyser och frågor. Men det finns ett problem: de flesta tillgängliga data använder förkortningar på två bokstäver för delstatskoder, inte fullständiga namn på delstater. Vi behöver därför ett sätt att associera delstatsnamn med deras förkortningar.

Vi har tur: det finns en annan offentlig datakälla som gör precis det, men det krävs ganska mycket formning innan vi kan ansluta den till vår pensionstabell. Här är webbresursen för delstatsförkortningar:

http://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations

I Power Query-redigeraren, på fliken Start i menyfliksområdet, väljer du Ny källa > Web. Sedan anger du adressen och väljer OK. Fönstret Navigator visar vad det fann på denna webbsida.

Förkortningar för delstater i USA från webbplats

Välj tabellen Koder och förkortningar... eftersom den visar de data vi vill ha, även om det krävs ganska mycket formningsarbete för att skära ned dessa data.

Välj Läs in för att föra in data i Power Query-redigeraren så att vi kan forma dem. Följ sedan de här stegen:

  • Tar bort den tre översta raderna – dessa rader är ett resultat av metoden som användes för att skapa den webbsidans tabell, och vi behöver dem inte. Du tar bort dem genom att välja Ta bort rader > Ta bort de översta raderna, på fliken Start i menyfliksområdet. I dialogrutan som visas anger du 3 som antalet rader att ta bort.

    Ta bort de översta raderna

  • Ta bort de nedersta 26 raderna – dessa rader är territorier, som vi inte behöver ta med. Processen är densamma men välj den här gången Ta bort rader> Ta bort de nedersta raderna och ange 26 som antalet rader att ta bort.

    Ta bort de nedersta raderna

  • Filtrera bort Washington DC – tabellen med pensionsstatistik inkluderar inte Washington DC, så vi utesluter den från listan. Markera listrutepilen bredvid kolumnen Federal state (Federal state ) och avmarkera kryssrutan Federal district (Federalt distrikt ).

    Ta bort en rad med ett visst värde

  • Ta bort några onödiga kolumner – Vi behöver bara mappning av varje tillstånd till dess officiella förkortning med två bokstäver, och den informationen anges i de första och fjärde kolumnerna. Därför behöver vi bara behålla dessa två kolumner och kan ta bort alla andra. Välj den första kolumnen som ska tas bort och håll ned Ctrl-tangenten medan du markerar de övriga kolumnerna som ska tas bort (på så sätt kan du markera flera kolumner som inte är intilliggande). Sedan på fliken Start i menyfliksområdet väljer du Ta bort kolumner > Ta bort kolumner.

    Ta bort vissa kolumner

  • Använd första raden som rubriker – Eftersom vi har tagit bort de tre översta rader är den nuvarande första raden den rubrik vi vill använda. Välj knappen Använd första raden som rubriker.

    Använd första raden som rubriker

    Anteckning

    Det här är ett bra tillfälle att påpeka att sekvensen för använda steg i Power Query-redigeraren är viktig och kan påverka hur data formas. Det är också viktigt att tänka på hur ett steg kan påverka andra efterföljande steg. Om du tar bort ett steg från listan Tillämpade steg kanske efterföljande steg inte fungerar som avsett på grund av effekten av frågans stegsekvens.

  • Byt namn på kolumnerna och på själva tabellen – som vanligt finns det några olika sätt att byta namn på en kolumn. Du kan använda vilket sätt du vill. Vi ska byta namn på Delstatsnamn och Delstatskod. Byt namn på tabellen genom att skriva namnet i fältet Namn i fönstret Frågeinställningar. Nu kallar vi den här tabellen för Delstatskoder.

    Byta namn på kolumner

Kombinera data

Nu när tabellen Delstatskoder har formats, kan vi kombinera våra två tabeller i en. Eftersom de tabeller som vi nu har är ett resultat av de frågor vi tillämpade på dessa data, kallas de ofta för frågor.

Det finns två huvudsakliga sätt att kombinera frågor på: slå ihop och lägga till.

När du har en eller flera kolumner som du vill lägga till i en annan fråga kan du slå ihop frågorna. När du har ytterligare rader med data att lägga till i en befintlig fråga kan du lägga till frågan.

I det här fallet vill vi slå ihop frågorna. För att komma igång, välj frågan som den andra frågan ska sammanfogas till. Sedan på fliken Start i menyfliksområdet, väljer du Sammanfoga frågor. Vi vill välja pensionsfrågan först. När vi ändå håller på byter vi namn på frågan till Pensionsstatistik.

Knappen Slå ihop frågor

Dialogrutan Sammanslå visas där vi kan välja tabellen som ska kopplas till den valda tabellen och de matchande kolumnerna som ska användas för sammanfogningen.

Välj Stat från tabellen (frågan) Pensionsstatistik och välj sedan frågan Delstatskoder. (I det här fallet är valet enkelt eftersom det bara finns en annan fråga. Men när du ansluter till många datakällor finns det många frågor att välja mellan.) När du har valt rätt matchande kolumner – Delstat från RetirementStats och Delstatsnamn från StateCodes – ser dialogrutan Sammanfoga ut så här och knappen OK blir tillgänglig.

Sammanfoga dialogrutan

En ny kolumn, NewColumn, skapas i slutet av frågan, som är innehållet i tabellen (frågan) som har slagits ihop med den befintliga frågan. Alla kolumner från den sammanslagna frågan ryms i NewColumn men du kan expandera tabellen och inkludera vilka kolumner du vill. Om du vill expandera den sammanfogade tabellen och välja de kolumner som ska inkluderas väljer du expandera-ikonen (expandera-ikonen). Dialogrutan Expandera visas.

Dialogrutan Expandera

I det här fallet vill vi bara vill ha kolumnen Delstatskod. Välj därför bara denna kolumn och välj sedan OK. Du kan även rensa kryssrutan Använd ursprungligt kolumnnamn som prefix. Om du lämnar den markerad så får den sammanfogade kolumnen namnet NewColumn.State Code (det ursprungliga kolumnnamnet eller NewColumn, sedan en punkt och sedan namnet på kolumnen som hämtas till frågan).

Anteckning

Om du vill kan du experimentera med hur tabellen NewColumn hämtas. Om du inte gillar resultatet tar du bort steget Expandera från listan Tillämpade steg i fönstret Frågeinställningar. Din fråga återgår till tillståndet den hade innan du tillämpade steget. Det här kan du göra om hur många gånger du vill, tills expanderingen ser ut som du vill.

Vi har nu en enda fråga (tabell) som kombinerar två datakällor, som båda har formats efter våra behov. Den här frågan kan fungera som grund för många ytterligare, intressanta dataanslutningar – till exempel statistik över bostadskostnader, demografi eller jobbmöjligheter i valfri delstat.

Om du vill tillämpa ändringarna i Power Query-redigeraren och läsa in dem i Power BI Desktop väljer du Stäng och använd i menyfliksområdet Start.

Stänga och använda datainställningar

Nu kan du arbeta med data i din modell. Nu ska vi skapa några visuella objekt för rapporten.

Nu har vi tillräckligt med data för att skapa några intressanta rapporter, helt i Power BI Desktop. Eftersom detta är en milstolpe, sparar vi den här Power BI Desktop-filen. Välj Fil > Spara på menyfliken Start för att spara rapporten – vi kallar den Komma igång med Power BI Desktop.

Bra! Nu vidare till nästa kursdel, där vi skapar några intressanta visuella objekt.