Selvstudium: Form og kombiner data i Power BI Desktop

Med Power BI Desktop kan du oprette forbindelse til mange forskellige typer datakilder og derefter forme dataene, så de opfylder dine behov, så du kan oprette visuelle rapporter, der kan deles med andre. At forme data betyder, at dataene skal transformeres: omdøbning af kolonner eller tabeller, ændring af tekst til tal, fjernelse af rækker, angivelse af den første række som overskrifter osv. Ved at kombinere data skal du oprette forbindelse til to eller flere datakilder, forme dem efter behov og derefter konsolidere dem i en enkelt forespørgsel.

I dette selvstudium lærer du, hvordan du:

  • Form data ved hjælp af Power Query-editor.
  • Forbind til forskellige datakilder.
  • Kombiner disse datakilder, og opret en datamodel, der skal bruges i rapporter.

I dette selvstudium kan du se, hvordan du former en forespørgsel ved hjælp af Power BI Desktop og fremhæver de mest almindelige opgaver. Den forespørgsel, der bruges her, er beskrevet mere detaljeret, herunder hvordan du opretter forespørgslen fra bunden, i Introduktion til Power BI Desktop.

Power Query-editor i Power BI Desktop bruger genvejsmenuerne, og Transformér bånd. Det meste af det, du kan vælge på båndet, er også tilgængeligt ved at højreklikke på et element, f.eks. en kolonne, og vælge i den menu, der vises.

Form data

Hvis du vil forme data i Power Query-editor, skal du angive en trinvis vejledning til Power Query-editor til at justere dataene, efterhånden som de indlæses og præsenteres. Den oprindelige datakilde påvirkes ikke. kun denne bestemte visning af dataene justeres eller formes.

De trin, du angiver (f.eks. omdøbe en tabel, transformere en datatype eller slette en kolonne), registreres af Power Query-editor. Hver gang denne forespørgsel opretter forbindelse til datakilden, udfører Power Query-editor disse trin, så dataene altid formes på den måde, du angiver. Denne proces forekommer, når du bruger Power Query-editor eller for alle, der bruger din delte forespørgsel, f.eks. på Power BI-tjeneste. Disse trin registreres sekventielt i ruden Forespørgsel Indstillinger under ANVENDTE TRIN. Vi gennemgår hvert af disse trin i denne artikel.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Importér dataene fra en webkilde. Vælg rullelisten Hent data, og vælg derefter Web.

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Indsæt denne URL-adresse i dialogboksen Fra web, og vælg OK.

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. Vælg i dialogboksen Navigator, og vælg derefter Transformér data.Table 1

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Tip

Nogle oplysninger i tabellerne fra den forrige URL-adresse kan blive ændret eller opdateret af og til. Derfor skal du muligvis justere valgene eller trinnene i denne artikel i overensstemmelse hermed.

  1. Vinduet Power Query-editor åbnes. Du kan se de standardtrin, der er anvendt indtil videre, i ruden Forespørgsel Indstillinger under ANVENDTE TRIN.

    • Kilde: Forbind til webstedet.
    • Udtrukket tabel fra HTML: Vælg tabellen.
    • Fremhævede overskrifter: Ændring af den øverste række med data til kolonneoverskrifter.
    • Ændret type: Ændring af de kolonnetyper, der importeres som tekst, til deres udledte typer.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Skift tabelnavnet fra standardnavnet Table 1 til Retirement Data, og tryk derefter på Enter.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. De eksisterende data sorteres efter en vægtet score, som beskrevet på kildewebsiden under Metodologi. Lad os tilføje en brugerdefineret kolonne for at beregne en anden score. Vi sorterer derefter tabellen i denne kolonne for at sammenligne rangeringen af den brugerdefinerede score med den eksisterende rangering.

  4. Vælg Brugerdefineret kolonne på båndet Tilføj kolonne.

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. Angiv Ny score i Nyt kolonnenavn i dialogboksen Brugerdefineret kolonne. Angiv følgende data for formlen brugerdefineret kolonne:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Kontrollér, at statusmeddelelsen ikke er registreret nogen syntaksfejl, og vælg OK.

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. I forespørgsels Indstillinger viser listen ANVENDTE TRIN nu det nye trin Tilføjet brugerdefineret, som vi lige har defineret.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

Juster dataene

Før vi arbejder med denne forespørgsel, skal vi foretage et par ændringer for at justere dataene:

  • Juster rangeringerne ved at fjerne en kolonne.

    Antag f.eks., at Vejr ikke er en faktor i vores resultater. Hvis du fjerner denne kolonne fra forespørgslen, påvirker det ikke de andre data.

  • Ret eventuelle fejl.

    Da vi har fjernet en kolonne, skal vi justere vores beregninger i kolonnen Ny score ved at ændre formlen.

  • Sortér dataene.

    Sortér dataene baseret på kolonnen Ny score , og sammenlign med den eksisterende rangeringskolonne .

  • Erstat dataene.

    Vi fremhæver, hvordan du erstatter en bestemt værdi, og hvordan du indsætter et anvendt trin.

Disse ændringer er beskrevet i følgende trin.

  1. Hvis du vil fjerne kolonnen Vejr , skal du vælge kolonnen, vælge fanen Hjem på båndet og derefter vælge Fjern kolonner.

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Bemærk

    Værdierne for ny score er ikke ændret pga. rækkefølgen af trinnene. Power Query-editor registrerer trinnene sekventielt, men uafhængigt af hinanden. Hvis du vil anvende handlinger i en anden sekvens, kan du flytte hvert anvendte trin op eller ned.

  2. Højreklik på et trin for at se genvejsmenuen.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Flyt det sidste trin Fjernede kolonner op til lige over trinnet Tilføjet brugerdefineret .

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Vælg trinnet Tilføjet brugerdefineret.

    Bemærk, at kolonnen Ny score nu viser Error i stedet for den beregnede værdi.

    Screenshot of Power Query Editor and the New score column containing Error values.

    Der er flere måder at få flere oplysninger om hver fejl på. Hvis du markerer cellen uden at klikke på ordet Fejl, Power Query-editor viser fejloplysningerne.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Hvis du vælger ordet Fejl direkte, opretter Power Query-editor et Anvendt trin i ruden Forespørgsel Indstillinger og viser oplysninger om fejlen. Da vi ikke behøver at vise fejloplysninger andre steder, skal du vælge Annuller.

  5. For at rette fejlene er der to nødvendige ændringer, der fjerner kolonnenavnet Vejr og ændrer divisoren fra 8 til 7. Du kan foretage disse ændringer på to måder:

    1. Højreklik på trinnet Brugerdefineret kolonne, og vælg Rediger Indstillinger. Derved åbnes dialogboksen Brugerdefineret kolonne, som du brugte til at oprette kolonnen Ny score . Rediger formlen som beskrevet tidligere, indtil den ser sådan ud:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Vælg kolonnen Ny score, og vis derefter kolonnens dataformel ved at aktivere afkrydsningsfeltet Formellinje under fanen Vis.

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Rediger formlen som beskrevet tidligere, indtil den ser sådan ud, og tryk derefter på Enter.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    Power Query-editor erstatter dataene med de reviderede værdier, og Det tilføjede brugerdefinerede trin fuldføres uden fejl.

    Bemærk

    Du kan også vælge Fjern fejl ved hjælp af båndet eller genvejsmenuen, som fjerner alle rækker med fejl. I dette selvstudium vil vi dog bevare alle dataene i tabellen.

  6. Sortér dataene baseret på kolonnen Ny score . Først skal du vælge det senest anvendte trin Tilføjet brugerdefineret for at få vist de nyeste data. Vælg derefter rullelisten ud for kolonneoverskriften Ny score , og vælg Sortér faldende.

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    Dataene sorteres nu i henhold til Ny score. Du kan vælge et anvendt trin et vilkårligt sted på listen og fortsætte med at forme dataene på det pågældende tidspunkt i sekvensen. Power Query-editor indsætter automatisk et nyt trin direkte efter det aktuelt valgte anvendte trin.

  7. I ANVENDTE TRIN skal du vælge trinnet før den brugerdefinerede kolonne, som er trinnet Fjernede kolonner . Her vil vi erstatte værdien af boligomkostningerne ranking i Oregon. Højreklik på den relevante celle, der indeholder Oregons boligomkostningsværdi , og vælg derefter Erstat værdier. Bemærk, hvilket anvendte trin der er valgt i øjeblikket.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Vælg Indsæt.

    Da vi indsætter et trin, minder Power Query-editor os om, at efterfølgende trin kan medføre, at forespørgslen afbrydes.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Ret dataværdien til 100,0.

    Power Query-editor erstatter dataene for Oregon. Når du opretter et nyt anvendt trin, Power Query-editor navngiver det på baggrund af handlingen i dette tilfælde Erstattet værdi. Hvis du har mere end ét trin med det samme navn i forespørgslen, føjer Power Query-editor et stigende antal til hvert efterfølgende anvendte trins navn.

  10. Vælg det sidste anvendte trin sorterede rækker.

    Bemærk, at dataene er ændret vedrørende Oregons nye rangering. Denne ændring sker, fordi vi indsatte trinnet Erstattet værdi på den korrekte placering før trinnet Tilføjet brugerdefineret .

    Vi har nu formet vores data i det omfang, vi har brug for. Lad os derefter oprette forbindelse til en anden datakilde og kombinere data.

Kombiner data

Dataene om forskellige stater er interessante og vil være nyttige til at skabe yderligere analysearbejde og forespørgsler. De fleste data om stater bruger dog en forkortelse på to bogstaver for statskoder og ikke statens fulde navn. Vi skal bruge en metode til at knytte navne på stater til deres forkortelser.

Der er en anden offentlig datakilde, der leverer denne tilknytning, men den skal formes en hel del, før vi kan knytte den til vores pensionstabel. Følg disse trin for at forme dataene:

  1. På båndet Hjem i Power Query-editor skal du vælge Nyt kildewebsted>.

  2. Angiv adressen på webstedet for forkortelser for stater, https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations, og vælg derefter Forbind.

    Navigatoren viser indholdet af webstedet.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Vælg Koder og forkortelser for amerikanske stater, føderale distrikter, områder og andre områder.

    Tip

    Det kræver lidt formning at analysere denne tabels data ned til det, vi ønsker. Er der en hurtigere eller nemmere måde at udføre følgende trin på? Ja, vi kan oprette en relation mellem de to tabeller og forme dataene baseret på relationen. Følgende eksempeltrin er nyttige til at få mere at vide om, hvordan du arbejder med tabeller. Relationer kan dog hjælpe dig med hurtigt at bruge data fra flere tabeller.

Følg disse trin for at få dataene i form:

  1. Fjern den øverste række. Da det er et resultat af den måde, websidens tabel blev oprettet på, har vi ikke brug for den. På båndet Hjem skal du vælge Fjern rækker > Fjern de øverste rækker.

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    Dialogboksen Fjern de øverste rækker vises. Angiv 1 række, der skal fjernes.

  2. Hæv den nye øverste række til overskrifter med Brug første række som overskrifter fra fanen Hjem eller fra fanen Transformér på båndet.

  3. Da tabellen Pensionsdata ikke indeholder oplysninger om Washington DC eller områder, skal vi filtrere dem fra vores liste. Vælg navn og status for rullelisten for region_1 kolonne, og fjern derefter markeringen i alle afkrydsningsfelter undtagen State.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Fjern alle unødvendige kolonner. Da vi kun har brug for tilknytningen af hver stat til den officielle forkortelse på to bogstaver (navn og status for område og ANSI-kolonner ), kan vi fjerne de andre kolonner. Vælg først kolonnen Navn og status for område, hold derefter Ctrl nede, og vælg kolonnen ANSI. Under fanen Hjem på båndet skal du vælge Fjern kolonner > Fjern andre kolonner.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Bemærk

    Rækkefølgen af anvendte trin i Power Query-editor er vigtig og påvirker den måde, dataene formes på. Det er også vigtigt at overveje, hvordan ét trin kan påvirke et andet efterfølgende trin. Hvis du f.eks. fjerner et trin fra de anvendte trin, fungerer efterfølgende trin muligvis ikke som oprindeligt tiltænkt.

    Bemærk

    Når du tilpasser størrelsen på det Power Query-editor vindue for at gøre bredden mindre, komprimeres nogle elementer på båndet for at gøre bedst muligt brug af synlig plads. Når du øger bredden af det Power Query-editor vindue, udvides elementerne på båndet for at få mest ud af det øgede båndområde.

  5. Omdøb kolonnerne og tabellen. Der er et par måder at omdøbe en kolonne på: Markér først kolonnen, vælg derefter Omdøbunder fanen Transformér på båndet, eller højreklik, og vælg Omdøb. På følgende billede vises begge indstillinger, men du behøver kun at vælge en.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Omdøb kolonnerne til State Name og State Code. Hvis du vil omdøbe tabellen, skal du angive Navnetilstandskoder i ruden Forespørgsel Indstillinger.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Kombiner forespørgsler

Nu, hvor vi har formet tabellen Statskoder , som vi ønsker, kan vi kombinere disse to tabeller eller forespørgsler til én. Da de tabeller, vi nu har, er et resultat af de forespørgsler, vi har anvendt på dataene, kaldes de ofte forespørgsler.

Der er to primære måder, du kan kombinere forespørgsler på: fletning og tilføjelse.

  • Hvis du vil føje en eller flere kolonner til en anden forespørgsel, skal du flette forespørgslerne.
  • For en eller flere rækker med data, som du vil føje til en eksisterende forespørgsel, skal du tilføje forespørgslen.

I dette tilfælde vil vi flette forespørgslerne:

  1. Vælg den forespørgsel, som den anden forespørgsel skal flettes til, i ruden til venstre i Power Query-editor. I dette tilfælde er det pensionsdata.

  2. Vælg Flet forespørgsler > Flet forespørgsler under fanen Hjem på båndet.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Du bliver muligvis bedt om at angive niveauerne for beskyttelse af personlige oplysninger for at sikre, at dataene kombineres uden at inkludere eller overføre data, du ikke vil overføre.

    Vinduet Flet vises. Du bliver bedt om at vælge, hvilken tabel du vil flette med den valgte tabel, og hvilke tilsvarende kolonner der skal bruges til fletningen.

  3. Vælg State i tabellen Pensionsdata , og vælg derefter forespørgslen Statskoder .

    Når du vælger en tilsvarende kolonne, aktiveres knappen OK .

    Screenshot of Power Query Editor's Merge dialog.

  4. Vælg OK.

    Power Query-editor opretter en ny kolonne i slutningen af forespørgslen, som indeholder indholdet af den tabel (forespørgsel), der blev flettet med den eksisterende forespørgsel. Alle kolonner fra den flettede forespørgsel komprimeres til kolonnen, men du kan udvide tabellen og inkludere de kolonner, du vil have.

  5. Hvis du vil udvide den flettede tabel og vælge, hvilke kolonner der skal medtages, skal du vælge udvidelsesikonet ( ).

    Vinduet Expand vises.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. I dette tilfælde vil vi kun have kolonnen State Code . Vælg kolonnen, fjern markeringen i Brug oprindeligt kolonnenavn som præfiks, og vælg derefter OK.

    Hvis vi havde ladet afkrydsningsfeltet være markeret for Brug oprindeligt kolonnenavn som præfiks, ville den flettede kolonne have navnet State Codes.State Code.

    Bemærk

    Hvis du vil udforske, hvordan du henter tabellen Statskoder , kan du eksperimentere lidt. Hvis du ikke kan lide resultaterne, skal du blot slette dette trin fra listen ANVENDTE TRIN i ruden Forespørgsel Indstillinger, og din forespørgsel vender tilbage til tilstanden, før du anvender trinnet Udvid. Du kan gøre dette lige så mange gange, du vil, indtil udvidelsesprocessen ser ud, som du ønsker det.

    Vi har nu en enkelt forespørgsel (tabel), der kombinerer to datakilder, som hver især er formet efter vores behov. Denne forespørgsel kan være et grundlag for interessante dataforbindelser, f.eks. statistikker over boligomkostninger, livskvalitet eller kriminalitet i en hvilken som helst stat.

  7. Hvis du vil anvende dine ændringer og lukke Power Query-editor, skal du vælge Luk & Anvend på båndfanen Hjem.

    Den transformerede semantiske model vises i Power BI Desktop, der er klar til at blive brugt til oprettelse af rapporter.

    Screenshot of Power Query Editor's Close & Apply button.

Du kan få flere oplysninger om Power BI Desktop og dens funktioner i følgende ressourcer: