Opplæring: Forme og kombinere data i Power BI Desktop

Med Power BI Desktop kan du koble til mange forskjellige typer datakilder, og deretter forme dataene slik at de oppfyller dine behov, slik at du kan opprette visuelle rapporter for å dele med andre. Å forme data betyr å transformere dataene: gi nytt navn til kolonner eller tabeller, endre tekst til tall, fjerne rader, angi den første raden som overskrifter og så videre. Å kombinere data betyr å koble til to eller flere datakilder, forme dem etter behov, og deretter konsolidere dem til én enkelt spørring.

I denne opplæringen lærer du hvordan du kan gjøre følgende:

  • Forme data ved hjelp av Power Query-redigering.
  • Koble til til ulike datakilder.
  • Kombiner disse datakildene, og opprett en datamodell som skal brukes i rapporter.

Denne opplæringen viser hvordan du former en spørring ved hjelp av Power BI Desktop, og uthever de vanligste oppgavene. Spørringen som brukes her, beskrives mer detaljert, inkludert hvordan du oppretter spørringen fra grunnen av, i Komme i gang med Power BI Desktop.

Power Query-redigering i Power BI Desktop bruker høyreklikkmenyene og Transformer båndet. Det meste av det du kan velge på båndet, er også tilgjengelig ved å høyreklikke på et element, for eksempel en kolonne, og velge fra menyen som vises.

Slik bearbeider du data

Hvis du vil forme data i Power Query-redigering, gir du trinnvise instruksjoner for Power Query-redigering for å justere dataene etter hvert som de lastes inn og presenterer dataene. Den opprinnelige datakilden påvirkes ikke. bare denne bestemte visningen av dataene er justert eller formet.

Trinnene du angir (for eksempel gi nytt navn til en tabell, transformere en datatype eller slette en kolonne) registreres av Power Query-redigering. Hver gang denne spørringen kobles til datakilden, utfører Power Query-redigering disse trinnene slik at dataene alltid er formet slik du angir. Denne prosessen skjer når du bruker Power Query-redigering, eller for alle som bruker den delte spørringen, for eksempel på Power Bi-tjeneste. Disse trinnene fanges opp, sekvensielt, i ruten Innstillinger spørring under BRUKTE TRINN. Vi går gjennom hvert av disse trinnene i denne artikkelen.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Importer dataene fra en nettkilde. Velg rullegardinlisten Hent data, og velg deretter Web.

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Lim inn denne URL-adressen i dialogboksen Fra nett , og velg OK.

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. Velg i dialogboksen Navigator, og Table 1velg deretter Transformer data.

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Tips

Noe informasjon i tabellene fra den forrige NETTADRESSEn kan endres eller oppdateres av og til. Derfor må du kanskje justere valgene eller trinnene i denne artikkelen tilsvarende.

  1. Vinduet Power Query-redigering åpnes. Du kan se standardtrinnene som er brukt så langt, i ruten Spørring Innstillinger under BRUKTE TRINN.

    • Kilde: Koble til til nettstedet.
    • Pakket ut tabell fra Html: Velge tabellen.
    • Forfremmede overskrifter: Endre den øverste raden med data til kolonneoverskrifter.
    • Endret type: Endre kolonnetypene, som importeres som tekst, til de utsatte typene.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Endre tabellnavnet fra standard Table 1 til Retirement Data, og trykk deretter ENTER.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. De eksisterende dataene er sortert etter en vektet poengsum, som beskrevet på kildenettsiden under Metodikk. La oss legge til en egendefinert kolonne for å beregne en annen poengsum. Vi sorterer deretter tabellen i denne kolonnen for å sammenligne rangeringen av den egendefinerte poengsummen med den eksisterende rangeringen.

  4. Velg Egendefinert kolonne på båndet Legg til kolonne.

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. Skriv inn Ny poengsum i nytt kolonnenavn i dialogboksen Egendefinert kolonne. Skriv inn følgende data for egendefinert kolonneformel:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Kontroller at statusmeldingen er Ingen syntaksfeil er oppdaget, og velg OK.

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. I Spørring Innstillinger viser LISTEN BRUKTE TRINN nå det nye egendefinerte trinnet vi nettopp har definert.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

Justere dataene

Før vi arbeider med denne spørringen, kan vi gjøre noen endringer for å justere dataene:

  • Juster rangeringene ved å fjerne en kolonne.

    Anta for eksempel at Været ikke er en faktor i resultatene våre. Fjerning av denne kolonnen fra spørringen påvirker ikke de andre dataene.

  • Løs eventuelle feil.

    Fordi vi fjernet en kolonne, må vi justere beregningene våre i kolonnen Ny poengsum ved å endre formelen.

  • Sorter dataene.

    Sorter dataene basert på kolonnen Ny poengsum , og sammenlign med den eksisterende rangeringskolonnen .

  • Erstatt dataene.

    Vi uthever hvordan du erstatter en bestemt verdi og hvordan du setter inn et brukt trinn.

Disse endringene er beskrevet i fremgangsmåten nedenfor.

  1. Hvis du vil fjerne Vær-kolonnen , velger du kolonnen, velger Hjem-fanen fra båndet, og deretter velger du Fjern kolonner.

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Merk

    De nye resultatverdiene er ikke endret på grunn av rekkefølgen på trinnene. Power Query-redigering registrerer trinnene sekvensielt, men uavhengig av hverandre. Hvis du vil bruke handlinger i en annen sekvens, kan du flytte hvert brukte trinn opp eller ned.

  2. Høyreklikk et trinn for å se hurtigmenyen.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Flytt opp det siste trinnet, Fjernet kolonner, til like over det egendefinerte trinnet som er lagt til.

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Velg det egendefinerte trinnet som er lagt til.

    Legg merke til at kolonnen Ny poengsum nå viser Feil i stedet for den beregnede verdien.

    Screenshot of Power Query Editor and the New score column containing Error values.

    Det finnes flere måter å få mer informasjon om hver feil på. Hvis du merker cellen uten å klikke på ordet Feil, viser Power Query-redigering feilinformasjonen.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Hvis du velger ordet Feil direkte, oppretter Power Query-redigering et brukt trinn i ruten Innstillinger spørring og viser informasjon om feilen. Fordi vi ikke trenger å vise feilinformasjon noe annet sted, velger du Avbryt.

  5. Det kreves to endringer for å løse feilene, fjerne navnet på værkolonnen og endre divisoren fra 8 til 7. Du kan gjøre disse endringene på to måter:

    1. Høyreklikk trinnet Egendefinert kolonne, og velg Rediger Innstillinger. Dette viser dialogboksen Egendefinert kolonne du brukte til å opprette kolonnen Ny poengsum . Rediger formelen som beskrevet tidligere, til den ser slik ut:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Velg Ny resultat-kolonnen, og vis deretter kolonnens dataformel ved å aktivere avmerkingsboksen Formellinje fra Vis-fanen.

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Rediger formelen som beskrevet tidligere, helt til den ser slik ut, og trykk deretter enter.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    Power Query-redigering erstatter dataene med de reviderte verdiene og Lagt til egendefinert trinn fullføres uten feil.

    Merk

    Du kan også velge Fjern feil ved hjelp av båndet eller høyreklikkmenyen, som fjerner eventuelle rader som har feil. I denne opplæringen ønsker vi imidlertid å bevare alle dataene i tabellen.

  6. Sorter dataene basert på Ny resultat-kolonnen . Først velger du det siste brukte trinnet, Lagt til egendefinert for å vise de nyeste dataene. Deretter velger du rullegardinlisten som er plassert ved siden av kolonneoverskriften Ny poengsum , og velger Sorter synkende.

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    Dataene er nå sortert i henhold til Ny poengsum. Du kan velge et brukt trinn hvor som helst i listen, og fortsette å forme dataene på det tidspunktet i sekvensen. Power Query-redigering setter automatisk inn et nytt trinn rett etter det gjeldende brukte trinnet.

  7. Velg trinnet foran den egendefinerte kolonnen i BRUKTE TRINN, som er trinnet Fjernede kolonner . Her erstatter vi verdien av boligkostnadsrangeringen i Oregon. Høyreklikk den aktuelle cellen som inneholder Oregons boligkostnadsverdi, og velg deretter Erstatt verdier. Legg merke til hvilket brukt trinn som er valgt.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Velg Sett inn.

    Fordi vi setter inn et trinn, minner Power Query-redigering oss på at etterfølgende trinn kan føre til at spørringen brytes.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Endre dataverdien til 100,0.

    Power Query-redigering erstatter dataene for Oregon. Når du oppretter et nytt brukt trinn, Power Query-redigering navngi det basert på handlingen, i dette tilfellet Erstattet verdi. Hvis du har mer enn ett trinn med samme navn i spørringen, tilføyer Power Query-redigering et økende tall til hvert etterfølgende brukte trinnnavn.

  10. Velg det siste brukte trinnet, sorterte rader.

    Legg merke til at dataene er endret angående Oregons nye rangering. Denne endringen skjer fordi vi satte inn trinnet Erstattet verdi på riktig plassering, før det egendefinerte trinnet ble lagt til.

    Vi har nå formet dataene våre i den grad vi trenger det. Deretter kobler vi til en annen datakilde og kombinerer data.

Kombiner data

Dataene om ulike tilstander er interessante, og vil være nyttige for å bygge videre analyseinnsats og spørringer. De fleste data om stater bruker imidlertid en forkortelse på to bokstaver for delstatskoder, ikke det fullstendige navnet på staten. Vi trenger en måte å knytte delstatsnavn til forkortelsene deres på.

Det finnes en annen offentlig datakilde som gir denne tilknytningen, men den trenger en god del forming før vi kan koble den til pensjonstabellen vår. Følg disse trinnene for å forme dataene:

  1. Velg Nytt kildenett >på Hjem-båndet i Power Query-redigering.

  2. Skriv inn adressen til nettstedet for forkortelser for delstat, https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviationsog velg deretter Koble til.

    Navigatoren viser innholdet på nettstedet.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Velg koder og forkortelser for amerikanske delstater, føderale distrikter, territorier og andre regioner.

    Tips

    Det vil ta litt tid å forme for å analysere tabellens data ned til det vi ønsker. Finnes det en raskere eller enklere måte å utføre følgende trinn på? Ja, vi kan opprette en relasjon mellom de to tabellene og forme dataene basert på denne relasjonen. Følgende eksempeltrinn er nyttige for å lære hvordan du arbeider med tabeller. Relasjoner kan imidlertid hjelpe deg med raskt å bruke data fra flere tabeller.

Følg disse trinnene for å få dataene i form:

  1. Fjern den øverste raden. Fordi det er et resultat av måten nettsidens tabell ble opprettet på, trenger vi det ikke. Velg Fjern rader > fjern øverste raderHjem-båndet.

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    Dialogboksen Fjern øverste rader vises. Angi én rad som skal fjernes.

  2. Hev den nye øverste raden til overskrifter med Bruk første rad som overskrifter fra Hjem-fanen , eller fra Transformer-fanen på båndet.

  3. Siden tabellen Retirement Data ikke har informasjon for Washington DC eller territorier, må vi filtrere dem fra listen vår. Velg navnet og statusen for rullegardinlisten region_1 kolonnen, og fjern deretter merket for alle alternativene unntatt Delstat.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Fjern alle unødvendige kolonner. Fordi vi bare trenger tilordningen av hver stat til den offisielle forkortelsen på to bokstaver (navn og status for område - og ANSI-kolonner ), kan vi fjerne de andre kolonnene. Først velger du navn og status for områdekolonnen, holder nede CTRL-tasten og velger ANSI-kolonnen. Velg Fjern kolonner fjern andre kolonner >fra Hjem-fanen på båndet.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Merk

    Sekvensen av brukte trinn i Power Query-redigering er viktig, og påvirker hvordan dataene er formet. Det er også viktig å vurdere hvordan ett trinn kan påvirke et annet etterfølgende trinn. Hvis du for eksempel fjerner et trinn fra de brukte trinnene, kan det hende at etterfølgende trinn ikke fungerer som opprinnelig ment.

    Merk

    Når du endrer størrelsen på det Power Query-redigering vinduet for å gjøre bredden mindre, blir noen båndelementer kondensert for å gjøre best mulig bruk av synlig plass. Når du øker bredden på Power Query-redigering vinduet, utvides båndelementene for å få mest mulig ut av det økte båndområdet.

  5. Gi nytt navn til kolonnene og tabellen. Det finnes noen måter å gi nytt navn til en kolonne på: Først velger du kolonnen, velger deretter Gi nytt navn fra Fanen Transformer på båndet, eller høyreklikker og velger Gi nytt navn. Bildet nedenfor viser begge alternativene, men du trenger bare å velge ett.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Gi kolonnene nytt navn og delstatskode. Hvis du vil gi tabellen nytt navn, skriver du inn navnetilstandskodene i ruten Spørring Innstillinger.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Kombinere spørringer

Nå som vi har formet state codes-tabellen slik vi ønsker, kan vi kombinere disse to tabellene eller spørringene til én. Fordi tabellene vi nå har, er et resultat av spørringene vi brukte på dataene, blir de ofte referert til som spørringer.

Det finnes to hovedmåter å kombinere spørringer på – sammenslåing og tilføying.

  • Hvis du vil legge til én eller flere kolonner i en annen spørring, slår du sammen spørringene.
  • For én eller flere rader med data som du vil legge til i en eksisterende spørring, tilføyer du spørringen.

I dette tilfellet ønsker vi å slå sammen spørringene:

  1. Velg spørringen du vil at den andre spørringen skal slås sammen i, fra venstre rute i Power Query-redigering. I dette tilfellet er det pensjonsdata.

  2. Velg Slå sammen spørringer > flett spørringer fra Hjem-fanen på båndet.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Du kan bli bedt om å angi personvernnivåene for å sikre at dataene kombineres uten å inkludere eller overføre data du ikke vil overføre.

    Slå sammen-vinduet vises. Den ber deg velge hvilken tabell du vil flette inn i den valgte tabellen, og de samsvarende kolonnene som skal brukes for flettingen.

  3. Velg Delstat fra tabellen Pensjonsdata, og velg deretter state codes-spørringen.

    Når du velger en samsvarende kolonne, aktiveres OK-knappen .

    Screenshot of Power Query Editor's Merge dialog.

  4. Velg OK.

    Power Query-redigering oppretter en ny kolonne på slutten av spørringen, som inneholder innholdet i tabellen (spørringen) som ble slått sammen med den eksisterende spørringen. Alle kolonner fra den sammenslåtte spørringen er kondensert inn i kolonnen, men du kan utvide tabellen og inkludere kolonnene du vil bruke.

  5. Hvis du vil utvide den sammenslåtte tabellen og velge hvilke kolonner som skal inkluderes, velger du utvid-ikonet ( ).

    Utvid-vinduet vises.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. I dette tilfellet vil vi bare ha kolonnen Delstatskode . Velg denne kolonnen, fjern merket for Bruk opprinnelig kolonnenavn som prefiks, og velg deretter OK.

    Hvis vi hadde forlatt avmerkingsboksen valgt for Bruk opprinnelig kolonnenavn som prefiks, ville den sammenslåtte kolonnen fått navnet State Codes.State Code.

    Merk

    Hvis du vil utforske hvordan du henter inn tabellen Delstatskoder , kan du eksperimentere litt. Hvis du ikke liker resultatene, sletter du bare dette trinnet fra LISTEN BRUKTE TRINN i ruten Spørring Innstillinger, og spørringen returnerer til tilstanden før du bruker utvid-trinnet. Du kan gjøre dette så mange ganger du vil, helt til utvidingsprosessen ser ut slik du vil ha den.

    Vi har nå én enkelt spørring (tabell) som kombinerer to datakilder, som hver ble formet for å dekke våre behov. Denne spørringen kan være et grunnlag for interessante datatilkoblinger, for eksempel boligkostnadsstatistikk, livskvalitet eller kriminalitet i alle delstater.

  7. Hvis du vil bruke endringene og lukke Power Query-redigering, velger du Lukk og brukHjem-båndfanen.

    Den transformerte semantiske modellen vises i Power BI Desktop, som er klar til å brukes til å opprette rapporter.

    Screenshot of Power Query Editor's Close & Apply button.

Hvis du vil ha mer informasjon om Power BI Desktop og funksjonene, kan du se følgende ressurser: