Zelfstudie: Gegevens vormgeven en combineren in Power BI Desktop

Met Power BI Desktop kunt u verbinding maken met veel verschillende typen gegevensbronnen en vervolgens de gegevens vormgeven om aan uw behoeften te voldoen, zodat u visuele rapporten kunt maken die u met anderen kunt delen. Het vormgeven van gegevens betekent het transformeren van de gegevens: kolommen of tabellen een andere naam geven, tekst wijzigen in getallen, rijen verwijderen, de eerste rij instellen als kopteksten, enzovoort. Het combineren van gegevens betekent dat u verbinding maakt met twee of meer gegevensbronnen, hoe u ze zo nodig kunt vormgeven en deze vervolgens samenvoegt in één query.

In deze zelfstudie leert u het volgende:

  • Shapegegevens met behulp van Power Query-editor.
  • Verbinding maken naar verschillende gegevensbronnen.
  • Combineer deze gegevensbronnen en maak een gegevensmodel voor gebruik in rapporten.

In deze zelfstudie ziet u hoe u een query vormgeeft met behulp van Power BI Desktop, waarbij de meest voorkomende taken worden gemarkeerd. De query die hier wordt gebruikt, wordt gedetailleerder beschreven, inclusief hoe u de query helemaal zelf maakt, in Aan de slag met Power BI Desktop.

Power Query-editor in Power BI Desktop gebruikt de snelmenu's en de Het lint transformeren. Het grootste deel van wat u op het lint kunt selecteren, is ook beschikbaar door met de rechtermuisknop op een item, zoals een kolom, te klikken en een keuze te maken in het menu dat wordt weergegeven.

Gegevens vormgeven

Als u gegevens in Power Query-editor wilt vormgeven, geeft u stapsgewijze instructies voor Power Query-editor om de gegevens aan te passen tijdens het laden en weergeven van de gegevens. De oorspronkelijke gegevensbron wordt niet beïnvloed; alleen deze specifieke weergave van de gegevens wordt aangepast of vormgegeven.

De stappen die u opgeeft (zoals de naam van een tabel wijzigen, een gegevenstype transformeren of een kolom verwijderen) worden vastgelegd door Power Query-editor. Telkens wanneer deze query verbinding maakt met de gegevensbron, voert Power Query-editor deze stappen uit, zodat de gegevens altijd worden vormgegeven zoals u opgeeft. Dit proces vindt plaats wanneer u Power Query-editor gebruikt of voor iedereen die uw gedeelde query gebruikt, zoals op de Power BI-service. Deze stappen worden opeenvolgend vastgelegd in het deelvenster Query Instellingen onder TOEGEPASTE STAPPEN. We doorlopen elk van deze stappen in dit artikel.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Importeer de gegevens uit een webbron. Selecteer de vervolgkeuzelijst Gegevens ophalen en kies vervolgens Web.

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Plak deze URL in het dialoogvenster Van het web en selecteer OK.

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. Selecteer in het dialoogvenster Navigator de optie Table 1Gegevens transformeren.

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Tip

Sommige informatie in de tabellen uit de vorige URL kan af en toe worden gewijzigd of bijgewerkt. Als gevolg hiervan moet u mogelijk de selecties of stappen in dit artikel dienovereenkomstig aanpassen.

  1. Het venster Power Query-editor wordt geopend. U ziet de standaardstappen die tot nu toe zijn toegepast, in het deelvenster Query Instellingen onder TOEGEPASTE STAPPEN.

    • Bron: Verbinding maken naar de website.
    • Geëxtraheerde tabel uit HTML: de tabel selecteren.
    • Gepromoveerde kopteksten: de bovenste rij met gegevens wijzigen in kolomkoppen.
    • Gewijzigd type: de kolomtypen, die als tekst worden geïmporteerd, wijzigen in de afgeleide typen.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Wijzig de tabelnaam van de standaardinstelling Table 1 in Retirement Dataen druk op Enter.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. De bestaande gegevens worden gerangschikt op een gewogen score, zoals beschreven op de bronwebpagina onder Methodologie. Laten we een aangepaste kolom toevoegen om een andere score te berekenen. Vervolgens sorteren we de tabel in deze kolom om de rangschikking van de aangepaste score te vergelijken met de bestaande rangschikking.

  4. Selecteer Aangepaste kolom op het lint Kolom toevoegen.

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. Voer in het dialoogvenster Aangepaste kolom, in Nieuwe kolomnaam, nieuwe score in. Voer voor de formule aangepaste kolom de volgende gegevens in:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Zorg ervoor dat het statusbericht geen syntaxisfouten heeft gedetecteerd en selecteer OK.

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. In Query Instellingen toont de lijst TOEGEPASTE STAPPEN nu de nieuwe aangepaste stap toegevoegd die we zojuist hebben gedefinieerd.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

De gegevens aanpassen

Voordat we met deze query werken, gaan we enkele wijzigingen aanbrengen om de gegevens aan te passen:

  • Pas de classificaties aan door een kolom te verwijderen.

    Stel dat het weer geen factor is in onze resultaten. Het verwijderen van deze kolom uit de query heeft geen invloed op de andere gegevens.

  • Los eventuele fouten op.

    Omdat we een kolom hebben verwijderd, moeten we onze berekeningen in de kolom Nieuwe score aanpassen door de formule te wijzigen.

  • Sorteer de gegevens.

    Sorteer de gegevens op basis van de kolom Nieuwe score en vergelijk deze met de bestaande rangschikkingskolom.

  • Vervang de gegevens.

    We laten zien hoe u een specifieke waarde vervangt en hoe u een toegepaste stap invoegt.

Deze wijzigingen worden beschreven in de volgende stappen.

  1. Als u de kolom Weer wilt verwijderen, selecteert u de kolom, kiest u het tabblad Start op het lint en kiest u Kolommen verwijderen.

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Notitie

    De nieuwe scorewaarden zijn niet gewijzigd vanwege de volgorde van de stappen. Power Query-editor registreert de stappen opeenvolgend, maar onafhankelijk van elkaar. Als u acties in een andere volgorde wilt toepassen, kunt u elke toegepaste stap omhoog of omlaag verplaatsen.

  2. Klik met de rechtermuisknop op een stap om het contextmenu te bekijken.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Verplaats de laatste stap, Verwijderde kolommen, naar net boven de toegevoegde aangepaste stap.

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Selecteer de aangepaste stap Toegevoegd.

    U ziet dat in de kolom Nieuwe score nu Fout wordt weergegeven in plaats van de berekende waarde.

    Screenshot of Power Query Editor and the New score column containing Error values.

    Er zijn verschillende manieren om meer informatie over elke fout op te halen. Als u de cel selecteert zonder op het woord Fout te klikken, geeft Power Query-editor de foutgegevens weer.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Als u het woord Fout rechtstreeks selecteert, maakt Power Query-editor een toegepaste stap in het deelvenster Query Instellingen en wordt informatie over de fout weergegeven. Omdat we nergens anders foutinformatie hoeven weer te geven, selecteert u Annuleren.

  5. Er zijn twee wijzigingen nodig om de fouten op te lossen, de naam van de weerkolom te verwijderen en de deler van 8 naar 7 te wijzigen. U kunt deze wijzigingen op twee manieren aanbrengen:

    1. Klik met de rechtermuisknop op de stap Aangepaste kolom en selecteer Instellingen bewerken. Hiermee wordt het dialoogvenster Aangepaste kolom weergegeven dat u hebt gebruikt om de kolom Nieuwe score te maken. Bewerk de formule zoals eerder beschreven, totdat deze er als volgt uitziet:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Selecteer de kolom Nieuwe score en geef vervolgens de gegevensformule van de kolom weer door het selectievakje Formulebalk in te schakelen op het tabblad Weergave .

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Bewerk de formule zoals eerder beschreven, totdat deze er als volgt uitziet. Druk vervolgens op Enter.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    Power Query-editor de gegevens vervangt door de herziene waarden en de Aangepaste stap is voltooid zonder fouten.

    Notitie

    U kunt ook Fouten verwijderen selecteren met behulp van het lint of het snelmenu, waarmee rijen met fouten worden verwijderd. In deze zelfstudie willen we echter alle gegevens in de tabel behouden.

  6. Sorteer de gegevens op basis van de kolom Nieuwe score . Selecteer eerst de laatste toegepaste stap, Aangepast toegevoegd om de meest recente gegevens weer te geven. Selecteer vervolgens de vervolgkeuzelijst naast de kolomkop Nieuwe score en kies Aflopend sorteren.

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    De gegevens worden nu gesorteerd op basis van de nieuwe score. U kunt een toegepaste stap overal in de lijst selecteren en doorgaan met het vormgeven van de gegevens op dat punt in de volgorde. Power Query-editor automatisch een nieuwe stap invoegen direct na de geselecteerde toegepaste stap.

  7. Selecteer in TOEGEPASTE STAPPEN de stap voorafgaand aan de aangepaste kolom. Dit is de stap Verwijderde kolommen . Hier vervangen we de waarde van de classificatie Huisvestingskosten in Oregon. Klik met de rechtermuisknop op de juiste cel met de waarde voor huisvestingskosten van Oregon en selecteer Waarden vervangen. Let op welke toegepaste stap momenteel is geselecteerd.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Selecteer Invoegen.

    Omdat we een stap invoegen, herinnert Power Query-editor ons eraan dat de volgende stappen ervoor kunnen zorgen dat de query wordt verbroken.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Wijzig de gegevenswaarde in 100,0.

    Power Query-editor vervangt de gegevens voor Oregon. Wanneer u een nieuwe toegepaste stap maakt, Power Query-editor deze een naam op basis van de actie, in dit geval Vervangen waarde. Als u meer dan één stap met dezelfde naam in uw query hebt, voegt Power Query-editor een toenemend aantal toe aan de naam van elke volgende toegepaste stap.

  10. Selecteer de laatste toegepaste stap, gesorteerde rijen.

    U ziet dat de gegevens zijn gewijzigd met betrekking tot de nieuwe rangschikking van Oregon. Deze wijziging treedt op omdat we de stap Vervangen waarde op de juiste locatie hebben ingevoegd voordat de aangepaste stap is toegevoegd.

    We hebben onze gegevens nu vormgegeven in de mate die we nodig hebben. Vervolgens gaan we verbinding maken met een andere gegevensbron en gegevens combineren.

Gegevens combineren

De gegevens over verschillende statussen zijn interessant en zijn nuttig voor het bouwen van verdere analyse-inspanningen en query's. De meeste gegevens over staten gebruiken echter een afkorting van twee letters voor staatscodes, niet de volledige naam van de staat. We hebben een manier nodig om namen van staten te koppelen aan hun afkortingen.

Er is een andere openbare gegevensbron die die koppeling biedt, maar er is een behoorlijke hoeveelheid vormgeving nodig voordat we deze kunnen verbinden met onze buitengebruikstellingstabel. Voer de volgende stappen uit om de gegevens vorm te geven:

  1. Selecteer nieuw bronweb> op het lint Start in Power Query-editor.

  2. Voer het adres van de website in voor staat afkortingen https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviationsen selecteer Verbinding maken.

    De Navigator geeft de inhoud van de website weer.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Selecteer Codes en afkortingen voor Amerikaanse staten, federale districten, gebieden en andere regio's.

    Tip

    Het duurt even om de gegevens van deze tabel te parseren tot wat we willen. Is er een snellere of eenvoudigere manier om de volgende stappen uit te voeren? Ja, we kunnen een relatie tussen de twee tabellen maken en de gegevens vormgeven op basis van die relatie. De volgende voorbeeldstappen zijn handig om te leren werken met tabellen. Met relaties kunt u echter snel gegevens uit meerdere tabellen gebruiken.

Voer de volgende stappen uit om de gegevens in vorm te krijgen:

  1. Verwijder de bovenste rij. Omdat het een resultaat is van de manier waarop de tabel van de webpagina is gemaakt, hebben we deze niet nodig. Selecteer op het lint Start de optie Bovenste > rijen verwijderen.

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    Het dialoogvenster Bovenste rijen verwijderen wordt weergegeven. Geef 1 rij op die u wilt verwijderen.

  2. De nieuwe bovenste rij verhogen naar koppen met Eerste rij als kopteksten gebruiken vanaf het tabblad Start of op het tabblad Transformeren op het lint.

  3. Omdat de tabel Retirement Data geen informatie heeft voor Washington DC of gebieden, moeten we ze filteren uit onze lijst. Selecteer de naam en status van de vervolgkeuzelijst van region_1 kolom en schakel alle selectievakjes behalve State uit.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Verwijder alle overbodige kolommen. Omdat we alleen de toewijzing van elke staat nodig hebben aan de officiële afkorting van twee letters (naam en status van regio - en ANSI-kolommen ), kunnen we de andere kolommen verwijderen. Selecteer eerst de naam en status van de regiokolom, houd vervolgens Ctrl ingedrukt en selecteer de ANSI-kolom. Selecteer Op het tabblad Start op het lint de optie Kolommen > verwijderen Andere kolommen.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Notitie

    De volgorde van toegepaste stappen in Power Query-editor is belangrijk en beïnvloedt de vorm van de gegevens. Het is ook belangrijk om te overwegen hoe een stap van invloed kan zijn op een andere volgende stap. Als u bijvoorbeeld een stap verwijdert uit de toegepaste stappen, gedragen de volgende stappen zich mogelijk niet zoals oorspronkelijk bedoeld.

    Notitie

    Wanneer u het formaat van het Power Query-editor venster wijzigt om de breedte kleiner te maken, worden sommige lintitems ingekort om het beste gebruik te maken van zichtbare ruimte. Wanneer u de breedte van het Power Query-editor-venster vergroot, worden de lintitems uitgevouwen om optimaal gebruik te maken van het toegenomen lintgebied.

  5. Wijzig de naam van de kolommen en de tabel. Er zijn een aantal manieren om de naam van een kolom te wijzigen: selecteer eerst de kolom en selecteer Vervolgens Naam wijzigen op het tabblad Transformeren op het lint of klik met de rechtermuisknop en selecteer Naam wijzigen. In de volgende afbeelding ziet u beide opties, maar u hoeft er slechts een te kiezen.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Wijzig de naam van de kolommen in State Name en State Code. Als u de naam van de tabel wilt wijzigen, voert u de naamstatuscodes in het deelvenster Query Instellingen in.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Query's combineren

Nu we de tabel Staatscodes naar wens hebben gevormd, gaan we deze twee tabellen of query's combineren in één tabel. Omdat de tabellen die we nu hebben, het resultaat zijn van de query's die we op de gegevens hebben toegepast, worden ze vaak query's genoemd.

Er zijn in feite twee manieren om query's te combineren: samenvoegen en toevoegen.

  • Voor een of meer kolommen die u aan een andere query wilt toevoegen, voegt u de query's samen .
  • Voor een of meer rijen met gegevens die u aan een bestaande query wilt toevoegen, voegt u de query toe .

In dit geval willen we de query's samenvoegen:

  1. Selecteer in het linkerdeelvenster van Power Query-editor de query waarin u de andere query wilt samenvoegen. In dit geval zijn het buitengebruikstellingsgegevens.

  2. Selecteer Query's > samenvoegen op het tabblad Start op het lint.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Mogelijk wordt u gevraagd om de privacyniveaus in te stellen, om ervoor te zorgen dat de gegevens worden gecombineerd zonder gegevens die u niet wilt overdragen, op te geven of over te dragen.

    Het venster Samenvoegen wordt weergegeven. U wordt gevraagd om te selecteren welke tabel u wilt samenvoegen in de geselecteerde tabel en de overeenkomende kolommen die u voor de samenvoegbewerking wilt gebruiken.

  3. Selecteer State in de tabel Retirement Data en selecteer vervolgens de query State Codes .

    Wanneer u een overeenkomende kolommen selecteert, wordt de knop OK ingeschakeld.

    Screenshot of Power Query Editor's Merge dialog.

  4. Selecteer OK.

    Power Query-editor maakt een nieuwe kolom aan het einde van de query, die de inhoud bevat van de tabel (query) die is samengevoegd met de bestaande query. Alle kolommen uit de samengevoegde query zijn samengevoegd in de kolom, maar u kunt de tabel uitbreiden en de gewenste kolommen opnemen.

  5. Als u de samengevoegde tabel wilt uitvouwen en wilt selecteren welke kolommen u wilt opnemen, selecteert u het uitvouwpictogram ( ).

    Het venster Uitvouwen wordt weergegeven.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. In dit geval willen we alleen de kolom Staatcode . Selecteer die kolom, schakel oorspronkelijke kolomnaam als voorvoegsel gebruiken uit en selecteer VERVOLGENS OK.

    Als we het selectievakje voor Oorspronkelijke kolomnaam als voorvoegsel gebruiken hadden ingeschakeld, krijgt de samengevoegde kolom de naam State Codes.State Code.

    Notitie

    Als u wilt verkennen hoe u de tabel Staatcodes kunt opnemen, kunt u een beetje experimenteren. Als u niet tevreden bent met de resultaten, verwijdert u die stap uit de lijst TOEGEPASTE STAPPEN in het deelvenster Query Instellingen en keert de query terug naar de status voordat u die stap Uitvouwen toepast. U kunt dit zo vaak doen als u wilt totdat het uitbreidingsproces er op de gewenste manier uitziet.

    We hebben nu één query (tabel) die twee gegevensbronnen combineert, die elk zijn vormgegeven om aan onze behoeften te voldoen. Deze query kan een basis zijn voor interessante gegevensverbindingen, zoals statistieken over huisvestingskosten, kwaliteit van leven of criminaliteit in elke staat.

  7. Als u uw wijzigingen wilt toepassen en Power Query-editor wilt sluiten, selecteert u Sluiten en toepassen op het linttabblad Start.

    Het getransformeerde semantische model wordt weergegeven in Power BI Desktop, klaar om te worden gebruikt voor het maken van rapporten.

    Screenshot of Power Query Editor's Close & Apply button.

Zie de volgende bronnen voor meer informatie over Power BI Desktop en de mogelijkheden ervan: