De hulpprogramma's voor gegevensprofilering gebruiken

De hulpprogramma's voor gegevensprofilering bieden nieuwe en intuïtieve manieren om gegevens op te schonen, te transformeren en te begrijpen in Power Query Editor. Deze omvatten:

  • Kolomkwaliteit

  • Kolomdistributie

  • Kolomprofiel

Als u de hulpprogramma's voor gegevensprofilering wilt inschakelen, gaat u naar het tabblad Weergave op het lint. Schakel de want-opties in de groep Gegevensvoorbeeld in, zoals wordt weergegeven in de volgende afbeelding.

Hulpprogramma's voor gegevensprofilering.

Nadat u de opties hebt ingeschakeld, ziet u iets als de volgende afbeelding in Power Query Editor.

Hulpprogramma's voor gegevensprofilering ingeschakeld.

Notitie

Standaard voert Power Query deze gegevensprofilering uit voor de eerste 1000 rijen van uw gegevens. Als u deze wilt laten uitvoeren voor de hele gegevensset, controleert u de linkerbenedenhoek van het editorvenster om te wijzigen hoe kolomprofilering wordt uitgevoerd.

Kolomkwaliteit

De functie kolomkwaliteit labelt waarden in rijen in vijf categorieën:

  • Geldig, weergegeven in het groen.

  • Fout, die rood wordt weergegeven.

  • Leeg, weergegeven in donkergrijs.

  • Onbekend, weergegeven in het groen met streepjes. Geeft aan dat wanneer er fouten in een kolom zijn, de kwaliteit van de resterende gegevens onbekend is.

  • Onverwachte fout, rood stippelend weergegeven.

Deze indicatoren worden direct onder de naam van de kolom weergegeven als onderdeel van een klein staafdiagram, zoals wordt weergegeven in de volgende afbeelding.

Verbeterde weergave van het staafdiagram met indicatoren voor gegevenskwaliteit en labels boven elke kolom in de tabel.

Het aantal records in elke kolomkwaliteitscategorie wordt ook weergegeven als een percentage.

Als u de muisaanwijzer over een van de kolommen beweegt, ziet u de numerieke verdeling van de kwaliteit van waarden in de kolom. Als u daarnaast de knop met het beletselteken (...) selecteert, worden er enkele snelle actieknoppen geopend voor bewerkingen op de waarden.

Distributie van namenkolom met 701 geldige namen (100 procent), nul fouten en nul leeg, met opdrachten voor snelle acties weergegeven.

Kolomdistributie

Deze functie biedt een set visuals onder de namen van de kolommen die de frequentie en distributie van de waarden in elk van de kolommen laten zien. De gegevens in deze visualisaties worden in aflopende volgorde gesorteerd van de waarde met de hoogste frequentie.

Kolomdistributie.

Door de muisaanwijzer over de distributiegegevens in een van de kolommen te bewegen, krijgt u informatie over de algemene gegevens in de kolom (met uniek aantal en unieke waarden). U kunt ook de knop met het beletselteken selecteren en kiezen uit een menu met beschikbare bewerkingen.

Opties voor kolomdistributies.

Kolomprofiel

Deze functie biedt een uitgebreider inzicht in de gegevens in een kolom. Naast het kolomdistributiediagram bevat het een grafiek met kolomstatistieken. Deze informatie wordt weergegeven onder de sectie voorbeeld van gegevens, zoals wordt weergegeven in de volgende afbeelding.

Kolomprofiel.

Filteren op waarde

U kunt interactie hebben met het waardedistributiediagram aan de rechterkant en een van de balken selecteren door de muisaanwijzer over de delen van de grafiek te bewegen.

Beweeg de muisaanwijzer over de balk in het staafdiagram voor waardedistributie, waarin afzonderlijke gegevens voor die balk worden weergegeven.

Klik met de rechtermuisknop om een set beschikbare transformaties voor die waarde weer te geven.

Geeft het snelmenu weer met beschikbare tranformaties voor één balk in het staafdiagram voor waardedistributie.

Gegevens kopiëren

In de rechterbovenhoek van de secties kolomstatistieken en waardedistributie kunt u de knop met het beletselteken (...) selecteren om het snelmenu Kopiëren weer te geven. Selecteer deze optie om de gegevens die in beide secties worden weergegeven, naar het klembord te kopiëren.

Kolomstatistieken kopiëren.

Groep op waarde

Wanneer u in de rechterbovenhoek van het waardedistributiediagram de knop met het beletselteken (...) selecteert, kunt u naast Kopiëren ook Groeperen op selecteren. Deze functie groepeert de waarden in uw grafiek op basis van een reeks beschikbare opties.

Groeperen op waardedistributie.

In de onderstaande afbeelding ziet u een kolom met productnamen die zijn gegroepeerd op tekstlengte. Nadat de waarden in de grafiek zijn gegroepeerd, kunt u communiceren met afzonderlijke waarden in de grafiek, zoals beschreven in Filteren op waarde.

Nieuw staafdiagram met de verdeling van de tekstlengte van winkelnamen in de kolom Namen van de tabel.