Rijen groeperen of samenvatten

In Power Query kunt u waarden in verschillende rijen groeperen in één waarde door de rijen te groeperen op basis van de waarden in een of meer kolommen. U kunt kiezen uit twee typen groeperingsbewerkingen:

  • Een kolom aggregeren met behulp van een statistische functie.

  • Voer een rijbewerking uit.

Voor deze zelfstudie gebruikt u de voorbeeldtabel die wordt weergegeven in de volgende afbeelding.

Voorbeeld van eerste tabel.

Tabel met kolommen met Year (2020), Country (USA, Contact of Canada), Product (Shirt of Shorts), Sales channel (Online of Reseller) en Units (verschillende waarden van 55 tot 7500) :::image-end:::

Waar vind ik de knop Groeperen op?

U vindt de knop Groeperen op op drie plaatsen:

  • Op het tabblad Start in de groep Transformeren.

    Groeper op op het tabblad Start.

  • Op het tabblad Transformeren in de groep Tabel.

    Groepeer op op het tabblad Transformeren.

  • Klik in het snelmenu met de rechtermuisknop om kolommen te selecteren.

    Groeper op in het snelmenu.

Een statistische functie gebruiken om te groepen op een of meer kolommen

In dit voorbeeld is het uw doel om het totale aantal verkochte eenheden op het niveau van het land en verkoopkanaal samen te vatten. U gebruikt de kolommen Country en Sales Channel om de groep op bewerking uit te voeren.

  1. Selecteer Groep op op het tabblad Start.
  2. Selecteer de optie Geavanceerd, zodat u meerdere kolommen kunt selecteren om op te groepen.
  3. Selecteer de kolommen Land en Verkoopkanaal.
  4. Maak in de sectie Nieuwe kolommen een nieuwe kolom waarbij de naam Totaal aantal eenheden is, de aggregatiebewerking Som is en de kolom die wordt gebruikt Eenheden is.
  5. Druk op OK

Groep op dialoogvenster met geaggregeerde kolommen.

Met deze bewerking krijgt u de tabel die u zoekt.

Voorbeelduitvoertabel met geaggregeerde kolommen.

Een rijbewerking uitvoeren om te groepen op een of meer kolommen

In dit voorbeeld wilt u het totale aantal verkochte eenheden en daarnaast wilt u twee andere kolommen met de naam en de verkochte eenheden voor het best presterende product, samengevat op het niveau van het land en — — verkoopkanaal.

Het doel is om een tabel te bereiken die lijkt op de volgende afbeelding uit uw oorspronkelijke voorbeeldtabel.

Voorbeelduitvoertabel met rijbewerkingen.

  1. Gebruik de volgende kolommen als Groep op-kolommen:

    • Land/regio
    • Verkoopkanaal
  2. Maak twee nieuwe kolommen door het volgende te doen:

    1. Aggregatie van de kolom Eenheden met behulp van de bewerking Som. Noem deze kolom Totaal aantal eenheden.
    2. Voeg een nieuwe kolom Producten toe met behulp van de bewerking Alle rijen.

    Groep op dialoogvenster met een niet-geaggregeerde kolom.

Nadat deze bewerking is voltooid, ziet u hoe de kolom Producten [ tabelwaarden in elke cel ] heeft. Elke [ ] tabelwaarde bevat alle rijen die zijn gegroepeerd op de kolommen Land en Verkoopkanaal uit de oorspronkelijke tabel. U kunt de witruimte in de cel selecteren om onderaan het dialoogvenster een voorbeeld van de inhoud van de tabel te bekijken.

Voorbeeldvenster tabeldetails.

Notitie

In het voorbeeldvenster met details worden mogelijk niet alle rijen weergegeven die zijn gebruikt voor de group by-bewerking. U kunt de tabelwaarde selecteren om alle rijen te zien [ die betrekking hebben op de ] bijbehorende group by-bewerking.

Vervolgens moet u de rij met de hoogste waarde in de kolom Eenheden van de tabellen in de nieuwe kolom Producten extraheren en die nieuwe kolom Het beste performerproduct aanroepen.

De productgegevens van de best presterende speler extraheren

Met de nieuwe kolom Producten met tabelwaarden maakt u een nieuwe aangepaste kolom door naar het tabblad Kolom toevoegen op het lint te gaan en Aangepaste kolom te selecteren in de [ ] groep Algemeen.

Voeg een aangepaste kolom toe.

Noem uw nieuwe kolom Top performer product. Voer de formule Table.Max([Products], "Units" ) in onder Aangepaste kolomformule.

Aangepaste kolomformule met Table.Max.

Met het resultaat van die formule wordt een nieuwe kolom gemaakt met [ ] Recordwaarden. Deze recordwaarden zijn in feite een tabel met slechts één rij. Deze records bevatten de rij met de maximumwaarde voor de kolom Eenheden van elke [ ] tabelwaarde in de kolom Producten.

Resultaat van de aangepaste kolomformule met Table.Max.

Met deze nieuwe productkolom Top performer die [ Recordwaarden ] bevat, kunt u de  uitviek selecteren. pictogram voor uitbreiden, selecteer de velden Product en Eenheden en selecteer vervolgens OK.

Vouw de bewerking voor recordwaarde uit in de productkolom Top performer.

Na het verwijderen van de kolom Producten en het instellen van het gegevenstype voor beide zojuist uitgebouwde kolommen, lijkt uw resultaat op de volgende afbeelding.

Laatste tabel met alle transformaties.

Fuzzy groepering

Notitie

De volgende functie is alleen beschikbaar in Power Query Online.

Kijk eens naar de voorbeeldtabel in de volgende afbeelding om te laten zien hoe u fuzzy groepering kunt gebruiken.

Tabel met negen rijen vermeldingen die verschillende spellingen en captilizations van de naam Miguel en William bevatten.

Het doel van fuzzy groepering is het uitvoeren van een group by-bewerking die gebruikmaakt van een algoritme voor overeenkomst voor tekstreeksen. Power Query maakt gebruik van het jaccard-vergelijkbaarheidsalgoritme om de overeenkomst tussen paren exemplaren te meten. Vervolgens wordt agglomeratieve hiërarchische clustering toegepast op het groeperen van exemplaren. In de volgende afbeelding ziet u de uitvoer die u verwacht, waarbij de tabel wordt gegroepeerd op de kolom Person.

Tabel met vermeldingen voor Person als 'Miguel' en 'Mike' en Frequentie als respectievelijk 3 en 2.'

Als u fuzzy groepering wilt uitvoeren, voert u dezelfde stappen uit die eerder in dit artikel zijn beschreven. Het enige verschil is dat u deze keer in het dialoogvenster Groeperen op het selectievakje Fuzzy groepering gebruiken in selecteert.

Het selectievakje Fuzzy groepering in het dialoogvenster Groeperen op.

Voor elke groep rijen kiest Power Query meest voorkomende instantie als het canonieke exemplaar. Als er meerdere exemplaren met dezelfde frequentie optreden, Power Query de eerste instantie. Nadat u OK hebt geselecteerd in het dialoogvenster Groep maken op, krijgt u het resultaat dat u verwachtte.

Definitieve tabel met fuzzy groepering, geen transformatietabel.

U hebt echter meer controle over de bewerking voor fuzzy groepering door Fuzzy groepsopties uit te breiden.

Opties voor fuzzy groepen.

De volgende opties zijn beschikbaar voor fuzzy groepering:

  • Drempelwaarde voor vergelijkbaarheid (optioneel): deze optie geeft aan hoe vergelijkbare twee waarden moeten worden gegroepeerd. De minimale instelling van 0 zorgt ervoor dat alle waarden worden gegroepeerd. De maximale instelling van 1 staat alleen toe dat waarden die exact overeenkomen, worden gegroepeerd. De standaardwaarde is 0,8.
  • Negeren: wanneer u tekstreeksen vergelijkt, wordt de case genegeerd. Deze optie is standaard ingeschakeld.
  • Groeperen door tekstonderdelen te combineren: het algoritme probeert tekstonderdelen te combineren (zoals het combineren van Micro en soft in Microsoft) om waarden te groeperen.
  • Transformatietabel (optioneel): u kunt een transformatietabel selecteren die waarden toewijst (zoals msft toewijzen aan Microsoft) om ze te groeperen.

In dit voorbeeld wordt een transformatietabel gebruikt om te laten zien hoe waarden kunnen worden toegepast. De transformatietabel heeft twee kolommen:

  • Van: de tekenreeks die moet worden op zoek in uw tabel.
  • Naar: de tekenreeks die moet worden gebruikt om de tekenreeks in de kolom Van te vervangen.

In de volgende afbeelding ziet u de transformatietabel die in dit voorbeeld wordt gebruikt.

Tabel met de waarden From van mike en Mike en To van Miguel en Bill.

Belangrijk

Het is belangrijk dat de transformatietabel dezelfde kolommen en kolomnamen heeft als hierboven (ze moeten 'Van' en 'Naar' zijn), anders worden deze niet Power Query herkend.

Ga terug naar het dialoogvenster Group by, vouw Fuzzy groepsopties uit en selecteer vervolgens de vervolgkeuzelijst Transformatietabel.

Vervolgkeuzelijst Voorbeeldtransformatietabel fuzzy groeperen.

Nadat u de transformatietabel hebt geselecteerd, selecteert u OK. Het resultaat van die bewerking geeft u het resultaat dat wordt weergegeven in de volgende afbeelding.

Definitieve voorbeeldtabel fuzzy groeperen met transformatietabel.

In dit voorbeeld is de optie Case negeren ingeschakeld, zodat de waarden in de kolom Van van de tabel Transformatie worden gebruikt om te zoeken naar de tekstreeks zonder rekening te houden met het geval van de tekenreeks. Deze transformatiebewerking vindt eerst plaats en vervolgens wordt de fuzzy groeperingsbewerking uitgevoerd.

Notitie

Wanneer u groepeert op meerdere kolommen, voert de transformatietabel de vervangingsbewerking uit in alle kolommen als het vervangen van de waarde de vergelijkbaarheidsscore verhoogt.

Zie ook

Een aangepaste kolom toevoegen
Dubbele items verwijderen