Belang van permutatiefunctie

In dit artikel wordt beschreven hoe u het onderdeel Urgentie van permutatiefuncties in azure Machine Learning Designer gebruikt om een set belangrijke functies voor uw gegevensset te berekenen. U gebruikt deze scores om te bepalen welke functies u het beste in een model kunt gebruiken.

In dit onderdeel worden functiewaarden willekeurig in willekeurige volgorde gerangschikt, kolom voor kolom. De prestaties van het model worden voor en na gemeten. U kunt een van de standaard metrische gegevens kiezen om de prestaties te meten.

De scores die het onderdeel retourneert, vertegenwoordigen de wijziging in de prestaties van een getraind model, na permutatie. Belangrijke functies zijn meestal gevoeliger voor het schuiflerende proces, zodat ze resulteren in hogere urgentiescores.

Dit artikel bevat een overzicht van de permutatiefunctie, de theoretische basis en de toepassingen in machine learning: Permutatiefunctie urgentie.

Urgentie van permutatiefuncties gebruiken

Voor het genereren van een set functiescores moet u beschikken over een al getraind model en een testgegevensset.

  1. Voeg het onderdeel Urgentie van permutatiefunctie toe aan uw pijplijn. U vindt dit onderdeel in de categorie Functieselectie .

  2. Koppel een getraind model aan de linkerinvoer. Het model moet een regressiemodel of een classificatiemodel zijn.

  3. Koppel een gegevensset aan de rechterkant van de invoer. Kies er bij voorkeur een die verschilt van de gegevensset die u hebt gebruikt voor het trainen van het model. Deze gegevensset wordt gebruikt voor scoren op basis van het getrainde model. Het wordt ook gebruikt voor het evalueren van het model nadat de functiewaarden zijn gewijzigd.

  4. Voer voor Willekeurig seed een waarde in die moet worden gebruikt als seed voor randomisatie. Als u 0 (de standaardinstelling) opgeeft, wordt een getal gegenereerd op basis van de systeemklok.

    Een seed-waarde is optioneel, maar u moet een waarde opgeven als u reproduceerbaarheid wilt tussen uitvoeringen van dezelfde pijplijn.

  5. Selecteer bij Metrische waarde voor het meten van prestaties één metrische waarde die u wilt gebruiken wanneer u de modelkwaliteit na permutatie gaat berekenen.

    Azure Machine Learning Designer ondersteunt de volgende metrische gegevens, afhankelijk van of u een classificatie- of regressiemodel evalueert:

    • Classificatie

      Nauwkeurigheid, precisie, terughalen

    • Regressie

      Precisie, terugroepactie, gemiddelde absolute fout, wortelgemiddelde kwadratische fout, relatieve absolute fout, relatieve kwadratische fout, bepalingscoëfficiënt

    Zie Evaluate Model (Model evalueren) voor een gedetailleerde beschrijving van deze metrische evaluatiegegevens en hoe deze worden berekend.

  6. Verzend de pijplijn.

  7. Het onderdeel levert een lijst met functiekolommen en de bijbehorende scores. De lijst wordt gerangschikt in aflopende volgorde van de scores.

Technische opmerkingen

Permutatie Functie urgentie werkt door willekeurig de waarden van elke functiekolom te wijzigen, één kolom tegelijk. Vervolgens wordt het model geëvalueerd.

De classificaties die het onderdeel biedt, zijn vaak anders dan de classificaties die u krijgt van functieselectie op basis van filters. Functieselectie op basis van filter berekent scores voordat een model wordt gemaakt.

De reden voor het verschil is dat permutatiefunctiebelangen de koppeling tussen een functie en een doelwaarde niet meet. In plaats daarvan wordt vastgelegd hoeveel invloed elke functie heeft op voorspellingen van het model.

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.