Uw ML.NET-model verbeteren

Meer informatie over het verbeteren van uw ML.NET model.

Het probleem opnieuw omkaderen

Soms heeft het verbeteren van een model mogelijk niets te maken met de gegevens of technieken die worden gebruikt om het model te trainen. In plaats daarvan kan het zijn dat de verkeerde vraag wordt gesteld. Overweeg om het probleem vanuit verschillende hoeken te bekijken en de gegevens te gebruiken om latente indicatoren en verborgen relaties te extraheren om de vraag te verfijnen.

Geef meer gegevensvoorbeelden op

Net als mensen, hoe meer trainingsalgoritmen krijgen, hoe groter de kans op betere prestaties. Een manier om de modelprestaties te verbeteren, is door meer trainingsgegevensvoorbeelden aan de algoritmen te bieden. Hoe meer gegevens het leert, hoe meer gevallen het correct kan identificeren.

Context toevoegen aan de gegevens

De betekenis van één gegevenspunt kan moeilijk te interpreteren zijn. Door context rond de gegevenspunten te bouwen, kunnen algoritmen en deskundigen betere beslissingen nemen. Het feit dat een huis bijvoorbeeld drie slaapkamers heeft, geeft niet op zichzelf een goede indicatie van de prijs. Als u echter context toevoegt en nu weet dat het zich in een buitenwijk buiten een groot grootstedelijk gebied bevindt waar de gemiddelde leeftijd 38 is, is het gemiddelde inkomen van het huishouden $ 80.000 en scholen bevinden zich in het bovenste 20e percentiel, dan heeft het algoritme meer informatie om zijn beslissingen op te baseren. Al deze context kan worden toegevoegd als invoer aan het machine learning-model als functies.

Zinvolle gegevens en functies gebruiken

Hoewel meer gegevensvoorbeelden en -functies de nauwkeurigheid van het model kunnen verbeteren, kunnen ze ook ruis veroorzaken, omdat niet alle gegevens en functies zinvol zijn. Daarom is het belangrijk om te begrijpen welke functies de functies zijn die het meest van invloed zijn op beslissingen die door het algoritme zijn genomen. Door technieken zoals PFI (Permutation Feature Importance) te gebruiken, kunt u deze opvallende functies identificeren en niet alleen het model uitleggen, maar ook de uitvoer gebruiken als functieselectiemethode om de hoeveelheid ruisfuncties in het trainingsproces te verminderen.

Zie Modelvoorspellingen uitleggen met behulp van De urgentie van permutatiefuncties voor meer informatie over het gebruik van PFI.

Kruisvalidatie

Kruisvalidatie is een trainings- en modelevaluatietechniek waarmee de gegevens worden gesplitst in verschillende partities en meerdere algoritmen worden getraind op deze partities. Deze techniek verbetert de robuustheid van het model door gegevens uit het trainingsproces vast te houden. Naast het verbeteren van de prestaties van ongeziene waarnemingen, kan het in gegevensbeperkingsomgevingen een effectief hulpmiddel zijn voor het trainen van modellen met een kleinere gegevensset.

Ga naar de volgende koppeling voor meer informatie over het gebruik van kruisvalidatie in ML.NET

Hyperparameters afstemmen

Het trainen van machine learning-modellen is een iteratief en verkennend proces. Wat is bijvoorbeeld het optimale aantal clusters bij het trainen van een model met behulp van het K-Means-algoritme? Het antwoord is afhankelijk van veel factoren, zoals de structuur van de gegevens. Als u dat getal zoekt, moet u experimenteren met verschillende waarden voor k en vervolgens de prestaties evalueren om te bepalen welke waarde het beste is. De praktijk van het afstemmen van de parameters die het trainingsproces begeleiden om een optimaal model te vinden, wordt hyperparameterafstemming genoemd.

Een ander algoritme kiezen

Machine learning-taken, zoals regressie en classificatie, bevatten verschillende implementaties van algoritmen. Het kan gebeuren dat het probleem dat u probeert op te lossen en de manier waarop uw gegevens zijn gestructureerd, niet goed in het huidige algoritme past. In dat geval kunt u overwegen een ander algoritme voor uw taak te gebruiken om te zien of deze beter van uw gegevens leert.

De volgende koppeling bevat meer richtlijnen over welk algoritme u wilt kiezen.