Leerbeleid en -instellingen

Belangrijk

Vanaf 20 september 2023 kunt u geen nieuwe Personalizer-resources maken. De Personalizer-service wordt op 1 oktober 2026 buiten gebruik gesteld.

Leerinstellingen bepalen de hyperparameters van de modeltraining. Twee modellen van dezelfde gegevens die zijn getraind op verschillende leerinstellingen, zullen uiteindelijk anders zijn.

Leerbeleid en -instellingen worden ingesteld op uw Personalizer-resource in Azure Portal.

Leerbeleid importeren en exporteren

U kunt leerbeleidsbestanden importeren en exporteren vanuit Azure Portal. Gebruik deze methode om bestaande beleidsregels op te slaan, te testen, te vervangen en te archiveren in uw broncodebeheer als artefacten voor toekomstige referentie en controle.

Meer informatie over het importeren en exporteren van een leerbeleid in Azure Portal voor uw Personalizer-resource.

Informatie over beleidsinstellingen voor leren

De instellingen in het leerbeleid zijn niet bedoeld om te worden gewijzigd. Wijzig instellingen alleen als u begrijpt hoe deze van invloed zijn op Personalizer. Zonder deze kennis kunt u problemen veroorzaken, waaronder het ongeldig maken van Personalizer-modellen.

Personalizer gebruikt vowpalwabbit om de gebeurtenissen te trainen en te beoordelen. Raadpleeg de vowpalwabbit-documentatie over het bewerken van de leerinstellingen met behulp van vowpalwabbit. Zodra u de juiste opdrachtregelargumenten hebt, slaat u de opdracht op in een bestand met de volgende indeling (vervang de waarde van de eigenschap argumenten door de gewenste opdracht) en uploadt u het bestand om leerinstellingen te importeren in het deelvenster Model en Learning Instellingen in Azure Portal voor uw Personalizer-resource.

Hier volgt .json een voorbeeld van een leerbeleid.

{
  "name": "new learning settings",
  "arguments": " --cb_explore_adf --epsilon 0.2 --power_t 0 -l 0.001 --cb_type mtr -q ::"
}

Leerbeleid vergelijken

U kunt vergelijken hoe verschillende leerbeleidsregels presteren ten opzichte van eerdere gegevens in Personalizer-logboeken door offline evaluaties uit te voeren.

Upload uw eigen leerbeleid om deze te vergelijken met het huidige leerbeleid.

Leerbeleid optimaliseren

Personalizer kan een geoptimaliseerd leerbeleid maken in een offline evaluatie. Een geoptimaliseerd leerbeleid met betere beloningen in een offline evaluatie levert betere resultaten op wanneer het online wordt gebruikt in Personalizer.

Nadat u een leerbeleid hebt geoptimaliseerd, kunt u het rechtstreeks toepassen op Personalizer, zodat het onmiddellijk het huidige beleid vervangt. U kunt ook het geoptimaliseerde beleid opslaan voor verdere evaluatie en later beslissen of u het beleid wilt verwijderen, opslaan of toepassen.

Volgende stappen