Learning en instellingen

Learning instellingen bepalen de hyperparameters van de modeltraining. Twee modellen met dezelfde gegevens die zijn getraind op verschillende leerinstellingen, zullen uiteindelijk anders zijn.

Learning beleid en instellingen worden ingesteld op uw Personalizer-resource in de Azure Portal.

Leerbeleid importeren en exporteren

U kunt learning-policy-bestanden importeren en exporteren vanuit de Azure Portal. Gebruik deze methode om bestaande beleidsregels op te slaan, te testen, te vervangen en te archiveren in uw broncodebeheer als artefacten voor toekomstige referentie en controle.

Meer informatie over het importeren en exporteren van leerbeleid in de Azure Portal voor uw Personalizer-resource.

Leerbeleidsinstellingen begrijpen

De instellingen in het leerbeleid zijn niet bedoeld om te worden gewijzigd. Wijzig de instellingen alleen als u begrijpt hoe deze van invloed zijn op Personalizer. Zonder deze kennis kunt u problemen veroorzaken, waaronder het ongeldig maken van Personalizer-modellen.

Personalizer gebruikt vowpalwabbit om de gebeurtenissen te trainen en te scoren. Raadpleeg de vowpalwabbit-documentatie over het bewerken van de leerinstellingen met behulp van vowpalwabbit. Zodra u de juiste opdrachtregelargumenten hebt, moet u de opdracht opslaan in een bestand met de volgende indeling (vervang de eigenschapswaarde arguments door de gewenste opdracht) en uploadt u het bestand om leerinstellingen te importeren in het deelvenster Model en Learning Instellingen in de Azure Portal voor uw Personalizer-resource.

Hier volgt .json een voorbeeld van een leerbeleid.

{
  "name": "new learning settings",
  "arguments": " --cb_explore_adf --epsilon 0.2 --power_t 0 -l 0.001 --cb_type mtr -q ::"
}

Leerbeleid vergelijken

U kunt vergelijken hoe verschillende leerbeleidsregels presteren ten opzichte van eerdere gegevens in Personalizer-logboeken door offline-evaluaties uit te voeren.

Upload uw eigen leerbeleid om deze te vergelijken met het huidige leerbeleid.

Leerbeleid optimaliseren

Personalizer kan een geoptimaliseerd leerbeleid maken in een offline-evaluatie. Een geoptimaliseerd leerbeleid met betere beloningen in een offline evaluatie levert betere resultaten op wanneer het online wordt gebruikt in Personalizer.

Nadat u een leerbeleid hebt geoptimaliseerd, kunt u dit rechtstreeks toepassen op Personalizer, zodat het direct het huidige beleid vervangt. U kunt het geoptimaliseerde beleid ook opslaan voor verdere evaluatie en later beslissen of u het wilt verwijderen, opslaan of toepassen.

Volgende stappen