Hoe Personalizer werkt
De Personalizer-resource, uw leerlus, gebruikt machine learning om het model te bouwen dat de belangrijkste actie voor uw inhoud voorspelt. Het model wordt uitsluitend getraind op uw gegevens die u naar het model hebt verzonden met de Rank- en Reward-aanroepen. Elke lus is volledig onafhankelijk van elkaar.
Rank- en Reward-API's zijn van invloed op het model
U verzendt acties met functies en contextfuncties naar de Rank-API. De Rank-API besluit een van de volgende te gebruiken:
- Exploit: het huidige model om de beste actie te bepalen op basis van eerdere gegevens.
- Verkennen: selecteer een andere actie in plaats van de bovenste actie. U configureert dit percentage voor uw Personalizer-resource in Azure Portal.
U bepaalt de beloningsscore en verzendt die score naar de Reward-API. De Reward-API:
- Verzamelt gegevens om het model te trainen door de functies en beloningsscores van elke rank-aanroep vast te nemen.
- Gebruikt deze gegevens om het model bij te werken op basis van de configuratie die is opgegeven in Learning beleid.
Uw systeem dat Personalizer aanroept
In de volgende afbeelding ziet u de architectuurstroom voor het aanroepen van de Rank- en Reward-aanroepen:

U verzendt acties met functies en contextfuncties naar de Rank-API.
- Personalizer bepaalt of het huidige model moet worden misbruikt of dat er nieuwe keuzes voor het model moeten worden verkend.
- Het rangschikkingsresultaat wordt verzonden naar EventHub.
De bovenste rangschikking wordt geretourneerd naar uw systeem als beloningsactie-id. Uw systeem presenteert die inhoud en bepaalt een beloningsscore op basis van uw eigen bedrijfsregels.
Uw systeem retourneert de beloningsscore naar de leerlus.
- Wanneer Personalizer de beloning ontvangt, wordt de beloning verzonden naar EventHub.
- De rangschikking en beloning zijn gecorreleerd.
- Het AI-model wordt bijgewerkt op basis van de correlatieresultaten.
- De deferentie-engine wordt bijgewerkt met het nieuwe model.
Personalizer gaat uw model opnieuw trainen
Personalizer gaat uw model opnieuw trainen op basis van uw instelling voor het bijwerken van modelfrequentie op uw Personalizer-resource in Azure Portal.
Personalizer maakt gebruik van alle gegevens die momenteel worden bewaard, op basis van de instelling Gegevensretentie in het aantal dagen op uw Personalizer-resource in de Azure Portal.
Onderzoek achter Personalizer
Personalizer is gebaseerd op geavanceerde wetenschap en onderzoek op het gebied van Reinforcement Learning waaronder publicaties, onderzoeksactiviteiten en onderzoeksgebieden in Microsoft Research.
Volgende stappen
Meer informatie over de belangrijkste scenario's voor Personalizer