Konfigurera utbildningsloop för personanpassare
Tjänstkonfigurationen omfattar hur tjänsten behandlar förmåner, hur ofta tjänsten utforskar, hur ofta modellen tränas om och hur mycket data som lagras.
Konfigurera utbildningsloopen på sidan Konfiguration i Azure Portal för den personanpassarresursen.
Planera konfigurationsändringar
Eftersom vissa konfigurationsändringar återställer din modellbör du planera dina konfigurationsändringar.
Om du planerar att använda Lärlingslägebör du granska konfigurationen av Personanpassaren innan du växlar till Lärlingsläge.
Inställningar som omfattar att återställa modellen
Följande åtgärder utlöser en omträning av modellen med hjälp av tillgängliga data fram till de senaste två dagarna.
- Belöning
- Utforskning
Om du vill rensa alla dina data använder du sidan Modell- och inlärningsinställningar.
Konfigurera förmåner för feedbackslingan
Konfigurera tjänsten för din utbildningsloops användning av förmåner. Ändringar av följande värden återställer den aktuella personanpassarmodellen och omtränar den med de senaste två dagarnas data.

| Värde | Syfte |
|---|---|
| Väntetid för belöning | Anger hur lång tid personanpassaren ska samla in belöningsvärden för ett Rank-anrop, från och med det ögonblick då Rank-anropet inträffar. Det här värdet ställs in genom att fråga: "Hur länge ska Personanpassaren vänta på rewards-anrop?" All belöning som kommer efter det här fönstret loggas men används inte för inlärning. |
| Standardbelöning | Om inget belöningsanrop tas emot av Personanpassaren under väntetidsfönstret för belöning som är kopplad till ett Rank-anrop tilldelar Personanpassaren standardbelöning. Som standard och i de flesta fall är standardbelöning noll (0). |
| Belöningsaggregering | Om flera förmåner tas emot för samma Rank API-anrop används den här aggregeringsmetoden: sum eller earliest. Tidigaste väljer den tidigaste poängen som tas emot och tar bort resten. Detta är användbart om du vill ha en unik belöning bland eventuellt duplicerade anrop. |
När du har ändrat dessa värden väljer du Spara.
Konfigurera utforskning så att inlärningsloopen kan anpassas
Anpassning kan identifiera nya mönster och anpassa sig till ändringar i användarbeteende över tid genom att utforska alternativ i stället för att använda den tränade modellens förutsägelse. Utforskningsvärdet avgör vilken procentandel av rangordningssamtalen som besvaras med utforskning.
Ändringar av det här värdet återställer den aktuella personanpassarmodellen och omtränar den med de senaste två dagarnas data.

När du har ändrat det här värdet väljer du Spara.
Konfigurera modelluppdateringsfrekvens för modellträning
Uppdateringsfrekvensen för modellen anger hur ofta modellen tränas.
| Inställning för frekvens | Syfte |
|---|---|
| 1 minut | Uppdateringsfrekvenser på en minut är användbara när du felsöker ett programs kod med Personanpassare, gör demonstrationer eller testar maskininlärningsaspekter interaktivt. |
| 15 minuter | Höga modelluppdateringsfrekvenser är användbara i situationer där du vill spåra ändringar i användarbeteenden. Exempel är webbplatser som körs på live-nyheter, viralt innehåll eller liveprodukt. Du kan använda en frekvens på 15 minuter i dessa scenarier. |
| 1 timme | I de flesta användningsfall är en lägre uppdateringsfrekvens effektiv. |

När du har ändrat det här värdet väljer du Spara.
Datakvarhållning
Datalagringsperiod anger hur många dagar Personanpassaren sparar dataloggar. Tidigare dataloggar krävs för att utföra offlineutvärderingar, som används för att mäta effektiviteten hos Personanpassare och optimera Learning princip.
När du har ändrat det här värdet väljer du Spara.