Konfigurera utbildningsloop för personanpassare

Tjänstkonfigurationen omfattar hur tjänsten behandlar förmåner, hur ofta tjänsten utforskar, hur ofta modellen tränas om och hur mycket data som lagras.

Konfigurera utbildningsloopen på sidan Konfiguration i Azure Portal för den personanpassarresursen.

Planera konfigurationsändringar

Eftersom vissa konfigurationsändringar återställer din modellbör du planera dina konfigurationsändringar.

Om du planerar att använda Lärlingslägebör du granska konfigurationen av Personanpassaren innan du växlar till Lärlingsläge.

Inställningar som omfattar att återställa modellen

Följande åtgärder utlöser en omträning av modellen med hjälp av tillgängliga data fram till de senaste två dagarna.

  • Belöning
  • Utforskning

Om du vill rensa alla dina data använder du sidan Modell- och inlärningsinställningar.

Konfigurera förmåner för feedbackslingan

Konfigurera tjänsten för din utbildningsloops användning av förmåner. Ändringar av följande värden återställer den aktuella personanpassarmodellen och omtränar den med de senaste två dagarnas data.

Konfigurera belöningsvärdena för feedbackslingan

Värde Syfte
Väntetid för belöning Anger hur lång tid personanpassaren ska samla in belöningsvärden för ett Rank-anrop, från och med det ögonblick då Rank-anropet inträffar. Det här värdet ställs in genom att fråga: "Hur länge ska Personanpassaren vänta på rewards-anrop?" All belöning som kommer efter det här fönstret loggas men används inte för inlärning.
Standardbelöning Om inget belöningsanrop tas emot av Personanpassaren under väntetidsfönstret för belöning som är kopplad till ett Rank-anrop tilldelar Personanpassaren standardbelöning. Som standard och i de flesta fall är standardbelöning noll (0).
Belöningsaggregering Om flera förmåner tas emot för samma Rank API-anrop används den här aggregeringsmetoden: sum eller earliest. Tidigaste väljer den tidigaste poängen som tas emot och tar bort resten. Detta är användbart om du vill ha en unik belöning bland eventuellt duplicerade anrop.

När du har ändrat dessa värden väljer du Spara.

Konfigurera utforskning så att inlärningsloopen kan anpassas

Anpassning kan identifiera nya mönster och anpassa sig till ändringar i användarbeteende över tid genom att utforska alternativ i stället för att använda den tränade modellens förutsägelse. Utforskningsvärdet avgör vilken procentandel av rangordningssamtalen som besvaras med utforskning.

Ändringar av det här värdet återställer den aktuella personanpassarmodellen och omtränar den med de senaste två dagarnas data.

Utforskningsvärdet avgör vilken procentandel av rangordningssamtalen som besvaras med utforskning

När du har ändrat det här värdet väljer du Spara.

Konfigurera modelluppdateringsfrekvens för modellträning

Uppdateringsfrekvensen för modellen anger hur ofta modellen tränas.

Inställning för frekvens Syfte
1 minut Uppdateringsfrekvenser på en minut är användbara när du felsöker ett programs kod med Personanpassare, gör demonstrationer eller testar maskininlärningsaspekter interaktivt.
15 minuter Höga modelluppdateringsfrekvenser är användbara i situationer där du vill spåra ändringar i användarbeteenden. Exempel är webbplatser som körs på live-nyheter, viralt innehåll eller liveprodukt. Du kan använda en frekvens på 15 minuter i dessa scenarier.
1 timme I de flesta användningsfall är en lägre uppdateringsfrekvens effektiv.

Uppdateringsfrekvensen för modellen anger hur ofta en ny personanpassarmodell tränas om.

När du har ändrat det här värdet väljer du Spara.

Datakvarhållning

Datalagringsperiod anger hur många dagar Personanpassaren sparar dataloggar. Tidigare dataloggar krävs för att utföra offlineutvärderingar, som används för att mäta effektiviteten hos Personanpassare och optimera Learning princip.

När du har ändrat det här värdet väljer du Spara.

Nästa steg

Lär dig hur du hanterar din modell