Utforskning och utnyttjande

Med utforskning kan Personanpassaren fortsätta att leverera bra resultat, även när användarbeteendet ändras.

När Personanpassare tar emot ett Rank-anrop returneras ett RewardActionID som antingen:

  • Använder utnyttjande för att matcha det mest sannolika användarbeteendet baserat på den aktuella maskininlärningsmodellen.
  • Använder utforskning, som inte matchar den åtgärd som har högst sannolikhet i rangordningen.

Personanpassaren använder för närvarande en algoritm som kallas epsilon greedy för att utforska.

Välja en utforskningsinställning

Du konfigurerar procentandelen trafik som ska användas för utforskning Azure Portal sidan Konfiguration för Personanpassare. Den här inställningen avgör procentandelen Rank-anrop som utför utforskning.

Personanpassare avgör om du ska utforska eller utnyttja med den här sannolikheten för varje ranganrop. Detta skiljer sig från beteendet i vissa A/B-ramverk som låser en behandling på specifika användar-ID:er.

Metodtips för att välja en utforskningsinställning

Att välja en utforskningsinställning är ett affärsbeslut om andelen användarinteraktioner att utforska med, för att förbättra modellen.

Om inställningen är noll kommer många av fördelarna med Personanpassare att gå in på noll. Med den här inställningen använder Personanpassaren inga användarinteraktioner för att identifiera bättre användarinteraktioner. Detta leder till modellstagnation, drift och i slutänden lägre prestanda.

En inställning som är för hög kommer inte att ta bort fördelarna med att lära sig av användarbeteendet. Om du ställer in den på 100 % innebär det en konstant slumpmässighet, och alla inlärda beteenden från användarna skulle inte påverka resultatet.

Det är viktigt att inte ändra programmets beteende baserat på om du ser om Personanpassaren utforskar eller utnyttjar. Detta skulle leda till inlärningsfördomar som i slutändan skulle minska den potentiella prestandan.

Nästa steg

Kunskapsförmedling