Konfigurera inlärningsbeteendet för personanpassare

Lärlingsläge ger dig förtroende och förtroende för personanpassartjänsten och dess maskininlärningsfunktioner och ger dig garantier att tjänsten skickas information som kan läras från – utan att riskera onlinetrafik.

Viktigt

Lärlings läget (i offentlig för hands version) är bara tillgängligt på pris nivån E0. Mer information finns i pris information. Du kan välja E0-nivån vid resurs skapande eller uppgradering till E0 från fliken prenumerationer i Azure Portal. Om du befinner dig på en annan nivå och uppgraderar till E0 kommer dina befintliga personliga resurser att migreras automatiskt till E0-nivån.

Konfigurera Lärlingsläge

  1. Logga in på Azure Portalför din personanpassarresurs.

  2. På sidan Konfiguration går du till Learning för att välja Returnera baslinjeåtgärd, lär dig som en brytning och väljer sedan Spara.

Skärmbild som visar hur du konfigurerar inlärningsbeteendet i Azure Portal

Ändringar i det befintliga programmet

Ditt befintliga program bör inte ändra hur det för närvarande väljer åtgärder att visa eller hur programmet avgör åtgärdens värde och belöning. Den enda ändringen av programmet kan vara ordningen på de åtgärder som skickas till API:et För personanpassare rankning. Den åtgärd som ditt program för närvarande visar skickas som den första åtgärden i åtgärdslistan. RANKNING-API:et använder den här första åtgärden för att träna din personanpassarmodell.

Konfigurera ditt program för att anropa Rank-API:et

För att lägga till Personanpassare i ditt program måste du anropa API:erna rankning och belöning.

  1. Lägg till API-anropet Rank efter den punkt i din befintliga programlogik där du fastställer listan över åtgärder och deras funktioner. Den första åtgärden i åtgärdslistan måste vara den åtgärd som väljs av din befintliga logik.

  2. Konfigurera din kod för att visa den åtgärd som är associerad med Rank API-svarets åtgärds-ID för belöning.

Konfigurera ditt program för att anropa belönings-API

  1. Använd din befintliga affärslogik för att beräkna belöningen för åtgärden som visas. Värdet måste vara i intervallet 0 till 1. Skicka den här belöningen till Personanpassare med hjälp av API:et för belöning. Belöningsvärdet förväntas inte omedelbart och kan fördröjas under en tidsperiod, beroende på din affärslogik.

  2. Om du inte returnerar belöningen inom den konfigurerade väntetiden för belöning används standardbelöning i stället.

Utvärdera Lärlingsläge

På Azure Portal sidan Utvärderingar för din personanpassareresurs granskar du Prestanda för aktuellt inlärningsbeteende.

Skärmbild av granskning av utvärdering av inlärningsbeteendet i Azure Portal

Lärlingsläge innehåller följande utvärderingsmått:

  • Baslinje – genomsnittlig belöning: Genomsnittliga förmåner för programmets standardvärde (baslinje).
  • Personanpassare – genomsnittlig belöning: Genomsnittligt antal totala förmåner Personanpassare skulle potentiellt ha nått.
  • Bedriftsförhållande för belöning över de senaste 1 000 händelserna: Förhållandet mellan baslinje och personanpassad belöning – normaliserat under de senaste 1 000 händelserna.

Växla beteende till onlineläge

När du fastställer att Personanpassaren har tränats med ett genomsnitt på 75–85 % rullande medelvärde är modellen redo att växla till onlineläge.

I Azure Portal för din personanpassarresurs går du till sidan Konfiguration, Learning fliken För funktionssätt väljer du Returnera den bästa åtgärden och väljer sedan Spara.

Du behöver inte göra några ändringar i anropen av ranknings- och belönings-API:et.

Nästa steg