Het Personalizer-leergedrag configureren

leermodus biedt u vertrouwen en vertrouwen in de Personalizer-service en de machine learning-mogelijkheden ervan, en biedt u de zekerheid dat de service informatie krijgt die kan worden geleerd van - zonder risico's voor onlineverkeer.

Belangrijk

De leerling-modus (in open bare preview) is alleen beschikbaar in de prijs categorie E0. Zie de prijzen voor meer informatie. U kunt de E0-laag selecteren bij het maken van resources of het uitvoeren van een upgrade naar E0 van het tabblad abonnementen in de Azure Portal. Als u zich op een andere laag bevindt en een upgrade uitvoert naar E0, worden uw bestaande Personaler-resources automatisch gemigreerd naar de laag E0.

Een leermodus

  1. Meld u aan bij de Azure Portalvoor uw Personalizer-resource.

  2. Selecteer op de pagina Configuratie op het tabblad Learning de actie Basislijn retourneren, leer als een student en selecteer vervolgens Opslaan.

Schermopname van het configureren van leergedrag in de Azure Portal

Wijzigingen in de bestaande toepassing

Uw bestaande toepassing mag niet wijzigen hoe deze momenteel acties selecteert om weer te geven of hoe de toepassing de waarde, beloning van die actie, bepaalt. De enige wijziging in de toepassing kan de volgorde zijn van de acties die naar de Personalizer Rank API worden verzonden. De actie die momenteel door uw toepassing wordt weergegeven, wordt verzonden als de eerste actie in de actielijst. De Rank-API gebruikt deze eerste actie om uw Personalizer-model te trainen.

Uw toepassing configureren voor het aanroepen van de Rank-API

Als u Personalizer wilt toevoegen aan uw toepassing, moet u de Rank- en Reward-API's aanroepen.

  1. Voeg de Rank API-aanroep toe na het punt in uw bestaande toepassingslogica waar u de lijst met acties en de functies ervan bepaalt. De eerste actie in de lijst met acties moet de actie zijn die is geselecteerd door uw bestaande logica.

  2. Configureer uw code om de actie weer te geven die is gekoppeld aan de beloningsactie-id van het Rank API-antwoord.

Uw toepassing configureren voor het aanroepen van reward-API

  1. Gebruik uw bestaande bedrijfslogica om de beloning van de weergegeven actie te berekenen. De waarde moet tussen 0 en 1 zijn. Verzend deze beloning naar Personalizer met behulp van de Reward API. De beloningswaarde wordt niet onmiddellijk verwacht en kan worden uitgesteld gedurende een bepaalde periode, afhankelijk van uw bedrijfslogica.

  2. Als u de beloning niet binnen de geconfigureerde reward-wachttijd retourneert, wordt in plaats daarvan de standaardbeloning gebruikt.

Evaluatie leermodus

Controleer in Azure Portal pagina Evaluaties voor uw Personalizer-resource de prestaties van het huidige leergedrag.

Schermopname van het beoordelen van de evaluatie van het leergedrag in de Azure Portal

leermodus biedt de volgende metrische evaluatiegegevens:

  • Basislijn : gemiddelde beloning: gemiddelde beloningen van de standaardwaarde van de toepassing (basislijn).
  • Personalizer : gemiddelde beloning: Het gemiddelde van het totale aantal beloningen dat Personalizer mogelijk heeft bereikt.
  • Verhouding beloningsprestaties over de meest recente 1000 gebeurtenissen: Verhouding van basislijn- en Personalizer-beloning: genormaliseerd over de meest recente 1000 gebeurtenissen.

Gedrag overschakelen naar onlinemodus

Wanneer u bepaalt dat Personalizer is getraind met een gemiddeld rolling gemiddelde van 75-85%, is het model gereed om over te schakelen naar de onlinemodus.

Selecteer in Azure Portal voor uw Personalizer-resource op de pagina Configuratie op het tabblad Learning gedrag de optie De beste actie retourneren en selecteer vervolgens Opslaan.

U hoeft geen wijzigingen aan te brengen in de Rank- en Reward-API-aanroepen.

Volgende stappen