Het Personalizer-leergedrag configureren
leermodus biedt u vertrouwen en vertrouwen in de Personalizer-service en de machine learning-mogelijkheden ervan, en biedt u de zekerheid dat de service informatie krijgt die kan worden geleerd van - zonder risico's voor onlineverkeer.
Belangrijk
De leerling-modus (in open bare preview) is alleen beschikbaar in de prijs categorie E0. Zie de prijzen voor meer informatie. U kunt de E0-laag selecteren bij het maken van resources of het uitvoeren van een upgrade naar E0 van het tabblad abonnementen in de Azure Portal. Als u zich op een andere laag bevindt en een upgrade uitvoert naar E0, worden uw bestaande Personaler-resources automatisch gemigreerd naar de laag E0.
Een leermodus
Meld u aan bij de Azure Portalvoor uw Personalizer-resource.
Selecteer op de pagina Configuratie op het tabblad Learning de actie Basislijn retourneren, leer als een student en selecteer vervolgens Opslaan.

Wijzigingen in de bestaande toepassing
Uw bestaande toepassing mag niet wijzigen hoe deze momenteel acties selecteert om weer te geven of hoe de toepassing de waarde, beloning van die actie, bepaalt. De enige wijziging in de toepassing kan de volgorde zijn van de acties die naar de Personalizer Rank API worden verzonden. De actie die momenteel door uw toepassing wordt weergegeven, wordt verzonden als de eerste actie in de actielijst. De Rank-API gebruikt deze eerste actie om uw Personalizer-model te trainen.
Uw toepassing configureren voor het aanroepen van de Rank-API
Als u Personalizer wilt toevoegen aan uw toepassing, moet u de Rank- en Reward-API's aanroepen.
Voeg de Rank API-aanroep toe na het punt in uw bestaande toepassingslogica waar u de lijst met acties en de functies ervan bepaalt. De eerste actie in de lijst met acties moet de actie zijn die is geselecteerd door uw bestaande logica.
Configureer uw code om de actie weer te geven die is gekoppeld aan de beloningsactie-id van het Rank API-antwoord.
Uw toepassing configureren voor het aanroepen van reward-API
Gebruik uw bestaande bedrijfslogica om de beloning van de weergegeven actie te berekenen. De waarde moet tussen 0 en 1 zijn. Verzend deze beloning naar Personalizer met behulp van de Reward API. De beloningswaarde wordt niet onmiddellijk verwacht en kan worden uitgesteld gedurende een bepaalde periode, afhankelijk van uw bedrijfslogica.
Als u de beloning niet binnen de geconfigureerde reward-wachttijd retourneert, wordt in plaats daarvan de standaardbeloning gebruikt.
Evaluatie leermodus
Controleer in Azure Portal pagina Evaluaties voor uw Personalizer-resource de prestaties van het huidige leergedrag.

leermodus biedt de volgende metrische evaluatiegegevens:
- Basislijn : gemiddelde beloning: gemiddelde beloningen van de standaardwaarde van de toepassing (basislijn).
- Personalizer : gemiddelde beloning: Het gemiddelde van het totale aantal beloningen dat Personalizer mogelijk heeft bereikt.
- Verhouding beloningsprestaties over de meest recente 1000 gebeurtenissen: Verhouding van basislijn- en Personalizer-beloning: genormaliseerd over de meest recente 1000 gebeurtenissen.
Gedrag overschakelen naar onlinemodus
Wanneer u bepaalt dat Personalizer is getraind met een gemiddeld rolling gemiddelde van 75-85%, is het model gereed om over te schakelen naar de onlinemodus.
Selecteer in Azure Portal voor uw Personalizer-resource op de pagina Configuratie op het tabblad Learning gedrag de optie De beste actie retourneren en selecteer vervolgens Opslaan.
U hoeft geen wijzigingen aan te brengen in de Rank- en Reward-API-aanroepen.