Personalizer-leerlus configureren

Belangrijk

Vanaf 20 september 2023 kunt u geen nieuwe Personalizer-resources maken. De Personalizer-service wordt op 1 oktober 2026 buiten gebruik gesteld.

De serviceconfiguratie omvat hoe de service beloningen behandelt, hoe vaak de service wordt verkend, hoe vaak het model opnieuw wordt getraind en hoeveel gegevens worden opgeslagen.

Configureer de leerlus op de pagina Configuratie in Azure Portal voor die Personalizer-resource.

Configuratiewijzigingen plannen

Omdat sommige configuratiewijzigingen uw model opnieuw instellen, moet u de configuratiewijzigingen plannen.

Als u van plan bent om de apprentice-modus te gebruiken, controleert u de Personalizer-configuratie voordat u overschakelt naar de apprentice-modus.

Instellingen met het opnieuw instellen van het model

Met de volgende acties wordt een hertraining van het model geactiveerd met behulp van gegevens die de afgelopen 2 dagen beschikbaar zijn.

  • Beloning
  • Verkennen

Als u al uw gegevens wilt wissen , gebruikt u de pagina Model- en leerinstellingen .

Beloningen configureren voor de feedbacklus

Configureer de service voor het gebruik van beloningen van uw leerlus. Wijzigingen in de volgende waarden stellen het huidige Personalizer-model opnieuw in en trainen het opnieuw met de laatste 2 dagen aan gegevens.

Configure the reward values for the feedback loop

Waarde Doel
Wachttijd voor beloning Hiermee stelt u de tijdsduur in waarin Personalizer beloningswaarden verzamelt voor een Rank-aanroep, beginnend vanaf het moment dat de Rank-aanroep plaatsvindt. Deze waarde wordt ingesteld door het volgende te vragen: 'Hoe lang moet Personalizer wachten op rewards-oproepen?' Elke beloning die na dit venster binnenkomt, wordt geregistreerd, maar wordt niet gebruikt voor leren.
Standaardbeloning Als er geen beloningsoproep wordt ontvangen door Personalizer tijdens het venster Wachttijd voor beloning dat is gekoppeld aan een Rank-aanroep, wijst Personalizer de standaardbeloning toe. In de meeste scenario's is de Standaardbeloning standaard nul (0).
Aggregatie van beloning Als er meerdere beloningen worden ontvangen voor dezelfde Rank API-aanroep, wordt deze aggregatiemethode gebruikt: som of vroegst. Als eerste wordt de vroegste score gekozen die is ontvangen en wordt de rest verwijderd. Dit is handig als u een unieke beloning wilt tussen mogelijk dubbele aanroepen.

Nadat u deze waarden hebt gewijzigd, moet u Opslaan selecteren.

Verkennen configureren zodat de leerlus kan worden aangepast

Persoonlijke instellingen kunnen nieuwe patronen ontdekken en zich aanpassen aan wijzigingen in het gebruikersgedrag in de loop van de tijd door alternatieven te verkennen in plaats van de voorspelling van het getrainde model te gebruiken. De verkenningswaarde bepaalt welk percentage rank-aanroepen wordt beantwoord met verkenning.

Als u deze waarde wijzigt, wordt het huidige Personalizer-model opnieuw ingesteld en opnieuw getraind met de afgelopen 2 dagen aan gegevens.

The exploration value determines what percentage of Rank calls are answered with exploration

Nadat u deze waarde hebt gewijzigd, moet u Opslaan selecteren.

Frequentie van modelupdates configureren voor modeltraining

De frequentie voor het bijwerken van modellen bepaalt hoe vaak het model wordt getraind.

Frequentie-instelling Doel
1 minuut Updatefrequenties van één minuut zijn handig bij het opsporen van fouten in de code van een toepassing met behulp van Personalizer, het uitvoeren van demo's of het interactief testen van machine learning-aspecten.
15 minuten Hoge frequenties voor modelupdates zijn handig voor situaties waarin u wijzigingen in gebruikersgedrag nauwkeurig wilt bijhouden. Voorbeelden hiervan zijn sites die worden uitgevoerd op live nieuws, virale inhoud of live product bieden. In deze scenario's kunt u een frequentie van 15 minuten gebruiken.
1 uur In de meeste gevallen is een lagere updatefrequentie effectief.

Model update frequency sets how often a new Personalizer model is retrained.

Nadat u deze waarde hebt gewijzigd, moet u Opslaan selecteren.

Gegevensretentie

Gegevensretentieperiode bepaalt hoeveel dagen Personalizer gegevenslogboeken bewaart. Eerdere gegevenslogboeken zijn vereist om offline evaluaties uit te voeren, die worden gebruikt om de effectiviteit van Personalizer te meten en leerbeleid te optimaliseren.

Nadat u deze waarde hebt gewijzigd, moet u Opslaan selecteren.

Volgende stappen

Meer informatie over het beheren van uw model