Configurare il ciclo di apprendimento di Personalizza esperienze

Articolo
01/19/2024

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizza esperienze. Il servizio Personalizza esperienze viene ritirato il 1° ottobre 2026.

La configurazione del servizio include il modo in cui vengono trattate le ricompense, la frequenza delle esplorazioni, la frequenza di ripetizione del training del modello e la quantità di dati archiviati.

Configurare il ciclo di apprendimento nella pagina Configurazione, nella portale di Azure per tale risorsa di Personalizza esperienze.

Pianificazione delle modifiche alla configurazione

Poiché alcune modifiche di configurazione reimpostano il modello, è necessario pianificare le modifiche alla configurazione.

Se si prevede di usare la modalità Apprendista, assicurarsi di esaminare la configurazione di Personalizza esperienze prima di passare alla modalità Apprendista.

Impostazioni che includono la reimpostazione del modello

Le azioni seguenti attivano una ripetizione del training del modello usando i dati disponibili fino agli ultimi 2 giorni.

Ricompensa
Esplorazione

Per cancellare tutti i dati, usare la pagina Impostazioni modello e apprendimento .

Configurare i premi per il ciclo di feedback

Configurare il servizio per l'uso dei premi del ciclo di apprendimento. Le modifiche apportate ai valori seguenti reimpostano il modello corrente di Personalizza esperienze e la ripetere il training con gli ultimi 2 giorni di dati.

Configure the reward values for the feedback loop

Valore	Scopo
Tempo di attesa ricompensa	Imposta l'intervallo di tempo durante il quale Personalizza esperienze raccoglierà i valori di ricompensa per una chiamata rank, a partire dal momento in cui viene eseguita la chiamata rank. Questo valore viene impostato domandando: "Per quanto tempo Personalizza esperienze dovrà aspettare le chiamate per le ricompense?" Qualsiasi ricompensa arrivi dopo questo intervallo verrà registrata ma non verrà usata per l'apprendimento.
Ricompensa predefinita	Se Personalizza esperienze non riceve chiamate per le ricompense durante l'intervallo di Reward Wait Time associato a una chiamata a Classifica, verrà assegnata la ricompensa predefinita. Per impostazione predefinita e nella maggior parte degli scenari, la ricompensa predefinita è zero (0).
Aggregazione ricompense	Se si ricevono più ricompense per la stessa chiamata all'API Classifica, viene usato questo metodo di aggregazione: somma o più vecchio. Con quest'ultimo metodo, viene considerato il punteggio più vecchio ricevuto e viene ignorato il resto. Ciò è utile se si desidera una ricompensa univoca tra le chiamate possibilmente duplicate.

Dopo aver modificato questi valori, assicurarsi di selezionare Salva.

Configurare l'esplorazione per consentire l'adattamento del ciclo di apprendimento

La personalizzazione è in grado di individuare nuovi modelli e adattarsi alle modifiche del comportamento dell'utente nel tempo esplorando alternative invece di usare la stima del modello sottoposto a training. Il valore Di esplorazione determina la percentuale di chiamate di classificazione a cui viene data risposta con l'esplorazione.

Le modifiche apportate a questo valore reimpostano il modello corrente di Personalizza esperienze e la ripetere il training con gli ultimi 2 giorni di dati.

The exploration value determines what percentage of Rank calls are answered with exploration

Dopo aver modificato questo valore, assicurarsi di selezionare Salva.

Configurare la frequenza di aggiornamento del modello per il training del modello

La frequenza di aggiornamento del modello imposta la frequenza con cui viene eseguito il training del modello.

Impostazione frequenza	Scopo
1 minuto	Le frequenze di aggiornamento di un minuto sono utili durante il debug del codice di un'applicazione usando Personalizza esperienze, eseguendo demo o testando in modo interattivo gli aspetti di Machine Learning.
15 minuti	Le frequenze di aggiornamento dei modelli elevate sono utili per le situazioni in cui si desidera tenere traccia attentamente delle modifiche nei comportamenti degli utenti. ad esempio nei siti basati su notizie live, contenuto virale oppure offerte su prodotti in tempo reale. In questi scenari si può usare una frequenza di 15 minuti.
1 ora	Nella maggior parte dei casi d'uso, una frequenza di aggiornamento inferiore è efficace.

Model update frequency sets how often a new Personalizer model is retrained.

Dopo aver modificato questo valore, assicurarsi di selezionare Salva.

Conservazione dei dati

Data retention period (Periodo di conservazione dati) imposta il numero di giorni in cui Personalizza esperienze mantiene i log dei dati. I log dei dati passati sono necessari per eseguire le valutazioni offline, usate per misurare l'efficacia di Personalizza esperienze e per ottimizzare i criteri di apprendimento.

Dopo aver modificato questo valore, assicurarsi di selezionare Salva.

Passaggi successivi

Informazioni su come gestire il modello

Configurare il ciclo di apprendimento di Personalizza esperienze

Pianificazione delle modifiche alla configurazione

Impostazioni che includono la reimpostazione del modello

Configurare i premi per il ciclo di feedback

Configurare l'esplorazione per consentire l'adattamento del ciclo di apprendimento

Configurare la frequenza di aggiornamento del modello per il training del modello

Conservazione dei dati

Passaggi successivi

Risorse aggiuntive