Esplorazione

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizza esperienze. Il servizio Personalizza esperienze viene ritirato il 1° ottobre 2026.

Con l'esplorazione Personalizza esperienze è in grado di ottenere risultati ottimali in modo continuo, anche quando cambia il comportamento dell'utente.

Quando Personalizza esperienze riceve una chiamata a Classifica, restituisce un attributo RewardActionID che esegue una delle operazioni seguenti:

  • Usa la pertinenza nota per trovare la corrispondenza con il comportamento utente più probabile basato sul modello di Machine Learning corrente.
  • Usa l'esplorazione, che non individua l'azione con la probabilità più elevata nella classifica.

Personalizza esperienze usa attualmente un algoritmo denominato epsilon greedy per l'esplorazione.

Scelta di un'impostazione di esplorazione

Configurare la percentuale di traffico da usare per l'esplorazione nella pagina configurazione di portale di Azure per Personalizza esperienze. Questa impostazione determina la percentuale di chiamate a Classifica che eseguono l'esplorazione.

Personalizza esperienze determina se esplorare o usare l'azione più probabile del modello in ogni chiamata di classificazione. Questo comportamento è diverso rispetto a quanto accade in un framework A/B che blocca una gestione su ID utente specifici.

Procedure consigliate per la scelta di un'impostazione di esplorazione

La scelta di un'impostazione di esplorazione è una decisione aziendale che riguarda la proporzione di interazioni degli utenti da usare per l'esplorazione al fine di migliorare il modello.

Un'impostazione pari a zero annulla molti dei vantaggi offerti da Personalizza esperienze. Con questa impostazione, Personalizza esperienze non usa alcuna interazione degli utenti per individuare le interazioni migliori. Questo comporta una condizione di stallo, una deviazione e infine una riduzione delle prestazioni del modello.

Un'impostazione su un valore troppo elevato annulla i vantaggi derivanti dall'apprendimento del comportamento degli utenti. L'impostazione dell'esplorazione su 100% implica una sequenza casuale costante e qualsiasi informazione sul comportamento degli utenti non influenzerebbe il risultato.

È importante non modificare il comportamento dell'applicazione in base al fatto che Personalizza esperienze stia esplorando o usando l'azione migliore appresa. Ciò potrebbe causare distorsioni dell'apprendimento e infine una riduzione delle potenziali prestazioni.

Passaggi successivi

Apprendimento per rinforzo