Funzionamento di Personalizza esperienze

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizza esperienze. Il servizio Personalizza esperienze viene ritirato il 1° ottobre 2026.

La risorsa Personalizza esperienze, il ciclo di apprendimento, usa l'apprendimento automatico per creare il modello che stima l'azione principale per il contenuto. Il training del modello viene eseguito esclusivamente sui dati inviati con le chiamate Rank e Reward . Ogni ciclo è completamente indipendente l'uno dall'altro.

Le API classificazione e ricompensa influisce sul modello

Si inviano azioni con funzionalità di funzionalità e contesto all'API Classificazione. L'API Classifica decide di usare:

  • Exploit: modello corrente per decidere l'azione migliore in base ai dati passati.
  • Esplora: selezionare un'azione diversa anziché l'azione principale. Questa percentuale viene configurata per la risorsa di Personalizza esperienze nella portale di Azure.

Si determina il punteggio di ricompensa e si invia tale punteggio all'API Ricompensa. l'API Ricompensa:

  • Raccoglie i dati per eseguire il training del modello registrando le caratteristiche e i punteggi di ricompensa di ogni chiamata a Classifica.
  • Usa tali dati per aggiornare il modello in base alla configurazione specificata nei criteri di apprendimento.

Il sistema chiama Personalizza esperienze

L'immagine seguente mostra il flusso architetturale delle chiamate a Classifica e Ricompensa:

alt text

  1. Si inviano azioni con funzionalità di funzionalità e contesto all'API Classificazione.

    • Personalizza esperienze decide se sfruttare il modello corrente o esplorare nuove scelte per il modello.
    • Il risultato della classificazione viene inviato all'hub eventi.
  2. Il rango superiore viene restituito al sistema come ID azione ricompensa. Il sistema presenta il contenuto e determina un punteggio di ricompensa in base alle regole di business.

  3. Il sistema restituisce il punteggio di ricompensa al ciclo di apprendimento.

    • Quando Personalizza esperienze riceve la ricompensa, la invia all'hub eventi.
    • La classifica e la ricompensa sono correlate.
    • Il modello di intelligenza artificiale viene aggiornato in base ai risultati della correlazione.
    • Il motore di inferenza viene aggiornato con il nuovo modello.

Personalizza esperienze ripete il training del modello

Personalizza esperienze ripete il training del modello in base all'impostazione di aggiornamento della frequenza del modello nella risorsa personalizza esperienze nella portale di Azure.

Personalizza esperienze usa tutti i dati attualmente conservati, in base all'impostazione Conservazione dati in numero di giorni nella risorsa personalizza esperienze nel portale di Azure.

Ricerca alla base di Personalizza esperienze

Personalizza esperienze si basa su dati scientifici e ricerche nel campo dell'apprendimento per rinforzo, tra cui documenti, attività di ricerca e aree di studio in corso in Microsoft Research.

Passaggi successivi

Informazioni sugli scenari principali per Personalizza esperienze