Informazioni su Personalizza esperienze

Articolo
01/19/2024

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizza esperienze. Il servizio Personalizza esperienze viene ritirato il 1° ottobre 2026.

Nota

A partire da luglio 2023, i Servizi di Azure AI includono tutti i servizi noti in precedenza come Servizi cognitivi e Servizi di intelligenza artificiale applicata di Azure. Non sono state apportate modifiche ai prezzi. I nomi Servizi cognitivi e intelligenza artificiale app Azure lied continuano a essere usati nelle API di fatturazione, analisi dei costi, listino prezzi e prezzo di Azure. Non sono state apportate modifiche di rilievo alle API (Application Programming Interface) o agli SDK.

Personalizza esperienze di intelligenza artificiale di Azure è un servizio di intelligenza artificiale che le applicazioni prendere decisioni più intelligenti su larga scala usando l'apprendimento per rinforzo. Personalizza esperienze elabora informazioni sullo stato dell'applicazione, dello scenario e/o degli utenti (contesti) e un set di possibili decisioni e attributi correlati (azioni) per determinare la scelta migliore da prendere. Il feedback dell'applicazione (ricompense) viene inviato a Personalizza esperienze per imparare a migliorare la capacità decisionale in tempo quasi reale.

Personalizza esperienze può determinare le azioni migliori da eseguire in diversi scenari:

E-commerce: quale prodotto deve essere mostrato ai clienti per massimizzare la probabilità di un acquisto?
Raccomandazione contenuto: quale articolo deve essere visualizzato per aumentare la frequenza di clic?
Progettazione del contenuto: dove inserire un annuncio pubblicitario per ottimizzare l'engagement degli utenti in un sito Web?
Comunicazione: quando e come deve essere inviata una notifica per massimizzare la probabilità di una risposta?

Per iniziare a usare Personalizza esperienze, seguire la guida introduttiva o provare Personalizza esperienze nel browser con questa demo interattiva.

Questa documentazione contiene i tipi di articoli seguenti:

Le guide introduttive forniscono istruzioni dettagliate per guidare l'utente tramite la configurazione e il codice di esempio per iniziare a effettuare richieste API al servizio.
Le guide pratiche contengono istruzioni per l'uso delle funzionalità di Personalizza esperienze e delle funzionalità avanzate.
Gli esempi di codice illustrano come usare Personalizza esperienze e semplificare l'interfaccia dell'applicazione con il servizio.
Le esercitazioni sono procedure dettagliate più lunghe che implementano Personalizza esperienze come parte di una soluzione aziendale più ampia.
I concetti forniscono altri dettagli sulle funzionalità, le funzionalità e i concetti fondamentali di Personalizza esperienze.

Come funziona Personalizza esperienze?

Personalizza esperienze usa l'apprendimento per rinforzo per selezionare l'azione migliore per un determinato contesto in tutti gli utenti per massimizzare una ricompensa media.

Contesto: informazioni che descrivono lo stato dell'applicazione, dello scenario o dell'utente che potrebbero essere rilevanti per prendere una decisione.
- Esempio: la posizione, il tipo di dispositivo, l'età e gli argomenti preferiti degli utenti che visitano un sito Web.
Azioni: set discreto di elementi che possono essere scelti, insieme agli attributi che descrivono ogni elemento.
- Esempio: set di articoli di notizie e argomenti illustrati in ogni articolo.
Ricompensa: punteggio numerico compreso tra 0 e 1 che indica se la decisione è negativa (0) o buona (1)
- Esempio: "1" indica che un utente ha fatto clic sull'articolo suggerito, mentre "0" indica che l'utente non lo ha fatto.

API classifica e ricompensa

Personalizza esperienze consente di sfruttare la potenza e la flessibilità dell'apprendimento per rinforzo usando solo due API principali.

L'API Rankviene chiamata dall'applicazione ogni volta che è necessario prendere una decisione. L'applicazione invia un codice JSON contenente un set di azioni, funzionalità che descrivono ogni azione e funzionalità che descrivono il contesto corrente. Ogni chiamata API Rank è nota come evento e annotata con un ID evento univoco. Personalizza esperienze restituisce quindi l'ID dell'azione migliore che ottimizza la ricompensa media totale come determinato dal modello sottostante.

L'APIRewardviene chiamata dall'applicazione ogni volta che sono presenti commenti e suggerimenti che consentono a Personalizza esperienze di apprendere se l'ID azione restituito nel valore fornito dalla chiamata di classificazione. Ad esempio, se un utente ha fatto clic sull'articolo delle notizie suggerite o ha completato l'acquisto di un prodotto suggerito. Una chiamata all'API Reward può essere in tempo reale (subito dopo l'esecuzione della chiamata rank) o ritardata per soddisfare meglio le esigenze dello scenario. Il punteggio di ricompensa è determinato dalle metriche e dagli obiettivi aziendali e può essere generato da un algoritmo o regole nell'applicazione. Il punteggio è un numero real-valued compreso tra 0 e 1.

Modalità di apprendimento

Modalità apprendista Simile a come un apprendista impara un mestiere dall'osservazione di un esperto, la modalità apprendista consente a Personalizza esperienze di apprendere osservando la logica decisionale corrente dell'applicazione. Ciò consente di attenuare il cosiddetto problema di avvio a freddo con un nuovo modello non sottoposto a training e consente di convalidare le funzionalità di azione e contesto inviate a Personalizza esperienze. In modalità Apprendista ogni chiamata all'API Classificazione restituisce l'azione di base o l'azione predefinita che rappresenta l'azione che l'applicazione avrebbe eseguito senza usare Personalizza esperienze. Questo viene inviato dall'applicazione a Personalizza esperienze nell'API Classificazione come primo elemento nel set di azioni possibili.
Personalizza esperienze in modalità online restituirà l'azione migliore, in base al contesto, come determinato dal modello di sicurezza a livello di riga sottostante ed esplora altre possibili azioni che potrebbero migliorare le prestazioni. Personalizza esperienze apprende dal feedback fornito nelle chiamate all'API Reward.

Si noti che Personalizza esperienze usa informazioni collettive in tutti gli utenti per apprendere le azioni migliori in base al contesto corrente. Il servizio non esegue le operazioni seguenti:

Rendere persistenti e gestire le informazioni del profilo utente. Gli ID utente univoci non devono essere inviati a Personalizza esperienze.
Registrare le preferenze o i dati cronologici dei singoli utenti.

Scenari di esempio

Ecco alcuni esempi in cui Personalizza esperienze può essere usato per selezionare il contenuto migliore per il rendering per un utente.

Content type	Azioni {features}	Caratteristiche del contesto	ID azione ricompensa restituito (visualizza questo contenuto)
Articoli di notizie	a. `The president...`, {nazionale, politica, [testo]} b. `Premier League ...` {global, sports, [text, image, video]} c. `Hurricane in the ...` {regional, weather, [text,image]}	Country='USA', Recent_Topics=('politica', 'business'), Month='October'	a `The president...`
Film	1. `Star Wars` {1977, [azione, avventura, fantasia], George Lucas} 2. `Hoop Dreams` {1994, [documentario, sport], Steve James} 3. `Casablanca` {1942, [romanticismo, dramma, guerra], Michael Curtiz}	Device='smart TV', Screen_Size='large', Favorite_Genre='classics'	3. `Casablanca`
Prodotti di e-commerce	i. `Product A` {3 kg, $$$$, consegna in 1 giorno} ii. `Product B` {20 kg, $$, consegna in 7 giorni} iii. `Product C` {3 kg, $$$, consegna in 2 giorni}	Device='i Telefono', Spending_Tier='low', Month='June'	ii. `Product B`

Requisiti dello scenario

Usare Personalizza esperienze quando lo scenario include:

Set limitato di azioni o elementi da selezionare in ogni evento di personalizzazione. È consigliabile non più di circa 50 azioni in ogni chiamata API Rank. Se si dispone di un set più ampio di azioni possibili, è consigliabile usare un motore di raccomandazione o un altro meccanismo per ridurre l'elenco di azioni prima di chiamare l'API Rank.
Informazioni che descrivono le azioni (funzionalità di azione).
Informazioni che descrivono il contesto corrente (funzionalità contestuali).
Volume di dati sufficiente per consentire a Personalizza esperienze di apprendere. In generale, è consigliabile almeno circa 1.000 eventi al giorno per consentire a Personalizza esperienze di apprendere in modo efficace. Se Personalizza esperienze non riceve dati sufficienti, il servizio richiede più tempo per determinare le azioni migliori.

Uso responsabile dell'IA

Microsoft si impegna a promuovere l'IA basata su principi che mettono le persone al primo posto. I modelli di intelligenza artificiale come quelli disponibili nel servizio Personalizza esperienze hanno potenziali vantaggi significativi, ma senza un'attenta progettazione e mitigazioni ponderate, tali modelli hanno il potenziale di generare contenuti errati o persino dannosi. Microsoft ha effettuato investimenti significativi per proteggere gli abusi e i danni imprevisti, incorporando i principi di Microsoft per l'uso responsabile dell'IA, creando filtri di contenuto per supportare i clienti e fornendo indicazioni per l'implementazione responsabile dell'IA ai clienti di cui è stato eseguito l'onboarding. Vedere la documentazione sull'intelligenza artificiale responsabile per Personalizza esperienze.

Integrare Personalizza esperienze in un'applicazione

Progettare e pianificare le azioni e il contesto. Determinare come interpretare il feedback come punteggio di ricompensa .

Ogni risorsa di Personalizza esperienze creata viene definita come un ciclo di apprendimento. Il ciclo riceverà sia le chiamate classificazione che ricompensa per il contenuto o l'esperienza utente ed eseguirà il training di un modello di sicurezza a livello di riga sottostante. Ci sono

Tipo di risorsa	Scopo
Modalità apprendista - `E0`	Eseguire il training di Personalizza esperienze per simulare la logica decisionale corrente senza influire sull'applicazione esistente, prima di usare la modalità online per ottenere criteri migliori in un ambiente di produzione.
Modalità online - Standard, `S0`	Personalizza esperienze usa la sicurezza a livello di riga per determinare le azioni migliori nell'ambiente di produzione.
Modalità online - Gratuito, `F0`	Provare Personalizza esperienze in un ambiente non di produzione limitato.

Aggiungere Personalizza esperienze all'applicazione, al sito Web o al sistema:

Aggiungere una chiamata rank a Personalizza esperienze nell'applicazione, nel sito Web o nel sistema per determinare l'azione migliore.
Usare l'azione migliore, come specificato come ID azione ricompensa nello scenario.

Applicare la logica di business al comportamento dell'utente o ai dati di feedback per determinare il punteggio di ricompensa . Ad esempio:

Comportamento	Punteggio di ricompensa calcolato
L'utente ha selezionato un articolo di notizie suggerito da Personalizza esperienze	1
L'utente ha selezionato un articolo di notizie non suggerito da Personalizza esperienze	0
L'utente ha esitato a selezionare un articolo di notizie, scorrere in modo indecisivo e infine ha selezionato l'articolo di notizie suggerito da Personalizza esperienze	0,5

Aggiungere una chiamata Reward per l'invio di un punteggio di ricompensa compreso tra 0 e 1
- Subito dopo la ricezione del feedback.
- In alternativa, in alcuni scenari in cui è previsto un feedback ritardato.
Valutare il ciclo con una valutazione offline dopo un periodo di tempo in cui Personalizza esperienze ha ricevuto dati significativi per prendere decisioni online. Una valutazione offline consente di testare e valutare l'efficacia del servizio Personalizza esperienze senza modifiche al codice o impatto sull'utente.

Passaggi successivi

Guida introduttiva a Personalizza esperienze

Funzionamento di Personalizza esperienze
Vedere le informazioni su cos'è l'apprendimento per rinforzo