Filtri dei contenuti

Articolo
05/07/2024

Importante

Il sistema di filtro del contenuto non viene applicato a richieste e completamenti elaborati dal modello Whisper nel Servizio OpenAI di Azure. Altre informazioni sul modello Whisper in Azure OpenAI.

Il servizio OpenAI di Azure include un sistema di filtro dei contenuti che funziona insieme ai modelli di base, inclusi i modelli di generazione di immagini DALL-E. Questo sistema funziona eseguendo sia la richiesta che il completamento tramite un insieme di modelli di classificazione volti a rilevare e impedire l'output di contenuto dannoso. Il sistema di filtro del contenuto rileva e agisce su categorie specifiche di contenuto potenzialmente dannoso sia nelle richieste di input che nei completamenti di output. Le variazioni nelle configurazioni dell'API e nella progettazione dell'applicazione potrebbero influire sui completamenti e quindi sul comportamento di filtro.

I modelli di filtro dei contenuti per le categorie odio, sessuale, violenza e autolesionismo sono stati addestrati e testati in modo specifico sulle seguenti lingue: inglese, tedesco, giapponese, spagnolo, francese, italiano, portoghese e cinese. Tuttavia, il servizio può funzionare in molte altre lingue, ma la qualità potrebbe variare. In tutti i casi, è necessario eseguire test personalizzati per assicurarsi che funzioni per l'applicazione.

Oltre al sistema di filtro del contenuto, il servizio Azure OpenAI esegue il monitoraggio per rilevare il contenuto e/o i comportamenti che suggeriscono l'uso del servizio in modo da violare le condizioni del prodotto applicabili. Per ulteriori informazioni su come comprendere e mitigare i rischi associati alla propria applicazione, consultare la nota sulla trasparenza per Azure OpenAI. Per altre informazioni su come vengono elaborati i dati per il monitoraggio di filtri e abusi del contenuto, vedere Dati, privacy e sicurezza per il servizio OpenAI di Azure.

Le seguenti sezioni forniscono informazioni sulle categorie di filtraggio del contenuto, i livelli di intensità del filtro e la relativa configurabilità, e gli scenari API da considerare nella progettazione e nell'implementazione dell'applicazione.

Categorie di filtraggio del contenuto

Il sistema di filtro del contenuto integrato nel servizio OpenAI di Azure contiene:

Modelli di classificazione a più classi neurali volti a rilevare e filtrare il contenuto dannoso; i modelli riguardano quattro categorie (odio, violenza, violenza e autolesionismo) in quattro livelli di gravità (sicuri, bassi, medi e alti). Il contenuto rilevato a livello di gravità "sicuro" è etichettato nelle annotazioni, ma non è soggetto a filtri e non è configurabile.
Altri modelli di classificazione facoltativi volti a rilevare il rischio di jailbreak e il contenuto noto per testo e codice; questi modelli sono classificatori binari che contrassegnano se il comportamento dell'utente o del modello è qualificato come attacco jailbreak o corrisponde a testo noto o codice sorgente. L'uso di questi modelli è facoltativo, ma l'uso del modello di codice materiale protetto può essere richiesto per la copertura dell'impegno per il copyright del cliente.

Categorie di rischio

Categoria	Descrizione
Odio e equità	I danni correlati all'odio e all'equità si riferiscono a qualsiasi contenuto che attacca o usa un linguaggio pejorative o discriminatorio con riferimento a una persona o a gruppi di identità sulla base di determinati attributi diversi di questi gruppi, tra cui razza, etnia, nazionalità, gruppi di identità di genere ed espressione, orientamento sessuale, religione, stato dell'immigrazione, stato della capacità, aspetto personale, e le dimensioni del corpo.  L'equità è preoccupata per garantire che i sistemi di IA considerino equamente tutti i gruppi di persone senza contribuire alle inquietudine sociali esistenti. Analogamente al discorso di odio, i danni correlati all'equità dipendono da un trattamento diverso dei gruppi di identità.
Contenuti sessuali	Il linguaggio sessuale descrive il linguaggio correlato ad organi anatomici e genitali, relazioni romantiche, atti ritratti in termini erotici o affettuosi, gravidanza, atti sessuali fisici, inclusi quelli rappresentati come un assalto o un atto violento sessuale forzato contro la volontà, la prostituzione, la pornografia e l'abuso.
Violenza	La violenza descrive il linguaggio relativo alle azioni fisiche destinate a ferire, ferire, danneggiare o uccidere qualcuno o qualcosa del genere; descrive armi, armi e entità correlate, ad esempio fabbricazioni, associazioni, legislazione e così via.
Autolesionismo	L'autolesionismo descrive il linguaggio correlato alle azioni fisiche destinate a ferire intenzionalmente, ferire, danneggiare il corpo o uccidersi.
Materiale protetto per il testo^*	Il testo del materiale protetto descrive il contenuto di testo noto ,ad esempio testi di canzoni, articoli, ricette e contenuti Web selezionati, che possono essere restituiti da modelli linguistici di grandi dimensioni.
Materiale protetto per il codice	Il codice materiale protetto descrive il codice sorgente che corrisponde a un set di codice sorgente da repository pubblici, che possono essere restituiti da modelli di linguaggio di grandi dimensioni senza una corretta citazione dei repository di origine.

^* Se sei un proprietario del materiale di testo e vuoi inviare contenuto di testo per la protezione, invia una richiesta.

Protezioni delle richieste

Tipo	Descrizione
Richiedi scudo per attacchi Jailbreak	Gli attacchi jailbreak sono prompt degli utenti progettati per provocare il modello di intelligenza artificiale generativa in comportamenti esposti che è stato sottoposto a training per evitare o per interrompere le regole impostate nel messaggio di sistema. Tali attacchi possono variare da un gioco di ruolo complesso a una subversione sottile dell'obiettivo di sicurezza.
Richiedi scudo per attacchi indiretti	Gli attacchi indiretti, detti anche attacchi di prompt indiretto o attacchi cross-domain prompt injection, rappresentano una potenziale vulnerabilità in cui terze parti inseriscono istruzioni dannose all'interno di documenti a cui il sistema di intelligenza artificiale generativa può accedere ed elaborare. Richiede l'incorporamento e la formattazione dei documenti.

Avviso

La scheda Definizioni di gravità in questo documento contiene esempi di contenuto dannoso che potrebbero disturbare alcuni lettori.

Livelli di gravità di odio e equità

Livello di gravità	Descrizione	Testo di esempio
Safe	Il contenuto è sicuro, ma può contenere termini correlati all'odio e all'equità usati in contesti generici e sicuri, ad esempio: Education File media Statistiche ufficiali Cronologia Medicina Scienza Altri contesti simili	`"Black people should not be killed by police or mistreated just because of their skin color."`
Basso	Contenuto che contiene la caratterizzazione positiva o la protezione dei gruppi di identità, visualizza discriminazione, stereotipi e pregiudizi, opinioni o opinioni opinioni o atteggiamenti correlati al parlato di odio o ai gruppi di identità di destinazione. Valuta gli ambiti seguenti: Slurs in research paper, dizionari o media con una citazione diretta Discorso di odio generale destinato a oggetti, individui o gruppi Parlato di odio limitato o rappresentazioni di sentiment negativo in contesti fittizi (ad esempio, giochi, film, letteratura)	`"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."`
Medio	Contenuto che contiene insulti, bullismo, intimidazione, de-umanizzazione o etichettatura di individui o gruppi. ad esempio: Linguaggio fittizio e imitando gli attributi dei gruppi di identità Descrizione di individui o gruppi come inferiori o carenti Negazione o demeaning dell'esistenza di gruppi di identità Testi che negano eventi storici, ben documentati e violenti come Olocausto, schiavizzazione o colonizzazione	`"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."`
Alto	Contenuto che contiene il discorso di odio come propaganda minacciosa o chiamata di violenza contro i gruppi di identità, radicalizza, recluta o incita le persone a unirsi agli sforzi estremisti o diffondere il discorso di odio. ad esempio: Incendiario, offensivo e volgare linguaggio destinato a individui o gruppi di identità specifici Attestazioni di superiorità per giustificare discriminazione, segregazione o esclusione Testi che contengono qualsiasi forma di glorificazione del simbolismo nazista e SS, KKK e la bandiera confederata al di fuori di impostazioni storiche, educative o artistiche Testi che mostrano la preparazione del crimine d'odio, lodi e glorificazione della violenza contro i gruppi di identità, o che elogiano, glorify, o approvano il genocidio	`"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"`

Livelli di gravità sessuale

Livello di gravità	Descrizione	Testo di esempio
Safe	Il contenuto è sicuro ma può contenere termini sessualmente correlati utilizzati in contesti generici e sicuri, ad esempio: Istruzione Media Statistiche ufficiali Cronologia Medicina Scienza Menzioni di relazioni familiari o romantiche	`"Fewer young adults are having sex than in previous generations."`
Basso	Contenuti che esprimono opinioni pregiudizie, giudicanti o opinioni su argomenti sessualmente correlati o menzioni di termini sessualmente correlati in esperienze fittizie o reali che non sono estremamente grafiche. ad esempio: Menzioni di anatomia sessuale o scene sessuali in contesti fittizi e artistici Prescrizioni mediche e diagnosi Esperienze personali, problemi sessuali e traumi con alcuni contenuti grafici, tra cui meccanismi di gestione e risorse	`"We made out for a while, and he started to feel me up. I felt a bulge in his pants."`
Medio	Contenuti che descrivono l'eccitazione sessuale e l'attività in termini espliciti e grafici, includono fantasie su sesso e abuso sessuale. ad esempio: Menzioni di stimolazione sessuale e masturbazione Pornografia limitata a affari e prostituzione, scorta, ecc. come carriere senza scene sessuali Pubblicità per prodotti per adulti come giocattoli sessuali Esperienze personali e descrizioni correlate a massaggi sessuali, erotici o tantrici, strip club, spettacoli erotici, attributi e pratiche BDSM	`"We both climaxed at the same time."`
Alto	Contenuti che descrivono la richiesta di servizi commerciali sessuali, contenenti descrizioni dettagliate dell'attività sessuale, abusi sessuali violenti e stupri e scambi di potere non consensuali, abusi e voyeurismo. Questo include anche contenuti utilizzati per promuovere, approvare o glorificare atti sessuali estremi o illegali. ad esempio: Qualsiasi rappresentazione di materiale sessuale sessuale (CSAM) che include qualsiasi riferimento esplicito o potenziale al sesso di sottosezione Pulitura dei bambini, abuso di bambini e altri sfruttamento minori Riferimenti espliciti o potenziali a incest, zoofilia, necrofilia e così via. Reclutamento del traffico sessuale umano, inclusa la manipolazione delle vittime	`"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."`

Livelli di gravità della violenza

Livello di gravità	Descrizione	Testo di esempio
Safe	Il contenuto è sicuro, ma può contenere termini correlati alla violenza usata in contesti generici e sicuri, ad esempio: Istruzione Media Statistiche ufficiali Storia Medicina Scienza Oggetti comuni quando non vengono usati come armi Sport di caccia o tiro a fuoco e specifiche tecniche di pistola	`"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."`
Basso	Contenuti in contesti fittizi (ad esempio, giochi, letteratura, arti) che raffigurano scene violente o grafiche senza glorificazione, approvazione o mal intento. ad esempio: Esperienze personali di violenza (senza intenti violenti) Opinioni pregiudizie, pregiudizio, giudizio o opinioni in merito alla violenza Menzioni di atti violenti e morte a bassa intensità	`"Some people just need to be slapped."`
Medio	Contenuto che contiene rappresentazioni grafiche di violenza e morte a media intensità, nonché fantasie su atti violenti o minacce. ad esempio: Testi che mettono la vittima in colpa o raffigurano autori in una luce positiva Riferimenti storici al genocidio e all'Olocausto senza approvazione o glorificazione Riferimenti a sparatorie di massa note senza approvazione o glorificazione Riferimenti a gruppi estremisti terroristici e violenti senza approvazione o glorificazione Testi che cercano consigli o consigli o testi che forniscono istruzioni su come eseguire un atto violento contro un animale, un individuo, un gruppo di individui o un oggetto o un'infrastruttura che può causare danni individuali o di massa Bullismo e intimidazione	`"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."`
Alto	Contenuti che contengono propaganda terroristica o violenta estremista e ideologia violenta su Internet che descrive, elogia, supporta, approva o glorifica uccisioni come parte dell'attività terroristica, gli aiuti offrono a organizzazioni terroristiche o cause. ad esempio: Testi che cercano istruzioni sull'affiliazione con gruppi estremisti terroristici e violenti Testi che forniscono istruzioni su come reclutare seguaci, influenzare le persone verso una causa terroristica o ideologia estremista, adottare opinioni radicali o fornire formazione su come operano gruppi terroristici e violenti o fornire informazioni sui loro leader e membri Testi che pianificano e coordinano attacchi su individui o gruppi di persone, inclusi gli eventi di tiro, l'uso di bombe ed esplosivi sull'infrastruttura civile, o attacchi di armi a lama quando vengono eseguiti da non combattenti o non terroristi Contenuto che fa riferimento al lavoro forzato tra cui bambini, servitù domestica, stalking e procedure mediche forzate	`"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."`

Livelli di gravità autolesionismo

Livello di gravità	Descrizione	Testo di esempio
Safe	Il contenuto è sicuro, ma può contenere termini correlati all'autolesionismo usato in contesti generici e sicuri, ad esempio: Statistiche ufficiali Istruzione Media Medico Azioni che descrivono l'autolesionismo accidentale, i suggerimenti per il primo soccorso e così via.	`"Binging and purging may be a warning sign for people with a history of extreme weight loss."`
Basso	Contenuto che contiene riferimenti a personaggi che pianificano o commettono suicidio in un contesto fittizio (ad esempio, letteratura, film) o contengono rappresentazioni di atti autolesionici o suicidi a bassa intensità. ad esempio: Opinioni personali distorte, pregiudizio, giudizio o opinioni su autolesionismo Associazioni con disturbi alimentari, cercando o fornendo istruzioni per la perdita di peso drastica e non integra Esperienze personali correlate all'autolesionismo, inclusa la ricerca di un aiuto professionale	`"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"`
Medio	Contenuto che simula vittime o sopravvissuti di autolesionismo, come disturbi alimentari o suicidio, nonché bullismo e intimidazione che incita e promuove atti autolesionisti. ad esempio: Autolesionismo presentato come soluzione a un problema Fantasie, desiderio, desideri o esperienze personali su autolesionismo/suicidio Testi che cercano o forniscono consigli, istruzioni o consigli su come eseguire autolesionismo Bullismo e intimidazione che incita e promuove azioni autolesionismo	`"Go kill yourself, you are worthless."`
Alto	Contenuto che include la ricerca di consigli o fornisce istruzioni e metodi su come impegnarsi in autolesionismo che porta alla morte o come commettere suicidio, nonché glorificazione e approvazione del suicidio, o altri tipi gravi di autolesionismo. ad esempio: Testi che indicano come scrivere un messaggio di addio alla tua famiglia Auto-decapitazione Bruciare vivo	`"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."`

Contenuto immagine

Avvertenza
Definizioni di gravità

Avviso

La scheda Definizioni di gravità in questo documento contiene esempi di contenuto dannoso che potrebbero disturbare alcuni lettori.

Livelli di gravità di odio e equità

Livello di gravità	Descrizione	Esempio di immagine
Safe	Il contenuto è sicuro, ma può contenere immagini correlate all'odio e all'equità senza sentimenti o sentimenti neutrali in modi non discriminatori non offensivi nei contesti seguenti o simili a: Giornalistica Cronologica Medico Note legali Didattici Geographical	Bandiere non confederate, ad esempio bandiere di paesi o stati che presentano croci Un'immagine della bandiera union jack della Gran Bretagna Rappresentazione di emancipazione di persone schiavi negli Stati Uniti nelle foto storiche
Basso	Contenuto che contiene sentimenti positivi, sentimenti falsi positivi o sentimenti negativi, sentimenti distorti che differenziano i gruppi di identità da altri. Questo contenuto è progettato per attivare una risposta emotiva. Valuta gli ambiti seguenti: Protezione Simbolismo nazista, la bandiera confederata, il simbolismo Klux Klan Stereotipi Discriminazione dell'occupazione	Rappresentazioni del movimento "No Hate Speech" (Nessun parlato di odio) Rappresentazioni di candidati di lavoro deprioritizzati, ad esempio candidati con disabilità nelle impostazioni del colloquio
Medio	Contenuto che contiene un'azione negativa sul sentiment verso i gruppi di identità e altri che portano alla promozione dell'azione contro gruppi di identità e sentimenti di superiorità. Valuta gli ambiti seguenti: Insulto, isolamento, simulazione Bandiera nazista, bandiera confederata, e varianti LGBTQIA+ e merci	Immagini che promuovono la prevenzione sociale di [gruppi di identità] Immagini che illustrano la teoria del miglioramento razziale e l'eugenica
Alto	Contenuto che contiene sentimenti negativi e discorsi di odio verso i gruppi di identità che portano alla generazione di discorsi di odio o crimini d'odio. Valuta gli ambiti seguenti: Razzismo Attacchi a LGBTQIA+ Disabilitazione Discriminazione basata sul sesso Simbolismo nazista glorificato, bandiera confederata, simbolismo Klux Klan Bandiera confederata violenta	Immagini antisemite che raffigurano la "Croce meridionale" che presenta un saltire blu (croce diagonale) con affiliazione di violenza ovvia (ad esempio pistole in visualizzazione/uso)

Livelli di gravità sessuale

Livello di gravità	Descrizione	Esempio di immagine
Safe	Il contenuto è sicuro ma contiene immagini sessualmente correlate usate in senso generale. Valuta gli ambiti seguenti: Relazioni familiari e romantiche Nudità non sessuale Clothing Oggetti comuni Posa o attività non sessuale Accoppiamento animale Benessere sessuale	Rappresentazioni di abbracci o di rappresentazioni di contatto fisico non sessuale che raffigurano la visualizzazione fisica di affetto come baciare senza lingua e senza nudità
Basso	Contenuto che contiene comportamenti sessualmente allusi o atti. Valuta gli ambiti seguenti: Esperienze personali Modellazione della moda Nudità nelle opere d'arte Body art Visualizzazione racy	Rappresentazioni di persone
Medio	Contenuto che contiene contenuti erotici e/o pornografici commerciali e/o pornografici senza penetrazione fotografica visiva e partecipanti nudi o semi-nudi coinvolti in scene sessuali che devono essere sessualmente eccitate. Valuta gli ambiti seguenti: Modellazione sessuale Nudità morbida nelle opere d'arte Lavori sessuali o negozi Attività sessuale oscurata Backstage di produzione porno Balli pole	Rappresentazioni di rapporti sessuali che possono essere parzialmente occlusi ma ancora chiaramente presenti nell'immagine
Alto	Contenuto che contiene rappresentazioni esplicite dettagliate di organi sessuali e atti sessuali, inclusi atti illegali. Valuta gli ambiti seguenti: Pornografia dilettante soft core e hard-core Richiesta sessuale Voyeurismo Sesso nelle opere d'arte BDSM senza consenso o stupro Sfruttamento sessuale e abuso di bambini Pulitura dei bambini Incesto	Rappresentazioni di impegni nelle attività sessuali con animali o cadaveri

Livelli di gravità della violenza

Livello di gravità	Descrizione	Esempio di immagine
Safe	Il contenuto è sicuro, ma contiene immagini correlate alla violenza usate in senso generale. Valuta gli ambiti seguenti: Dormire o posare Oggetti comuni Attività non violente Corde non come un noose Utensili a lama in uso in cucina/cucito Ferite, cicatrici e trattamenti chirurgici Sport di caccia e tiro Giocattolo e finta pistole Pratica di combattimento Danni all'oggetto e vandalismo Simboli terroristici non marchiati	Rappresentazioni di armi non realistiche e strumenti a lama
Basso	Contenuto che contiene immagini correlate alla violenza e agisce in contesti reali o fittizi con bassa gore. Valuta gli ambiti seguenti: Armi, armi e strumenti a lama in visualizzazione e in uso Cadavere non realistico Violenza non realistica Armi animate Lesioni leggere e esperienza personale Corde come un noose Morte in impostazioni storiche, educative o funerarie Simbolismo terroristico non realistico Corrida	Rappresentazioni delle bandiere dell'ISIS/al-Qaida
Medio	Contenuto che contiene violenza grafica moderata e atti violenti mirati a un bersaglio identificato. Valuta gli ambiti seguenti: Autopsia Scena del crimine o della morte Morte animale (naturale o cacciata), sacrificio animale, abuso di animali Schiavitù Genocidio e uccisioni di massa in luoghi storici, educativi Macello Violenza domestica e abusi fisici Bullismo Armi e armi in uso contro un bersaglio	Rappresentazioni dell'uso di forza e coercizione per dominare o intimidire aggressivamente un individuo
Alto	Contenuto che contiene rappresentazioni esplicite dettagliate di violenza e atti violenti in alto gore. Valuta gli ambiti seguenti: Lesioni grafiche e morte Dismemberment, decapitazione, bruciare vivo Scomposizione cadavere Terrorismo, gruppi terroristici e bandiere Lavoro forzato e servitù, procedura medica forzata Stalking Cadavere nel terrorismo e nel crimine di guerra Evento di ripresa Altro estremismo	Rappresentazioni della morte quando eseguite da gruppi terroristici identificabili da bandiere e simboli dell'ISIS

Livelli di gravità autolesionismo

Livello di gravità	Descrizione	Esempio di immagine
Safe	Il contenuto è sicuro ma contiene immagini correlate all'autolesionismo usate in senso generale. Valuta gli ambiti seguenti: Grasso corporeo basso Atto non autolesionismo Lesioni accidentali al corpo	Rappresentazioni di saltare con un paracadute fuori da un aereo
Basso	Contenuto che contiene immagini correlate all'autolesionismo e agisce in contesti reali o fittizi con basso gore. Valuta gli ambiti seguenti: Cicatrici Lesioni autolesionismo nel recupero Autolesionismo non realistico Individui o animali emaciati	Rappresentazioni di atti correlati all'autolesionismo, strumenti, lesioni e stato emotivo
Medio	Contenuto che contiene immagini grafiche moderate correlate all'autolesionismo e al suicidio. Valuta gli ambiti seguenti: Autopsia Scena del crimine o della morte Bullismo	Rappresentazioni dell'uso di forza e coercizione per dominare o intimidire aggressivamente un individuo in autolesionismo
Alto	Contenuto che contiene rappresentazioni dettagliate esplicite di autolesionismo e suicidio in alto gore. Valuta gli ambiti seguenti: Atto imminente di autolesionismo Azioni autolesionismo Suicidio	Rappresentazioni di suicidio intenzionale, dove una persona si è suicidata saltando fuori un edificio alto

Configurabilità (anteprima)

La configurazione di filtro dei contenuti predefinita per la serie di modelli GPT è impostata per filtrare in base alla soglia di gravità media per tutte e quattro le categorie di danni al contenuto (odio, violenza, sessuale e autolesionismo) e si applica a entrambe le richieste (testo, testo/ immagine multi modale) e completamenti (testo). Ciò significa che il contenuto rilevato a livello di gravità medio o alto viene filtrato, mentre il contenuto rilevato a livello di gravità basso non viene filtrato in base ai filtri di contenuto. Per DALL-E, la soglia di gravità predefinita è impostata su bassa sia per le richieste (testo) che per i completamenti (immagini), quindi viene filtrato il contenuto rilevato a livelli di gravità bassi, medi o alti. La funzionalità di configurabilità è disponibile in anteprima e consente ai clienti di modificare le impostazioni (separatamente per prompt e completamenti) in modo da filtrare contenuto per ogni categoria di contenuto a livelli di gravità diversi, come descritto nella tabella seguente:

Intensità del filtro	Configurabile per richieste	Configurabile per completamenti	Descrizione
Basso, medio, elevato	Sì	Sì	Configurazione di filtraggio più intenso. Il contenuto rilevato a livelli di gravità basso, medio e alto viene filtrato.
Medio, alto	Sì	Sì	Il contenuto rilevato con livello di gravità basso non viene filtrato, il contenuto a livello medio e alto viene filtrato.
Alto	Sì	Sì	Il contenuto rilevato a livelli di gravità basso e medio non viene filtrato. Viene filtrato solo il contenuto a livello di gravità elevato. Richiede approvazione¹.
Nessun filtro	Se approvato¹	Se approvato¹	Nessun contenuto viene filtrato indipendentemente dal livello di gravità rilevato. Richiede approvazione¹.

¹ Per i modelli OpenAI di Azure, solo i clienti che sono stati approvati per il filtro del contenuto modificato hanno un controllo di filtro completo del contenuto e possono disattivare i filtri di contenuto. Applicare i filtri di contenuto modificati tramite questo modulo: Verifica di accesso limitato di OpenAI di Azure: filtri di contenuto modificati e monitoraggio degli abusi (microsoft.com)

Questa funzionalità di anteprima è disponibile per i modelli OpenAI di Azure seguenti:

Serie di modelli GPT (testo)
GPT-4 Turbo Vision 2024-04-09 (testo/immagine multi-modale)
DALL-E 2 e 3 (immagine)

Le configurazioni di filtraggio del contenuto vengono create all'interno di una risorsa in Azure AI Studio e possono essere associate a distribuzioni. Ulteriori informazioni sulla configurabilità sono disponibili qui.

I clienti sono responsabili di garantire che le applicazioni che integrano Azure OpenAI siano conformi al Codice di comportamento.

Dettagli dello scenario

Quando il sistema di filtro del contenuto rileva contenuto dannoso, viene visualizzato un errore nella chiamata API se la richiesta è stata ritenuta inappropriata o nella finish_reason risposta sarà content_filter di indicare che alcuni dei completamenti sono stati filtrati. Quando si compila l'applicazione o il sistema, è consigliabile tenere conto di questi scenari in cui viene filtrato il contenuto restituito dall'API Completamenti, che potrebbe comportare contenuti incompleti. Le misure da prendere in base a questa informazione saranno specifiche all'applicazione. Il comportamento può essere riepilogato nei seguenti punti:

I prompt classificati a livello di categoria e gravità filtrata restituiranno un errore HTTP 400.
Quando il contenuto viene filtrato, le chiamate di completamento non in streaming non restituiscono alcun contenuto. Il valore finish_reason verrà impostato su content_filter. In rari casi di risposte più lunghe, è possibile restituire un risultato parziale. In questi casi, finish_reason verrà aggiornato.
Per le chiamate di completamento del flusso, i segmenti verranno restituiti all'utente man mano che vengono completati. Il servizio continuerà lo streaming fino a raggiungere un token o una lunghezza di arresto, o quando viene rilevato contenuto classificato in una categoria di filtraggio e a un livello di gravità.

Scenario: si invia una chiamata di completamento non in streaming che richiede più output; nessun contenuto è classificato a livello di categoria di filtraggio e di gravità

La tabella seguente illustra i vari modi in cui il filtraggio del contenuto può essere visualizzato:

Codice di risposta HTTP	Comportamento risposta
200	Nei casi in cui tutte le generazioni passano i filtri come configurati, nessun dettaglio di moderazione del contenuto viene aggiunto alla risposta. L'oggetto `finish_reason` per ogni generazione sarà arresto o lunghezza.