Filtri dei contenuti

Articolo
01/23/2024

Importante

Il sistema di filtro del contenuto non viene applicato a richieste e completamenti elaborati dal modello Whisper nel servizio Azure OpenAI. Altre informazioni sul modello Whisper in Azure OpenAI.

Il servizio OpenAI di Azure include un sistema di filtro del contenuto che funziona insieme ai modelli di base. Questo sistema funziona eseguendo sia la richiesta che il completamento tramite un insieme di modelli di classificazione volti a rilevare e impedire l'output di contenuto dannoso. Il sistema di filtro del contenuto rileva e agisce su categorie specifiche di contenuto potenzialmente dannoso sia nelle richieste di input che nei completamenti di output. Le variazioni nelle configurazioni dell'API e nella progettazione dell'applicazione potrebbero influire sui completamenti e quindi sul comportamento di filtro.

I modelli di filtro dei contenuti per le categorie odio, sessuale, violenza e autolesionismo sono stati addestrati e testati in modo specifico sulle seguenti lingue: inglese, tedesco, giapponese, spagnolo, francese, italiano, portoghese e cinese. Tuttavia, il servizio può funzionare in molte altre lingue, ma la qualità potrebbe variare. In tutti i casi, è necessario eseguire test personalizzati per assicurarsi che funzioni per l'applicazione.

Oltre al sistema di filtro del contenuto, il servizio Azure OpenAI esegue il monitoraggio per rilevare il contenuto e/o i comportamenti che suggeriscono l'uso del servizio in modo da violare le condizioni del prodotto applicabili. Per altre informazioni sulla comprensione e la mitigazione dei rischi associati all'applicazione, vedere la nota sulla trasparenza per Azure OpenAI. Per altre informazioni su come vengono elaborati i dati per il monitoraggio di filtri e abusi del contenuto, vedere Dati, privacy e sicurezza per il servizio OpenAI di Azure.

Le sezioni seguenti forniscono informazioni sulle categorie di filtro del contenuto, i livelli di gravità del filtro e la relativa configurabilità e gli scenari api da considerare nella progettazione e nell'implementazione dell'applicazione.

Categorie di filtro del contenuto

Il sistema di filtro del contenuto integrato nel servizio OpenAI di Azure contiene:

Modelli di classificazione a più classi neurali volti a rilevare e filtrare il contenuto dannoso; i modelli riguardano quattro categorie (odio, violenza, violenza e autolesionismo) in quattro livelli di gravità (sicuri, bassi, medi e alti). Il contenuto rilevato a livello di gravità "safe" è etichettato nelle annotazioni, ma non è soggetto a filtri e non è configurabile.
Altri modelli di classificazione facoltativi volti a rilevare il rischio di jailbreak e il contenuto noto per testo e codice; questi modelli sono classificatori binari che contrassegnano se il comportamento dell'utente o del modello è qualificato come attacco jailbreak o corrisponde a testo noto o codice sorgente. L'uso di questi modelli è facoltativo, ma l'uso del modello di codice materiale protetto può essere richiesto per la copertura dell'impegno per il copyright del cliente.

Categorie di danni

Categoria	Descrizione
Odio e equità	I danni correlati all'odio e all'equità si riferiscono a qualsiasi contenuto che attacca o usa un linguaggio pejorative o discriminatorio con riferimento a una persona o a gruppi di identità sulla base di determinati attributi diversi di questi gruppi, tra cui razza, etnia, nazionalità, gruppi di identità di genere ed espressione, orientamento sessuale, religione, stato dell'immigrazione, stato della capacità, aspetto personale, e le dimensioni del corpo.  L'equità è preoccupata per garantire che i sistemi di IA considerino equamente tutti i gruppi di persone senza contribuire alle inquietudine sociali esistenti. Analogamente al discorso di odio, i danni correlati all'equità dipendono da un trattamento diverso dei gruppi di identità.
Sessuale	Il linguaggio sessuale descrive il linguaggio correlato ad organi anatomici e genitali, relazioni romantiche, atti ritratti in termini erotici o affettuosi, gravidanza, atti sessuali fisici, inclusi quelli rappresentati come un assalto o un atto violento sessuale forzato contro la volontà, la prostituzione, la pornografia e l'abuso.
Violenza	La violenza descrive il linguaggio relativo alle azioni fisiche destinate a ferire, ferire, danneggiare o uccidere qualcuno o qualcosa del genere; descrive armi, armi e entità correlate, ad esempio fabbricazioni, associazioni, legislazione e così via.
Autolesionismo	L'autolesionismo descrive il linguaggio correlato alle azioni fisiche destinate a ferire intenzionalmente, ferire, danneggiare il corpo o uccidersi.
Rischio di jailbreak	Gli attacchi jailbreak sono prompt degli utenti progettati per provocare il modello di intelligenza artificiale generativa in comportamenti esposti che è stato addestrato per evitare o per interrompere le regole impostate nel messaggio di sistema. Tali attacchi possono variare da un ruolo complesso a una subversione sottile dell'obiettivo di sicurezza.
Materiale protetto per il testo^*	Il testo del materiale protetto descrive il contenuto di testo noto ,ad esempio testi di canzoni, articoli, ricette e contenuti Web selezionati, che possono essere restituiti da modelli linguistici di grandi dimensioni.
Materiale protetto per il codice	Il codice materiale protetto descrive il codice sorgente che corrisponde a un set di codice sorgente da repository pubblici, che possono essere restituiti da modelli di linguaggio di grandi dimensioni senza una corretta citazione dei repository di origine.

^* Se sei un proprietario del materiale di testo e vuoi inviare contenuto di testo per la protezione, invia una richiesta.

Avviso

La scheda Definizioni di gravità in questo documento contiene esempi di contenuto dannoso che potrebbero disturbare alcuni lettori.

Livelli di gravità di odio e equità

Livello di gravità	Descrizione	Testo di esempio
Safe	Il contenuto è sicuro, ma può contenere termini correlati all'odio e all'equità usati in contesti generici e sicuri, ad esempio: Istruzione File media Statistiche ufficiali Cronologia Medicina Scienza Altri contesti simili	`"Black people should not be killed by police or mistreated just because of their skin color."`
Basso	Contenuto che contiene la caratterizzazione positiva o la protezione dei gruppi di identità, visualizza discriminazione, stereotipi e pregiudizi, opinioni o opinioni opinioni o atteggiamenti correlati al parlato di odio o ai gruppi di identità di destinazione. Valuta gli ambiti seguenti: Slurs in research paper, dizionari o media con una citazione diretta Discorso di odio generale destinato a oggetti, individui o gruppi Parlato di odio limitato o rappresentazioni di sentiment negativo in contesti fittizi (ad esempio, giochi, film, letteratura)	`"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."`
Medio	Contenuto che contiene insulti, bullismo, intimidazione, de-umanizzazione o etichettatura di individui o gruppi. Sono inclusi: Linguaggio fittizio e imitando gli attributi dei gruppi di identità Descrizione di individui o gruppi come inferiori o carenti Negazione o demeaning dell'esistenza di gruppi di identità Testi che negano eventi storici, ben documentati e violenti come Olocausto, schiavizzazione o colonizzazione	`"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."`
Alto	Contenuto che contiene il discorso di odio come propaganda minacciosa o chiamata di violenza contro i gruppi di identità, radicalizza, recluta o incita le persone a unirsi agli sforzi estremisti o diffondere il discorso di odio. Sono inclusi: Incendiario, offensivo e volgare linguaggio destinato a individui o gruppi di identità specifici Attestazioni di superiorità per giustificare discriminazione, segregazione o esclusione Testi che contengono qualsiasi forma di glorificazione del simbolismo nazista e SS, KKK e la bandiera confederata al di fuori di impostazioni storiche, educative o artistiche Testi che mostrano la preparazione del crimine d'odio, lodi e glorificazione della violenza contro i gruppi di identità, o che elogiano, glorify, o approvano il genocidio	`"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"`

Livelli di gravità sessuale

Livello di gravità	Descrizione	Testo di esempio
Safe	Il contenuto è sicuro ma può contenere termini sessualmente correlati utilizzati in contesti generici e sicuri, ad esempio: Istruzione Media Statistiche ufficiali Cronologia Medicina Scienza Menzioni di relazioni familiari o romantiche	`"Fewer young adults are having sex than in previous generations."`
Basso	Contenuti che esprimono opinioni pregiudizie, giudicanti o opinioni su argomenti sessualmente correlati o menzioni di termini sessualmente correlati in esperienze fittizie o reali che non sono estremamente grafiche. Sono inclusi: Menzioni di anatomia sessuale o scene sessuali in contesti fittizi e artistici Prescrizioni mediche e diagnosi Esperienze personali, problemi sessuali e traumi con alcuni contenuti grafici, tra cui meccanismi di gestione e risorse	`"We made out for a while, and he started to feel me up. I felt a bulge in his pants."`
Medio	Contenuti che descrivono l'eccitazione sessuale e l'attività in termini espliciti e grafici, includono fantasie su sesso e abuso sessuale. Sono inclusi: Menzioni di stimolazione sessuale e masturbazione Pornografia limitata a affari e prostituzione, scorta, ecc. come carriere senza scene sessuali Pubblicità per prodotti per adulti come giocattoli sessuali Esperienze personali e descrizioni correlate a massaggi sessuali, erotici o tantrici, strip club, spettacoli erotici, attributi e pratiche BDSM	`"We both climaxed at the same time."`
Livello 7	Contenuti che descrivono la richiesta di servizi commerciali sessuali, contenenti descrizioni dettagliate dell'attività sessuale, abusi sessuali violenti e stupri e scambi di potere non consensuali, abusi e voyeurismo. Questo include anche contenuti utilizzati per promuovere, approvare o glorificare atti sessuali estremi o illegali. Sono inclusi: Qualsiasi rappresentazione di materiale sessuale sessuale (CSAM) che include qualsiasi riferimento esplicito o potenziale al sesso di sottosezione Pulitura dei bambini, abuso di bambini e altri sfruttamento minori Riferimenti espliciti o potenziali a incest, zoofilia, necrofilia e così via. Reclutamento del traffico sessuale umano, inclusa la manipolazione delle vittime	`"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."`

Livelli di gravità della violenza

Livello di gravità	Descrizione	Testo di esempio
Safe	Il contenuto è sicuro, ma può contenere termini correlati alla violenza usata in contesti generici e sicuri, ad esempio: Istruzione Media Statistiche ufficiali Storia Medicina Scienza Oggetti comuni quando non vengono usati come armi Sport di caccia o tiro a fuoco e specifiche tecniche di pistola	`"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."`
Basso	Contenuti in contesti fittizi (ad esempio, giochi, letteratura, arti) che raffigurano scene violente o grafiche senza glorificazione, approvazione o mal intento. Sono inclusi: Esperienze personali di violenza (senza intenti violenti) Opinioni pregiudizie, pregiudizio, giudizio o opinioni in merito alla violenza Menzioni di atti violenti e morte a bassa intensità	`"Some people just need to be slapped."`
Medio	Contenuto che contiene rappresentazioni grafiche di violenza e morte a media intensità, nonché fantasie su atti violenti o minacce. Sono inclusi: Testi che mettono la vittima in colpa o raffigurano autori in una luce positiva Riferimenti storici al genocidio e all'Olocausto senza approvazione o glorificazione Riferimenti a sparatorie di massa note senza approvazione o glorificazione Riferimenti a gruppi estremisti terroristici e violenti senza approvazione o glorificazione Testi che cercano consigli o consigli o testi che forniscono istruzioni su come eseguire un atto violento contro un animale, un individuo, un gruppo di individui o un oggetto o un'infrastruttura che può causare danni individuali o di massa Bullismo e intimidazione	`"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."`
Alto	Contenuti che contengono propaganda terroristica o violenta estremista e ideologia violenta su Internet che descrive, elogia, supporta, approva o glorifica uccisioni come parte dell'attività terroristica, gli aiuti offrono a organizzazioni terroristiche o cause. Sono inclusi: Testi che cercano istruzioni sull'affiliazione con gruppi estremisti terroristici e violenti Testi che forniscono istruzioni su come reclutare seguaci, influenzare le persone verso una causa terroristica o ideologia estremista, adottare opinioni radicali o fornire formazione su come operano gruppi terroristici e violenti o fornire informazioni sui loro leader e membri Testi che pianificano e coordinano attacchi su individui o gruppi di persone, inclusi gli eventi di tiro, l'uso di bombe ed esplosivi sull'infrastruttura civile, o attacchi di armi a lama quando vengono eseguiti da non combattenti o non terroristi Contenuto che fa riferimento al lavoro forzato tra cui bambini, servitù domestica, stalking e procedure mediche forzate	`"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."`

Livelli di gravità autolesionismo

Livello di gravità	Descrizione	Testo di esempio
Safe	Il contenuto è sicuro, ma può contenere termini correlati all'autolesionismo usato in contesti generici e sicuri, ad esempio: Statistiche ufficiali Istruzione Media Medico Azioni che descrivono l'autolesionismo accidentale, i suggerimenti per il primo soccorso e così via.	`"Binging and purging may be a warning sign for people with a history of extreme weight loss."`
Basso	Contenuto che contiene riferimenti a personaggi che pianificano o commettono suicidio in un contesto fittizio (ad esempio, letteratura, film) o contengono rappresentazioni di atti autolesionici o suicidi a bassa intensità. Sono inclusi: Opinioni personali distorte, pregiudizio, giudizio o opinioni su autolesionismo Associazioni con disturbi alimentari, cercando o fornendo istruzioni per la perdita di peso drastica e non integra Esperienze personali correlate all'autolesionismo, inclusa la ricerca di un aiuto professionale	`"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"`
Medio	Contenuto che simula vittime o sopravvissuti di autolesionismo, come disturbi alimentari o suicidio, nonché bullismo e intimidazione che incita e promuove atti autolesionisti. Sono inclusi: Autolesionismo presentato come soluzione a un problema Fantasie, desiderio, desideri o esperienze personali su autolesionismo/suicidio Testi che cercano o forniscono consigli, istruzioni o consigli su come eseguire autolesionismo Bullismo e intimidazione che incita e promuove azioni autolesionismo	`"Go kill yourself, you are worthless."`
Alto	Contenuto che include la ricerca di consigli o fornisce istruzioni e metodi su come impegnarsi in autolesionismo che porta alla morte o come commettere suicidio, nonché glorificazione e approvazione del suicidio, o altri tipi gravi di autolesionismo. Sono inclusi: Testi che indicano come scrivere un messaggio di addio alla tua famiglia Auto-decapitazione Bruciare vivo	`"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."`

Contenuto immagine

Avvertenza
Definizioni di gravità

Avviso

La scheda Definizioni di gravità in questo documento contiene esempi di contenuto dannoso che potrebbero disturbare alcuni lettori.

Livelli di gravità di odio e equità

Livello di gravità	Descrizione	Esempio di immagine
Livello 0 : Cassaforte	Il contenuto è sicuro, ma può contenere immagini correlate all'odio e all'equità senza sentimenti o sentimenti neutrali in modi non discriminatori non offensivi nei contesti seguenti o simili a: Giornalistica Cronologica Medico Note legali Didattici Geografica	Bandiere non confederate, ad esempio bandiere di paesi o stati che presentano croci Un'immagine della bandiera union jack della Gran Bretagna Rappresentazione di emancipazione di persone schiavi negli Stati Uniti nelle foto storiche
Livello 2 - Basso	Contenuto che contiene sentimenti positivi, sentimenti falsi positivi o sentimenti negativi, sentimenti distorti che differenziano i gruppi di identità da altri. Questo contenuto è progettato per attivare una risposta emotiva. Valuta gli ambiti seguenti: Protezione Simbolismo nazista, la bandiera confederata, il simbolismo Klux Klan Stereotipi Discriminazione dell'occupazione	Rappresentazioni del movimento "No Hate Speech" (Nessun parlato di odio) Rappresentazioni di candidati di lavoro deprioritizzati, ad esempio candidati con disabilità nelle impostazioni del colloquio
Livello 4 - Medio	Contenuto che contiene un'azione negativa sul sentiment verso i gruppi di identità e altri che portano alla promozione dell'azione contro gruppi di identità e sentimenti di superiorità. Valuta gli ambiti seguenti: Insulto, isolamento, simulazione Bandiera nazista, bandiera confederata, e varianti LGBTQIA+ e merci	Immagini che promuovono la prevenzione sociale di [gruppi di identità] Immagini che illustrano la teoria del miglioramento razziale e l'eugenica
Livello 6 - Alto	Contenuto che contiene sentimenti negativi e discorsi di odio verso i gruppi di identità che portano alla generazione di discorsi di odio o crimini d'odio. Valuta gli ambiti seguenti: Razzismo Attacchi a LGBTQIA+ Disabilitazione Discriminazione basata sul sesso Simbolismo nazista glorificato, bandiera confederata, simbolismo Klux Klan Bandiera confederata violenta	Immagini antisemite che raffigurano la "Croce meridionale" che presenta un saltire blu (croce diagonale) con affiliazione di violenza ovvia (ad esempio pistole in visualizzazione/uso)

Livelli di gravità sessuale

Livello di gravità	Descrizione	Esempio di immagine
Livello 0 - Cassaforte	Il contenuto è sicuro ma contiene immagini sessualmente correlate usate in senso generale. Valuta gli ambiti seguenti: Relazioni familiari e romantiche Nudità non sessuale Clothing Oggetti comuni Posa o attività non sessuale Accoppiamento animale Benessere sessuale	Rappresentazioni di abbracci o di rappresentazioni di contatto fisico non sessuale che raffigurano la visualizzazione fisica di affetto come baciare senza lingua e senza nudità
Livello 2 - Basso	Contenuto che contiene comportamenti sessualmente allusi o atti. Valuta gli ambiti seguenti: Esperienze personali Modellazione della moda Nudità nelle opere d'arte Body art Visualizzazione racy	Rappresentazioni di persone
Livello 4 - Medio	Contenuto che contiene contenuti erotici e/o pornografici commerciali e/o pornografici senza penetrazione fotografica visiva e partecipanti nudi o semi-nudi coinvolti in scene sessuali che devono essere sessualmente eccitate. Valuta gli ambiti seguenti: Modellazione sessuale Nudità morbida nelle opere d'arte Lavori sessuali o negozi Attività sessuale oscurata Backstage di produzione porno Balli pole	Rappresentazioni di rapporti sessuali che possono essere parzialmente occlusi ma ancora chiaramente presenti nell'immagine
Livello 6 - Alto	Contenuto che contiene rappresentazioni esplicite dettagliate di organi sessuali e atti sessuali, inclusi atti illegali. Valuta gli ambiti seguenti: Pornografia dilettante soft core e hard-core Richiesta sessuale Voyeurismo Sesso nelle opere d'arte BDSM senza consenso o stupro Sfruttamento sessuale e abuso di bambini Pulitura dei bambini Incesto	Rappresentazioni di impegni nelle attività sessuali con animali o cadaveri

Livelli di gravità della violenza

Livello di gravità	Descrizione	Esempio di immagine
Livello 0 - Cassaforte	Il contenuto è sicuro, ma contiene immagini correlate alla violenza usate in senso generale. Valuta gli ambiti seguenti: Dormire o posare Oggetti comuni Attività non violente Corde non come un noose Utensili a lama in uso in cucina/cucito Ferite, cicatrici e trattamenti chirurgici Sport di caccia e tiro Giocattolo e finta pistole Pratica di combattimento Danni all'oggetto e vandalismo Simboli terroristici non marchiati	Rappresentazioni di armi non realistiche e strumenti a lama
Livello 2 - Basso	Contenuto che contiene immagini correlate alla violenza e agisce in contesti reali o fittizi con bassa gore. Valuta gli ambiti seguenti: Armi, armi e strumenti a lama in visualizzazione e in uso Cadavere non realistico Violenza non realistica Armi animate Lesioni leggere e esperienza personale Corde come un noose Morte in impostazioni storiche, educative o funerarie Simbolismo terroristico non realistico Corrida	Rappresentazioni delle bandiere dell'ISIS/al-Qaida
Livello 4 - Medio	Contenuto che contiene violenza grafica moderata e atti violenti mirati a un bersaglio identificato. Valuta gli ambiti seguenti: Autopsia Scena del crimine o della morte Morte animale (naturale o cacciata), sacrificio animale, abuso di animali Schiavitù Genocidio e uccisioni di massa in luoghi storici, educativi Macello Violenza domestica e abusi fisici Bullismo Armi e armi in uso contro un bersaglio	Rappresentazioni dell'uso di forza e coercizione per dominare o intimidire aggressivamente un individuo
Livello 6 - Alto	Contenuto che contiene rappresentazioni esplicite dettagliate di violenza e atti violenti in alto gore. Valuta gli ambiti seguenti: Lesioni grafiche e morte Dismemberment, decapitazione, bruciare vivo Scomposizione cadavere Terrorismo, gruppi terroristici e bandiere Lavoro forzato e servitù, procedura medica forzata Stalking Cadavere nel terrorismo e nel crimine di guerra Evento di ripresa Altro estremismo	Rappresentazioni della morte quando eseguite da gruppi terroristici identificabili da bandiere e simboli dell'ISIS

Livelli di gravità autolesionismo

Livello di gravità	Descrizione	Esempio di immagine
Livello 0 - Cassaforte	Il contenuto è sicuro ma contiene immagini correlate all'autolesionismo usate in senso generale. Valuta gli ambiti seguenti: Grasso corporeo basso Atto non autolesionismo Lesioni accidentali al corpo	Rappresentazioni di saltare con un paracadute fuori da un aereo
Livello 2 - Basso	Contenuto che contiene immagini correlate all'autolesionismo e agisce in contesti reali o fittizi con basso gore. Valuta gli ambiti seguenti: Cicatrici Lesioni autolesionismo nel recupero Autolesionismo non realistico Individui o animali emaciati	Rappresentazioni di atti correlati all'autolesionismo, strumenti, lesioni e stato emotivo
Livello 4 - Medio	Contenuto che contiene immagini grafiche moderate correlate all'autolesionismo e al suicidio. Valuta gli ambiti seguenti: Autopsia Scena del crimine o della morte Bullismo	Rappresentazioni dell'uso di forza e coercizione per dominare o intimidire aggressivamente un individuo in autolesionismo
Livello 6 - Alto	Contenuto che contiene rappresentazioni dettagliate esplicite di autolesionismo e suicidio in alto gore. Valuta gli ambiti seguenti: Atto imminente di autolesionismo Azioni autolesionismo Suicidio	Rappresentazioni di suicidio intenzionale, dove una persona si è suicidata saltando fuori un edificio alto

Configurabilità (anteprima)

La configurazione di filtro del contenuto predefinita è impostata per filtrare in base alla soglia di gravità media per tutte e quattro le categorie di danni al contenuto per richieste e completamenti. Ciò significa che il contenuto rilevato a livello di gravità medio o alto viene filtrato, mentre il contenuto rilevato a livello di gravità basso non viene filtrato in base ai filtri di contenuto. La funzionalità di configurabilità è disponibile in anteprima e consente ai clienti di modificare le impostazioni, separatamente per i prompt e i completamenti, per filtrare il contenuto per ogni categoria di contenuto a livelli di gravità diversi, come descritto nella tabella seguente:

Gravità filtrata	Configurabile per le richieste	Configurabile per i completamenti	Descrizione
Basso, medio, elevato	Sì	Sì	Configurazione di filtro più rigorosa. Il contenuto rilevato a livelli di gravità bassi, medi e alti viene filtrato.
Medio, alto	Sì	Sì	Impostazione predefinita. Il contenuto rilevato a livello di gravità basso non viene filtrato, il contenuto a medio e alto viene filtrato.
Alto	Sì	Sì	Il contenuto rilevato a livelli di gravità basso e medio non viene filtrato. Viene filtrato solo il contenuto a livello di gravità elevato.
Nessun filtro	Se approvato^*	Se approvato^*	Nessun contenuto viene filtrato indipendentemente dal livello di gravità rilevato. Richiede l'approvazione^*.

^* Solo i clienti che sono stati approvati per il filtro del contenuto modificato hanno un controllo di filtro completo del contenuto e possono disattivare parzialmente o completamente i filtri di contenuto. Il controllo del filtro dei contenuti non si applica ai filtri dei contenuti per DALL-E (anteprima) o GPT-4 Turbo con Vision (anteprima). Applicare i filtri di contenuto modificati usando questo modulo: Verifica di accesso limitato di Azure OpenAI: filtro contenuto modificato (microsoft.com).Apply for modified content filters using this form: Azure OpenAI Limited Access Review: Modified Content Filtering (microsoft.com).

I clienti sono responsabili di garantire che le applicazioni che integrano Azure OpenAI siano conformi al Codice di comportamento.

Le configurazioni di filtro del contenuto vengono create all'interno di una risorsa in Azure AI Studio e possono essere associate alle distribuzioni. Altre informazioni sulla configurabilità sono disponibili qui.

Dettagli dello scenario

Quando il sistema di filtro del contenuto rileva contenuto dannoso, viene visualizzato un errore nella chiamata API se la richiesta è stata ritenuta inappropriata o nella finish_reason risposta sarà content_filter di indicare che alcuni dei completamenti sono stati filtrati. Quando si compila l'applicazione o il sistema, è consigliabile tenere conto di questi scenari in cui viene filtrato il contenuto restituito dall'API Completamenti, che potrebbe comportare contenuti incompleti. Il modo in cui si agisce su queste informazioni sarà specifico dell'applicazione. Il comportamento può essere riepilogato nei punti seguenti:

I prompt classificati a livello di categoria e gravità filtrata restituiranno un errore HTTP 400.
Le chiamate di completamento non in streaming non restituiscono alcun contenuto quando il contenuto viene filtrato. Il finish_reason valore verrà impostato su content_filter. In rari casi con risposte più lunghe, è possibile restituire un risultato parziale. In questi casi, verrà aggiornato .finish_reason
Per le chiamate di completamento del flusso, i segmenti verranno restituiti all'utente man mano che vengono completati. Il servizio continuerà lo streaming fino a raggiungere un token di arresto, la lunghezza o quando viene rilevato il contenuto classificato a una categoria filtrata e il livello di gravità.