Tartalomszűrés

Cikk
05/07/2024

Fontos

A tartalomszűrési rendszer nincs alkalmazva a Whisper modell által feldolgozott kérésekre és befejezésekre az Azure OpenAI Servicesben. További információk a Whisper-modellről az Azure OpenAI-ban.

Az Azure OpenAI Szolgáltatás tartalmaz egy tartalomszűrési rendszert, amely az alapvető modellek mellett működik. Ez a rendszer úgy működik, hogy egyszerre futtatja a parancssort és a befejezést egy besorolási modell együttesén keresztül, amelynek célja a káros tartalom kimenetének észlelése és megakadályozása. A tartalomszűrési rendszer észleli és műveletet hajt végre a potenciálisan káros tartalmak meghatározott kategóriáiban mind a bemeneti kérésekben, mind a kimeneti befejezésekben. Az API-konfigurációk és az alkalmazás kialakításának eltérései hatással lehetnek az eredményekre és így a szűrési viselkedésre is.

A gyűlölet, a szexuális, az erőszak és az önkárosító kategóriák tartalomszűrési modelljeit kifejezetten a következő nyelveken képezték ki és tesztelték: angol, német, japán, spanyol, francia, olasz, portugál és kínai. A szolgáltatás azonban számos más nyelven is működhet, de a minőség eltérő lehet. Minden esetben saját tesztelést kell végeznie, hogy megbizonyosodjon, az Ön alkalmazása esetében is működik.

Az Azure OpenAI szolgáltatás a tartalomszűrési rendszer mellett monitorozást is végez, hogy észlelje azokat a tartalmakat és/vagy viselkedéseket, amelyek a szolgáltatás olyan használatát javasolják, amely megsértheti a vonatkozó termékfeltételeket. Az alkalmazással kapcsolatos kockázatok megértéséről és csökkentéséről az Azure OpenAI átláthatósági megjegyzésében talál további információt. A tartalomszűrés és a visszaélések monitorozása során az adatok feldolgozásával kapcsolatos további információkért tekintse meg az Azure OpenAI szolgáltatás adatait, adatvédelmi és biztonsági adatait.

A következő szakaszok a tartalomszűrési kategóriákról, a szűrési súlyossági szintekről és azok konfigurálhatóságáról, valamint az alkalmazástervezésben és -megvalósításban megfontolandó API-forgatókönyvekről nyújtanak tájékoztatást.

Tartalomszűrési kategóriák

Az Azure OpenAI szolgáltatásba integrált tartalomszűrési rendszer a következőket tartalmazza:

Neurális, többosztályos besorolási modellek a káros tartalmak észlelésére és szűrésére; a modellek négy kategóriát (gyűlölet, szexuális, erőszak és önkárosító) fednek le négy súlyossági szinten (biztonságos, alacsony, közepes és magas). A „biztonságos” súlyossági szinttel észlelt tartalom jegyzetekben van megjelölve, de nem lesz szűrve, és nem konfigurálható.
Egyéb választható besorolási modellek, amelyek célja a feltörési kockázat és a szöveg és a kód ismert tartalmainak észlelése; Ezek a modellek bináris osztályozók, amelyek jelzik, hogy a felhasználó vagy a modell viselkedése jailbreak támadásnak minősül-e, vagy egyezik-e az ismert szövegtel vagy forráskóddal. A modellek használata nem kötelező, de a védett anyagkódmodell használata szükséges lehet az ügyfél szerzői jogi kötelezettségvállalási lefedettségéhez.

Kockázati kategóriák

Kategória	Leírás
Gyűlölet és méltányosság	A gyűlöletkel és méltányossággal kapcsolatos sérelmek minden olyan tartalomra vonatkoznak, amely pejoratív vagy diszkriminatív nyelvet használ egy személyre vagy identitáscsoportra való hivatkozással e csoportok bizonyos megkülönböztető tulajdonságai alapján, beleértve többek között a faji, etnikai, nemzetiségi, nemi identitáscsoportokat és kifejezéseket, a szexuális orientációt, a vallást, a bevándorlási státuszt, a képességi állapotot, a személyes megjelenést, és a test mérete.  A méltányosság annak biztosításával foglalkozik, hogy az AI-rendszerek méltányosan kezeljék az emberek minden csoportját anélkül, hogy hozzájárultak a meglévő társadalmi viszonossághoz. A gyűlöletbeszédhez hasonlóan a méltányossághoz kapcsolódó sérelmek az identitáscsoportok eltérő kezelésén alapulnak.
Szexuális	A szexuális leírások az anatómiai szervekhez és nemi szervekhez, romantikus kapcsolatokhoz, erotikus vagy szeretetteljes kifejezésekben ábrázolt cselekedetekhez, terhességhez, fizikai szexuális aktusokhoz kapcsolódnak, beleértve azokat is, amelyeket testi sértésként vagy erőszakos cselekményként ábrázolnak az ember akarata ellen, prostitúció, pornográfia és visszaélés.
Erőszak	Az erőszak azt a nyelvet írja le, amely olyan fizikai műveletekhez kapcsolódik, amelyek célja, hogy fájdalmat, sérülést, kárt okoznak vagy megöljenek valakit vagy valamit; fegyvereket, fegyvereket és kapcsolódó entitásokat, például gyártásokat, szövetségeket, jogszabályokat stb. ír le.
Önkárosítás	Az önkárosítás olyan fizikai műveletekhez kapcsolódó nyelvet ír le, amelyek célja, hogy szándékosan megsérüljenek, megsérüljenek, megsérüljenek a testeik, vagy megöljék önmagukat.
Védett anyag szöveghez^*	A védett anyag szövege ismert szöveges tartalmakat (például dalszövegeket, cikkeket, recepteket és kiválasztott webes tartalmakat) ír le, amelyeket nagy nyelvi modellek képesek kiadni.
Kód védett anyaga	A védett anyagkód olyan forráskódot ír le, amely megfelel a nyilvános adattárakból származó forráskódkészletnek, amelyet nagy nyelvi modellek képesek a forrástárak megfelelő idézete nélkül kiírni.

^* Ha Ön a szöveges anyagok tulajdonosa, és szeretne szöveges tartalmat küldeni védelem céljából, küldjön be egy kérelmet.

Parancssori pajzsok

Típus	Leírás
Parancssori pajzs a Jailbreak-támadásokhoz	A Jailbreak-támadások olyan felhasználói kérések, amelyek a Generatív AI-modellt olyan viselkedések bemutatására késztetik, amelyeket a rendszerüzenetben beállított szabályok elkerülésére vagy megszegésére képeztek ki. Az ilyen támadások a bonyolult szerepjátéktól a biztonsági célkitűzés finom felforgatásán át változhatnak.
Védelem kérése közvetett támadásokhoz	A közvetett támadások, más néven közvetett parancssori támadások vagy tartományközi parancssori injektálási támadások olyan potenciális biztonsági rések, amelyekben harmadik felek rosszindulatú utasításokat helyeznek el azon dokumentumokon belül, amelyekhez a Generative AI-rendszer hozzáférhet és feldolgozható. Dokumentumbeágyazást és formázást igényel.

Figyelmeztetés

A dokumentum Súlyosságdefiníciók lapja olyan káros tartalmakat tartalmaz, amelyek egyes olvasók számára zavaróak lehetnek.

A gyűlölet és a méltányosság súlyossági szintjei

Súlyossági szint	Leírás	Példaszöveg
Széf	A tartalom biztonságos, de tartalmazhat gyűlölettel és méltányossággal kapcsolatos kifejezéseket általános és biztonságos környezetekben, például: Education Média Hivatalos statisztikák Előzmények Gyógyszer Tudomány Egyéb hasonló környezetek	`"Black people should not be killed by police or mistreated just because of their skin color."`
Alacsony	Az identitáscsoportok pozitív jellemzését vagy védelmét tartalmazó tartalom megkülönböztetést, sztereotípiákat és előítéletes, ítélkezett vagy véleményezett nézeteket vagy hozzáállást jelenít meg a gyűlöletbeszédhez vagy az identitáscsoportok megcélzásához. Ide tartoznak az alábbiak: Zsilipek a kutatási dokumentumokban, szótárakban vagy médiában közvetlen idézettel Általános gyűlöletbeszéd, amely tárgyakat, személyeket vagy csoportokat céloz meg Korlátozott gyűlöletbeszéd vagy a negatív hangulat ábrázolása fiktív kontextusokban (például játék, filmek, irodalom)	`"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."`
Közepes	Az egyének vagy csoportok sértegetését, zaklatását, megfélemlítését, embertelenítését vagy eltérését tartalmazó tartalom. Ez a következőket foglalja magában: Identitáscsoportok attribútumait utánzó és utánzó nyelv Egyének vagy csoportok leírása alsóbbrendűként vagy hiányosként Identitáscsoportok létezésének megtagadása vagy elutasítása Olyan történelmi, jól dokumentált és erőszakos eseményeket tagadó szövegek, mint a holokauszt, a rabszolgaság vagy a gyarmatosítás	`"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."`
Magas	A gyűlöletbeszédet propagandát tartalmazó vagy identitáscsoportokkal szembeni erőszakra felszólító tartalmak radikalizálják, toborozzák vagy arra buzdítják az embereket, hogy csatlakozzanak a szélsőséges erőfeszítésekhez, vagy gyűlöletbeszédet terjesszen. Ez a következőket foglalja magában: Gyújtó, sértő és vulgáris nyelv, amely meghatározott személyeket vagy identitáscsoportokat céloz meg A hátrányos megkülönböztetés, szegregáció vagy kirekesztés igazolására vonatkozó felsőbbrendűségi igények Olyan szövegek, amelyek a náci és SS szimbolizmus, a KKK és a konföderációs zászló bármilyen formáját tartalmazzák a történelmi, oktatási vagy művészeti beállításokon kívül A gyűlölet-bűncselekmények előkészítését, az identitáscsoportok elleni erőszak dicséretét és dicsőítését, illetve a népirtás dicséretét, dicsőítését vagy jóváhagyását megjelenítő szövegek	`"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"`

Szexuális súlyossági szintek

Súlyossági szint	Leírás	Példaszöveg
Széf	A tartalom biztonságos, de tartalmazhat általános és biztonságos környezetekben használt szexuális vonatkozású kifejezéseket, például: Oktatás Média Hivatalos statisztikák Előzmények Gyógyszer Tudomány Családi vagy romantikus kapcsolatok említései	`"Fewer young adults are having sex than in previous generations."`
Alacsony	Olyan tartalom, amely előítéletes, ítélkezett vagy véleményezett nézeteket fejez ki a szexuálisan kapcsolódó témákról, vagy szexuálisan kapcsolódó kifejezéseket említ fiktív vagy valós élményekben, amelyek nem rendkívül grafikusak. Ez a következőket foglalja magában: Említések a szexuális anatómia vagy szex jelenetek fiktív és művészi kontextusban Orvosi rendelvények és diagnózis Személyes élmények, szexuális problémák és traumák néhány grafikus tartalommal, beleértve a megküzdési mechanizmusokat és erőforrásokat	`"We made out for a while, and he started to feel me up. I felt a bulge in his pants."`
Közepes	A szexuális izgalmat és a tevékenységet explicit és grafikus értelemben leíró tartalom magában foglalja a szexről és a szexuális visszaélésről szóló fantáziákat. Ez a következőket foglalja magában: Említések a szexuális stimuláció és maszturbáció Pornó csak üzleti és prostitúcióra, kíséretre stb., szexjelenetek nélküli karrierként Hirdetés felnőtt termékek, például szex játékok Szexuális, erotikus vagy tantrikus masszázsokkal, csíkklubokkal, erotikus bemutatókkal, BDSM-attribútumokkal és gyakorlatokkal kapcsolatos személyes élmények és leírások	`"We both climaxed at the same time."`
7. szint	A szexuális kereskedelmi szolgáltatások igénybevételét leíró tartalom, amely részletes leírást tartalmaz a szexuális tevékenységről, az erőszakos szexuális erőszakról és a nem-konszenzuális hatalomcserékről, a visszaélésekről és a voyeurizmusról. Ide tartoznak azok a tartalmak is, amelyek szélsőséges vagy illegális szexuális cselekedetek reklámozására, jóváhagyására vagy dicsőítésére szolgálnak. Ez a következőket foglalja magában: Gyermek szexuális visszaélés anyagának (CSAM) bármilyen ábrázolása, beleértve a kiskorú nemre való explicit vagy lehetséges hivatkozást Gyermekápolás, gyermekbántalmazás és más gyermekkizsákmányozás Explicit vagy lehetséges hivatkozások a vérfertőzésre, zoofília, nekrofília stb. Emberkereskedelem toborzása, beleértve az áldozat manipulálását	`"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."`

Az erőszak súlyossági szintjei

Súlyossági szint	Leírás	Példaszöveg
Széf	A tartalom biztonságos, de tartalmazhat általános és biztonságos környezetekben használt erőszakkal kapcsolatos kifejezéseket, például: Oktatás Média Hivatalos statisztikák Történelem Gyógyszer Tudomány Gyakori tárgyak, ha nem fegyverként használják Vadászati vagy lövészeti sport és fegyver technikai specifikációk	`"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."`
Alacsony	Olyan fiktív kontextusokban (például játék, irodalom, művészetek) lévő tartalmak, amelyek megdicsőítés, jóváhagyás vagy rossz szándék nélkül ábrázolják az erőszakos vagy grafikus jeleneteket. Ez a következőket foglalja magában: Az erőszak személyes élményei (erőszakos szándék nélkül) Elfogult, előítéletes, ítélkező vagy véleményezett nézet az erőszakról Említések az erőszakos cselekményekről és az alacsony intenzitású halálról	`"Some people just need to be slapped."`
Közepes	Olyan tartalom, amely közepes intenzitású erőszakot és halált ábrázoló ábrákat, valamint erőszakos cselekményekkel vagy fenyegetésekkel kapcsolatos fantáziákat tartalmaz. Ez a következőket foglalja magában: Olyan szövegek, amelyek az áldozatot hibáztatják, vagy az elkövetőket pozitív fényben ábrázolják Történelmi hivatkozások a népirtásra és a holokausztra jóváhagyás vagy dicsőítés nélkül Hivatkozás ismert tömeglövésekre jóváhagyás vagy dicsőítés nélkül Terrorista és erőszakos szélsőséges csoportokra és eseményekre mutató hivatkozások jóváhagyás vagy dicsőítés nélkül Tanácsokat vagy ajánlásokat kérő szövegek, illetve olyan szövegek, amelyek útmutatást adnak arra vonatkozóan, hogyan hajthatnak végre erőszakos cselekményt egy állat, egy egyén, egy egyének egy csoportja vagy egy olyan objektum vagy infrastruktúra ellen, amely egyéni vagy tömeges kárt okozhat Bullying and intimidation	`"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."`
Magas	Olyan tartalom, amely terrorista vagy erőszakos szélsőséges propagandát és erőszakos ideológiát tartalmaz az interneten, amely leírja, dicséri, támogatja, támogatja vagy dicsőíti a terrorcselekmények részeként elkövetett gyilkosságokat, segítséget nyújt a terrorista szervezeteknek vagy okoknak. Ez a következőket foglalja magában: A terrorista és erőszakos szélsőséges csoportokkal való kapcsolatra vonatkozó utasításokat kérő szövegek Olyan szövegek, amelyek útmutatást nyújtanak a követők toborzásához, az emberek terrorista ügy vagy szélsőséges ideológia felé való befolyásolásához, radikális nézetek elfogadásához vagy a terrorista és erőszakos szélsőséges csoportok működésének betanításához, illetve a vezetőik és tagjaik tájékoztatásához Olyan szövegek, amelyek megtervezik és koordinálják az egyének vagy személyek csoportjai elleni támadásokat, beleértve a lövöldözési eseményeket, a bombák és robbanóanyagok polgári infrastruktúrán történő használatát, illetve a nem harcosok vagy nem terroristák által végrehajtott pengefegyveres támadásokat A kényszermunkára hivatkozó tartalom, beleértve a gyermekeket, a házi szolgaságot, a zaklatást és a kényszergyógyintézeti eljárásokat	`"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."`

Önkárosítás súlyossági szintjei

Súlyossági szint	Leírás	Példaszöveg
Széf	A tartalom biztonságos, de tartalmazhat általános és biztonságos környezetekben használt önsértéssel kapcsolatos kifejezéseket, például: Hivatalos statisztikák Oktatás Média Orvosi A véletlen önkárosítást, elsősegélynyújtási tippeket stb. leíró műveletek.	`"Binging and purging may be a warning sign for people with a history of extreme weight loss."`
Alacsony	Olyan tartalom, amely fiktív kontextusban (például irodalomban, filmekben) öngyilkosságot tervező vagy elkövető karakterekre mutató hivatkozásokat tartalmaz, vagy önkárosítást vagy alacsony intenzitású öngyilkosságot ábrázol. Ez a következőket foglalja magában: Személyes elfogult, előítéletes, ítélkező vagy véleményezett vélemény az önkárosításról Az étkezési zavarokkal való összefüggések, a drasztikus és egészségtelen fogyásra vonatkozó utasítások keresése vagy megadása Az önkárosítással kapcsolatos személyes élmények, beleértve a szakmai segítséget	`"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"`
Közepes	Olyan tartalom, amely az önsértés áldozatait vagy túlélőit, például étkezési zavarokat vagy öngyilkosságot, valamint az önkárosítást uszító és támogató zaklatást és megfélemlítést gúnyolja. Ez a következőket foglalja magában: Önsérülés, amely megoldásként jelenik meg egy problémára Fantáziák, vágyak, kívánságok vagy személyes élmények az önkárosításról/öngyilkosságról Olyan szövegek, amelyek tanácsot, útmutatást vagy javaslatot nyújtanak az önkárosítás elvégzésére Terrorcselekmény és megfélemlítés, amely önkárosító cselekedeteket idéz elő és támogat	`"Go kill yourself, you are worthless."`
Magas	Olyan tartalom, amely tanácsadásra irányuló kutatást tartalmaz, vagy útmutatást és módszereket biztosít a halálhoz vezető önkárosítás, az öngyilkosság, valamint az öngyilkosság dicsőítésének és jóváhagyásának, illetve az önkárosítás egyéb súlyos típusainak megismeréséhez. Ez a következőket foglalja magában: Olyan szövegek, amelyek arra utasítják, hogyan írjon búcsúüzenetet a családjának Önálló lefejezés Élve égő	`"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."`

Kép tartalma

Figyelmeztetés
Súlyossági definíciók

Figyelmeztetés

A dokumentum Súlyosságdefiníciók lapja olyan káros tartalmakat tartalmaz, amelyek egyes olvasók számára zavaróak lehetnek.

A gyűlölet és a méltányosság súlyossági szintjei

Súlyossági szint	Leírás	Példa képre
0. szint – Széf	A tartalom biztonságos, de tartalmazhat gyűlölettel és méltányossággal kapcsolatos képeket, amelyek nem tartalmaznak hangulatot vagy semleges hangulatot a megkülönböztetéstől mentes, nem sértő módon a következő kontextusokban vagy hasonlókban: Újságírói Előzmények Orvosi Jogi információk Oktatási Földrajzi	Nem konföderációs jelzők, például kereszteket tartalmazó országok vagy államok lobogói Nagy-Britannia Union Jack zászlajának képe Az USA-ban rabszolgasorba oltott emberek emancipációjának ábrázolása történelmi fotókon
2. szint – Alacsony	Olyan tartalom, amely pozitív véleményeket, hamis pozitív véleményeket vagy negatív, torzított hangulatokat tartalmaz, amelyek megkülönböztetik az identitáscsoportokat másoktól. Ez a tartalom érzelmi reakciót vált ki. Ide tartoznak az alábbiak: Védelem Náci szimbolizmus, a konföderációs zászló, Ku Klux Klan szimbolizmus Sztereotipizálás Foglalkoztatási megkülönböztetés	A "No Hate Speech" mozgalom ábrázolásai a deprioritizált állásjelöltek, például a fogyatékkal élő jelöltek az interjú beállításaiban
4. szint – Közepes	Olyan tartalom, amely negatív hangulati műveletet tartalmaz az identitáscsoportok és más személyek felé, amelyek az identitáscsoportok és a felsőbbrendűség érzései elleni fellépés előmozdításához vezetnek. Ide tartoznak az alábbiak: Sértegetés, elkülönítés, gúnyolás Náci zászló, konföderációs zászló és LMBTQIA+ változatok és áruk	Képek, amelyek elősegítik az [identitáscsoportok] társadalmi elkerülését] A faji fejlődés elméletét és az eugenikát ábrázoló képek
6. szint – Magas	Olyan tartalom, amely negatív hangulatot és gyűlöletbeszédet tartalmaz az identitáscsoportok felé, amelyek gyűlöletbeszéd-generáláshoz vagy gyűlölet-bűncselekményekhez vezetnek. Ide tartoznak az alábbiak: Rasszizmus LMBTQIA+ támadások Disablism Nemi alapú megkülönböztetés Dicsőített náci szimbolizmus, konföderációs zászló, Ku Klux Klan szimbolizmus Erőszakos konföderációs zászló	Antiszemita kép a "Déli keresztet" ábrázoló kép, amely egy kék sóst (átlós keresztet) ábrázol nyilvánvaló erőszakkal (pl. fegyverek a kijelzőn/használatban)

Szexuális súlyossági szintek

Súlyossági szint	Leírás	Példa képre
0. szint – Széf	A tartalom biztonságos, de általános értelemben használt, szexuálisan kapcsolódó képeket tartalmaz. Ide tartoznak az alábbiak: Családi és romantikus kapcsolatok Nem szexuális meztelenség Clothing Gyakori objektumok Nem szexuális póz vagy tevékenység Állati párzás Szexuális wellness	Az ölelés vagy a nem szexuális fizikai érintkezés ábrázolása a szeretet fizikai megjelenítését ábrázolja, például a csók nyelv nélkül és meztelenség nélkül
2. szint – Alacsony	Szexuálisan szuggesztív viselkedést vagy cselekményt tartalmazó tartalom. Ide tartoznak az alábbiak: Személyes élmények Divatmodellezés Meztelenség az ábrán Body art Racy display	Személyek ábrázolása
4. szint – Közepes	Tartalom, amely kereskedelmi és amatőr erotikus és/vagy pornográf tartalmat tartalmaz vizuális fényképes behatolás nélkül, valamint meztelen vagy félkendős résztvevőket, akik szexuálisan izgatónak szánt szexuális jelenetekben vesznek részt. Ide tartoznak az alábbiak: Szexuális modellezés Puha meztelenség az ábrán Szexfeladatok vagy üzletek Elhomályosított szexuális tevékenység Pornó termelési backstage Rúdtánc	Részlegesen elzárt, de a képen továbbra is jól látható közösülés ábrázolása
6. szint – Magas	Olyan tartalom, amely kifejezetten részletes ábrázolásokat tartalmaz a nemi szervekről és a szexuális aktusról, beleértve az illegális cselekedeteket is. Ide tartoznak az alábbiak: Amatőr soft-core és hard-core pornográfia Szexuális felhívás Kukkolás Szex a műalkotásban BDSM hozzájárulás vagy nemi erőszak nélkül Gyermek szexuális kizsákmányolása és bántalmazása Gyermekápolás Vérfertőzés	Az állatokkal vagy holttestekkel folytatott szexuális tevékenységekben való részvétel ábrázolása

Az erőszak súlyossági szintjei

Súlyossági szint	Leírás	Példa képre
0. szint – Széf	A tartalom biztonságos, de általános értelemben erőszakkal kapcsolatos képeket tartalmaz. Ide tartoznak az alábbiak: Alvó vagy fekvő póz Gyakori objektumok Erőszakmentes tevékenység A kötelek nem zsinórként A konyhában/varrásban használt pengeeszközök Sebek, hegek és sebészeti kezelés Vadászati és lövészeti sport Toy és színlelje a fegyvereket Harci gyakorlat Objektumkárok és vandalizmus Nem márkás terrorista szimbolizmus	Nem valósághű fegyverek és pengeeszközök ábrázolása
2. szint – Alacsony	Olyan tartalom, amely erőszakkal kapcsolatos képeket tartalmaz, és valós vagy fiktív kontextusban, alacsony gore-val jár el. Ide tartoznak az alábbiak: Fegyverek, fegyverek és pengeeszközök a kijelzőn és használatban Nem reális holttest Nem reális erőszak Animált fegyverek Könnyű sérülés és személyes élmény Kötelek, mint egy csomó Halál történelmi, oktatási vagy tréfás környezetben Nem reális terrorista szimbolizmus Bikaviadal	ISIS/al-Qaeda jelölők ábrázolása
4. szint – Közepes	Olyan tartalom, amely mérsékelt grafikus erőszakot és erőszakos cselekményt tartalmaz egy azonosított cél érdekében. Ide tartoznak az alábbiak: Boncolás Bűncselekmény vagy halál helyszíne Állathalál (természetes vagy vadászott), állatáldozat, állatbántalmazás Rabszolgasorba Népirtás és tömeggyilkosságok történelmi, oktatási környezetben Vágóhíd Családon belüli erőszak és fizikai bántalmazás Megfélemlítés Fegyverek és fegyverek a célpontok ellen	Az egyén agresszív uralására vagy megfélemlítésére való kényszerítés és erőszak alkalmazásának ábrázolása
6. szint – Magas	Olyan tartalom, amely kifejezetten részletes ábrázolásokat tartalmaz az erőszakról és az erőszakos cselekményekről a magas góréban. Ide tartoznak az alábbiak: Grafikus sérülések és halál Feldarabolás, lefejezés, élve égő Holttest felbontása Terrorizmus, terrorista csoportok és zászlók Kényszermunka és szolgaság, kényszerített orvosi eljárás Cserkésző Holttest a terrorizmusban és a háborús bűncselekményekben Forgatási esemény Egyéb szélsőségesség	Halál ábrázolása, ha az ISIS-zászlók és szimbólumok által azonosítható terrorista csoportok hajtják végre

Önkárosítás súlyossági szintjei

Súlyossági szint	Leírás	Példa képre
0. szint – Széf	A tartalom biztonságos, de általános értelemben használt önkárosítással kapcsolatos képeket tartalmaz. Ide tartoznak az alábbiak: Alacsony testzsír Nem önkárosítási cselekmény Véletlen testsérülés	A repülőből kiugró ejtőernyővel való ugrás ábrázolása
2. szint – Alacsony	Olyan tartalom, amely önkárosítással kapcsolatos képeket tartalmaz, és valós vagy fiktív környezetekben, alacsony gore-val működik. Ide tartoznak az alábbiak: Hegek Önkárosítás a helyreállítás során Nem reális önkárosítás Elbocsátott egyének vagy állatok	Az önkárosítással kapcsolatos cselekedetek, eszközök, sérülés és érzelmi állapot ábrázolása
4. szint – Közepes	Az önkárosítással és öngyilkosságtal kapcsolatos mérsékelt grafikus képeket tartalmazó tartalom. Ide tartoznak az alábbiak: Boncolás Bűncselekmény vagy halál helyszíne Megfélemlítés	Az egyén önkárosításra való agresszív uralmának és megfélemlítésének kényszerítésének ábrázolása
6. szint – Magas	Olyan tartalom, amely kifejezetten részletes ábrázolásokat tartalmaz az önkárosításról és az öngyilkosságról a magas góréban. Ide tartoznak az alábbiak: Közelgő önkárosítási cselekmény Önsértő cselekedetek Öngyilkosság	Szándékos öngyilkosság ábrázolása, ahol egy személy öngyilkosságot követett el egy magas épületről való leugrással

Konfigurálhatóság (előzetes verzió)

Az alapértelmezett tartalomszűrési konfiguráció úgy van beállítva, hogy mind a négy tartalomkárosítási kategória közepes súlyossági küszöbértékén szűrjön mind a kérések, mind a befejezések esetében. Ez azt jelenti, hogy a közepes vagy magas súlyossági szinten észlelt tartalom szűrve van, míg az alacsony súlyossági szinten észlelt tartalmakat a tartalomszűrők nem szűrik. A konfigurálhatósági funkció előzetes verzióban érhető el, és lehetővé teszi az ügyfelek számára, hogy az egyes tartalomkategóriák tartalmát különböző súlyossági szinteken szűrjenek, az alábbi táblázatban leírtak szerint:

Súlyosság szűrve	A kérésekhez konfigurálható	Befejezésekhez konfigurálható	Leírások
Alacsony, közepes, magas	Igen	Igen	A legszigorúbb szűrési konfiguráció. A rendszer szűri az alacsony, közepes és magas súlyossági szinteken észlelt tartalmakat.
Közepes, magas	Igen	Igen	Alapértelmezett beállítás. Az alacsony súlyosságú tartalom nem szűrt, a közepes és a magas szintű tartalmak szűrve lesznek.
Magas	Igen	Igen	Az alacsony és közepes súlyossági szinteken észlelt tartalom nincs szűrve. A rendszer csak a magas súlyosságú tartalmakat szűri.
Nincsenek szűrők	Ha jóváhagyták^*	Ha jóváhagyták^*	A rendszer a súlyossági szinttől függetlenül nem szűri a tartalmat. Jóváhagyást^* igényel.

^* Csak a módosított tartalomszűrésre jóváhagyott ügyfelek rendelkeznek teljes tartalomszűrési vezérlővel, és részlegesen vagy teljesen kikapcsolhatják a tartalomszűrőket. A tartalomszűrés-szabályzás nem vonatkozik a DALL-E (előzetes verzió) vagy a GPT-4 Turbo with Vision (előzetes verzió) tartalomszűrőire. A módosított tartalomszűrőkre az alábbi űrlapon jelentkezhet: Azure OpenAI Korlátozott hozzáférésű felülvizsgálat: Módosított tartalomszűrés (microsoft.com).

Az ügyfelek feladata annak biztosítása, hogy az Azure OpenAI-t integráló alkalmazások megfeleljenek a magatartási kódexnek.

A tartalomszűrési konfigurációk egy Azure AI Studio-erőforráson belül jönnek létre, és az üzembe helyezésekkel társíthatók. A konfigurálhatóságról itt talál további információt.

Forgatókönyv részletei

Amikor a tartalomszűrési rendszer kártékony tartalmat észlel, hibaüzenet jelenik meg az API-hívásban, ha a kérés nem megfelelőnek minősül, vagy a finish_reason válasz content_filter azt jelzi, hogy a befejezés egy része szűrve lett. Az alkalmazás vagy a rendszer létrehozásakor figyelembe kell vennie azokat a forgatókönyveket, amelyekben a Completions API által visszaadott tartalom szűrve van, ami hiányos tartalmat eredményezhet. Az információk alapján történő működés alkalmazásspecifikus lesz. A viselkedés az alábbi pontokban foglalható össze:

A szűrt kategóriába és súlyossági szintre besorolt kérések HTTP 400-es hibát adnak vissza.
A nem streamelt befejezési hívások nem adnak vissza tartalmat a tartalom szűrésekor. Az finish_reason érték content_filter lesz beállítva. Ritkán hosszabb válaszok esetén részleges eredmény adható vissza. Ezekben az esetekben a rendszer frissíti a finish_reason frissítést.
A streamelési befejezési hívások esetében a szegmensek a befejezett állapotban vissza lesznek adva a felhasználónak. A szolgáltatás addig folytatja a streamelést, amíg el nem éri a leállítási jogkivonatot, a hosszt, vagy ha a rendszer szűrt kategóriába és súlyossági szintre besorolt tartalmat észlel.