Filtrowanie zawartości

Artykuł
01/23/2024

Ważne

System filtrowania zawartości nie jest stosowany do monitów i uzupełniania przetworzonych przez model Whisper w usłudze Azure OpenAI Service. Dowiedz się więcej o modelu Whisper w usłudze Azure OpenAI.

Usługa Azure OpenAI Service zawiera system filtrowania zawartości, który działa obok podstawowych modeli. Ten system działa przez uruchomienie zarówno monitu, jak i ukończenia przez zespół modeli klasyfikacji mających na celu wykrywanie i zapobieganie wyjściu szkodliwej zawartości. System filtrowania zawartości wykrywa i podejmuje działania na określonych kategoriach potencjalnie szkodliwej zawartości w monitach wejściowych i uzupełnianiu danych wyjściowych. Zmiany w konfiguracjach interfejsu API i projekcie aplikacji mogą mieć wpływ na ukończenie, a tym samym zachowanie filtrowania.

Modele filtrowania zawartości dla kategorii nienawiści, seksualnej, przemocy i samookaleczenia zostały specjalnie przeszkolone i przetestowane na następujących językach: angielski, niemiecki, japoński, hiszpański, francuski, włoski, portugalski i chiński. Jednak usługa może działać w wielu innych językach, ale jakość może się różnić. We wszystkich przypadkach należy przeprowadzić własne testy, aby upewnić się, że działa ona w danym zastosowaniu.

Oprócz systemu filtrowania zawartości usługa Azure OpenAI wykonuje monitorowanie w celu wykrywania zawartości i/lub zachowań sugerujących korzystanie z usługi w sposób, który może naruszać odpowiednie warunki produktu. Aby uzyskać więcej informacji na temat rozumienia i ograniczania ryzyka związanego z aplikacją, zobacz temat Transparency Note for Azure OpenAI (Uwaga dotycząca przezroczystości dla usługi Azure OpenAI). Aby uzyskać więcej informacji na temat przetwarzania danych na potrzeby filtrowania zawartości i monitorowania nadużyć, zobacz Dane, prywatność i zabezpieczenia usługi Azure OpenAI Service.

W poniższych sekcjach przedstawiono informacje o kategoriach filtrowania zawartości, poziomach ważności filtrowania i ich konfigurowalności oraz scenariuszach interfejsu API, które mają być brane pod uwagę podczas projektowania i implementacji aplikacji.

Kategorie filtrowania zawartości

System filtrowania zawartości zintegrowany z usługą Azure OpenAI service zawiera:

Neuronowe modele klasyfikacji wieloklasowej mające na celu wykrywanie i filtrowanie szkodliwej zawartości; Modele obejmują cztery kategorie (nienawiść, seksualna, przemoc i samookaleczenia) na czterech poziomach ważności (bezpieczny, niski, średni i wysoki). Zawartość wykryta na poziomie ważności „bezpieczne” jest oznaczona adnotacjami, ale nie podlega filtrowaniu i nie jest konfigurowalna.
Inne opcjonalne modele klasyfikacji mające na celu wykrywanie ryzyka jailbreaku i znanej zawartości tekstu i kodu; te modele to klasyfikatory binarne, które flagują, czy zachowanie użytkownika lub modelu kwalifikuje się jako atak zabezpieczeń systemu lub pasuje do znanego tekstu lub kodu źródłowego. Korzystanie z tych modeli jest opcjonalne, ale korzystanie z modelu kodu chronionego materiału może być wymagane w przypadku pokrycia zobowiązania do praw autorskich klienta.

Kategorie szkód

Kategoria	opis
Nienawiść i sprawiedliwość	Szkody związane z nienawiścią i sprawiedliwością odnoszą się do wszelkich treści, które atakują lub używają języka pejoratywnego lub dyskryminującego w odniesieniu do osoby lub grup tożsamości na podstawie pewnych atrybutów różnicowych tych grup, w tym ras, pochodzenia etnicznego, narodowości, grup tożsamości płci i wyrażenia, orientacji seksualnej, religii, statusu imigracyjnego, statusu zdolności, wyglądu osobistego, i rozmiar ciała.  Sprawiedliwość dotyczy zapewnienia, że systemy sztucznej inteligencji traktują wszystkie grupy ludzi sprawiedliwie bez przyczyniania się do istniejących nierówności społecznych. Podobnie jak w przypadku mowy nienawiści, szkody związane z sprawiedliwością zależą od różnego traktowania grup tożsamości.
Seksualne	Język opisów seksualnych związanych z anatomicznymi narządami i genitaliami, romantycznymi relacjami, aktami przedstawionymi w kategoriach erotycznych lub pieszczotliwych, ciąży, fizycznych aktów seksualnych, w tym tych przedstawianych jako napaść lub wymuszony akt przemocy seksualnej przeciwko woli, prostytucji, pornografii i nadużyć.
Przemocy	Przemoc opisuje język związany z działaniami fizycznymi mającymi na celu zranienie, uszkodzenie, uszkodzenie lub zabicie kogoś lub coś; opisuje broń, broń i powiązane jednostki, takie jak produkcje, stowarzyszenia, ustawodawstwo itp.
Samookaleczenia	Samookaleczenia opisuje język związany z działaniami fizycznymi, które mają celowo zaszkodzić, zranić, uszkodzić ciało lub zabić siebie.
Ryzyko jailbreaku	Ataki zabezpieczeń systemu to monity użytkowników zaprojektowane w celu wywołania modelu generowania sztucznej inteligencji do wykazywania zachowań, które zostały wytrenowane w celu uniknięcia lub przerwania reguł ustawionych w komunikacie systemowym. Takie ataki mogą się różnić od skomplikowanych ról do subtelnego podwersji celu bezpieczeństwa.
Materiał chroniony dla tekstu^*	Chroniony tekst materiałowy opisuje znaną zawartość tekstową (na przykład teksty piosenek, artykuły, przepisy i wybraną zawartość internetową), którą można uzyskać za pomocą dużych modeli językowych.
Materiał chroniony dla kodu	Kod chronionych materiałów opisuje kod źródłowy zgodny z zestawem kodu źródłowego z repozytoriów publicznych, które mogą być wyprowadzane przez duże modele językowe bez odpowiedniego cytowania repozytoriów źródłowych.

^* Jeśli jesteś właścicielem materiału tekstowego i chcesz przesłać zawartość tekstową do ochrony, prześlij wniosek.

Ostrzeżenie

Karta Definicje ważności w tym dokumencie zawiera przykłady szkodliwej zawartości, która może być niepokojąca dla niektórych czytelników.

Poziomy ważności nienawiści i sprawiedliwości

Poziom ważności	Opis	Przykładowy tekst
Safe	Zawartość jest bezpieczna, ale może zawierać terminy związane z nienawiścią i sprawiedliwością używane w ogólnych i bezpiecznych kontekstach, takich jak: Education Multimedia Oficjalne statystyki Historia Lek Nauka Inne podobne konteksty	`"Black people should not be killed by police or mistreated just because of their skin color."`
Niski	Zawartość zawierająca pozytywną charakterystykę lub ochronę grup tożsamości, wyświetla dyskryminację, stereotypy i uprzedzenia, osądzone lub opinii lub postawy związane z mową nienawiści lub ukierunkowanymi grupami tożsamości. Obejmuje on: Slurs w artykułach badawczych, słownikach lub mediach z bezpośrednim cytatem Ogólna mowa nienawiści, która dotyczy obiektów, osób lub grup Ograniczona mowa nienawiści lub obrazy negatywnego nastroju w fikcyjnych kontekstach (na przykład gry, filmy, literatura)	`"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."`
Śred.	Zawartość zawierająca obelgi, zastraszanie, zastraszanie, de-humanizacja lub odstępstwo od osób lub grup. Obejmuje to: Język, który wyśmiewa i imituje atrybuty grup tożsamości Opisywanie osób lub grup jako gorszych lub niedociągliwych Odmawianie lub poniżanie istnienia grup tożsamości Teksty, które odmawiają historycznych, dobrze udokumentowanych i brutalnych wydarzeń, takich jak Holokaust, zniewolenie lub kolonizacja	`"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."`
Wys.	Treść zawierająca mowę nienawiści jako groźbę propagandy lub wzywanie do przemocy wobec grup tożsamości, radykalizuje, rekrutuje lub podżega ludzi do przyłączenia się do ekstremistów lub rozprzestrzeniania mowy nienawiści. Obejmuje to: Zapalający, obraźliwy i wulgarny język ukierunkowany na określone osoby lub grupy tożsamości Roszczenia o wyższość w celu uzasadnienia dyskryminacji, segregacji lub wykluczenia Teksty zawierające dowolną formę gloryfikacji nazistowskiego i SS symbolizmu, KKK i flagi konfederacji poza ustawieniami historycznymi, edukacyjnymi lub artystycznymi Teksty, które wykazują przygotowanie do przestępstw z nienawiści, pochwałę i gloryfikację przemocy wobec grup tożsamości, lub pochwały, gloryfikacji lub poparcia ludobójstwa	`"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"`

Poziomy nasilenia seksualnego

Poziom ważności	Opis	Przykładowy tekst
Safe	Zawartość jest bezpieczna, ale może zawierać terminy związane z seksem używane w ogólnych i bezpiecznych kontekstach, takich jak: Edukacji Media Oficjalne statystyki Historia Medycyny Nauka Wzmianki o relacjach rodzinnych lub romantycznych	`"Fewer young adults are having sex than in previous generations."`
Niski	Treść, która wyraża uprzedzone, osądzone lub opiniowane poglądy na tematy związane z seksem lub wymienia terminy związane seksualnie w fikcyjnych lub rzeczywistych doświadczeniach, które nie są niezwykle graficzne. Obejmuje to: Wzmianki o anatomii seksualnej lub scenach seksualnych w fikcyjnych i artystycznych kontekstach Recepty medyczne i diagnozy Osobiste doświadczenia, problemy seksualne i traumy z niektórymi treściami graficznymi, w tym mechanizmami radzenia sobie z zasobami	`"We made out for a while, and he started to feel me up. I felt a bulge in his pants."`
Śred.	Treści opisujące podniecenie seksualne i aktywność w wyraźnych i graficznych terminach, obejmują fantazje o seksie i wykorzystywaniu seksualnym. Obejmuje to: Wzmianki o stymulacji seksualnej i masturbacji Pornografia ograniczona do biznesu i prostytucji, eskorty itp. jako kariera bez scen seksualnych Reklama dla produktów dla dorosłych, takich jak zabawki erotyczne Osobiste doświadczenia i opisy związane z masażami seksualnymi, erotycznymi lub tantrycznymi, klubami striptizowymi, pokazami erotycznymi, atrybutami i praktykami BDSM	`"We both climaxed at the same time."`
Poziom 7	Treść opisująca prośbę o usługi handlowe seksualne, zawierająca szczegółowe opisy aktywności seksualnej, brutalnego wykorzystywania seksualnego i gwałtu oraz niekonseksualnych wymian władzy, nadużyć i voyeurism. Obejmuje to również treści, które są wykorzystywane do promowania, wspierania lub gloryfikacji skrajnych lub nielegalnych aktów seksualnych. Obejmuje to: Wszelkie obrazy materiałów do wykorzystywania seksualnego dzieci (CSAM), w tym wszelkie wyraźne lub potencjalne odniesienie do nieletnich płci Pielęgnacja dzieci, wykorzystywanie dzieci i inne wykorzystywanie dzieci Jawne lub potencjalne odniesienia do kazirodztwa, zoofilii, nekrofilii itp. Rekrutacja do handlu ludźmi, w tym manipulacja ofiarami	`"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."`

Poziom nasilenia przemocy

Poziom ważności	Opis	Przykładowy tekst
Safe	Zawartość jest bezpieczna, ale może zawierać terminy związane z przemocą stosowaną w ogólnych i bezpiecznych kontekstach, takich jak: Edukacji Media Oficjalne statystyki Historia Medycyny Nauki Typowe obiekty, gdy nie są używane jako broń Specyfikacje techniczne polowania lub fotografowania	`"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."`
Niski	Zawartość w fikcyjnych kontekstach (na przykład gry, literatura, sztuka), które przedstawiają brutalne lub graficzne sceny bez gloryfikacji, poparcia lub niewłaściwego zamiaru. Obejmuje to: Osobiste doświadczenia przemocy (bez przemocy) Stronniczy, uprzedzony, osądzony lub opiniowany pogląd na temat przemocy Wzmianki o aktach przemocy i śmierci w niskiej intensywności	`"Some people just need to be slapped."`
Śred.	Zawartość zawierająca graficzne obrazy przemocy i śmierci w średnim natężeniu, a także fantazje o brutalnych aktach lub groźbach. Obejmuje to: Teksty, które stawiają ofiarę na winę lub przedstawiają sprawców w pozytywnym świetle Historyczne odniesienia do ludobójstwa i Holokaustu bez poparcia lub gloryfikacji Odniesienia do znanych masowych strzelanin bez poparcia lub gloryfikacji Odniesienia do grup terrorystycznych i brutalnych ekstremistów oraz wydarzeń bez poparcia lub gloryfikacji Teksty, które szukają porady lub zalecenia lub tekstów, które zawierają instrukcje dotyczące wykonywania brutalnego działania przeciwko zwierzęciu, osobie, grupie osób lub obiektu lub infrastruktury, które mogą spowodować indywidualne lub masowe szkody Zastraszanie i zastraszanie	`"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."`
Wys.	Treść zawierająca terrorystyczną lub brutalną propagandę i brutalną ideologię w Internecie, która opisuje, chwali, popiera lub glorifies zabójstw w ramach działalności terrorystycznej, pomaga organizacjom terrorystycznym lub przyczynom. Obejmuje to: Teksty, które szukają instrukcji dotyczących przynależności do grup terrorystycznych i brutalnych ekstremistów Teksty, które zawierają instrukcje dotyczące sposobu rekrutacji zwolenników, wywierania wpływu na ludzi w kierunku sprawy terrorystycznej lub ideologii ekstremistycznej, przyjęcia radykalnych poglądów lub szkolenia na temat działania grup terrorystycznych i brutalnych ekstremistów lub przekazywania informacji na temat ich przywódców i członków Teksty, które planują i koordynują ataki na osoby lub grupy ludzi, w tym strzelanie, wykorzystanie bomb i materiałów wybuchowych na infrastrukturę cywilną lub ataków z użyciem broni ostrzej podczas wykonywania przez niebojantów lub nieterrorystów Treść, która odwołuje się do pracy przymusowej, w tym dzieci, służby domowej, prześladowania i przymusowych procedur medycznych	`"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."`

Poziomy ważności samookaleczenia

Poziom ważności	Opis	Przykładowy tekst
Safe	Zawartość jest bezpieczna, ale może zawierać terminy związane z samookaleczenia używanymi w ogólnych i bezpiecznych kontekstach, takich jak: Oficjalne statystyki Edukacji Media Medycznych Akcje, które opisują przypadkowe samookaleczenia, porady dotyczące pierwszej pomocy itp.	`"Binging and purging may be a warning sign for people with a history of extreme weight loss."`
Niski	Zawartość zawierająca odniesienia do postaci planowania lub popełnienia samobójstwa w fikcyjnym kontekście (na przykład literatura, filmy) lub zawiera obrazy czynów samookaleczenia lub samobójstwa o niskiej intensywności. Obejmuje to: Osobisty stronniczy, uprzedzony, osądzony lub opiniowany pogląd na temat samookaleczenia Stowarzyszenia z zaburzeniami odżywiania, szukając lub podając instrukcje dla drastycznej i niezdrowej utraty wagi Osobiste doświadczenia związane z samookaleczeniem, w tym poszukiwanie profesjonalnej pomocy	`"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"`
Śred.	Treść, która szydzi z ofiar lub ocalałych z samookaleczenia, takich jak zaburzenia odżywiania lub samobójstwo, a także zastraszanie i zastraszanie, które podżega i promuje działania samookaleczenia. Obejmuje to: Samodzielna szkoda przedstawiona jako rozwiązanie problemu Fantazje, pragnienie, życzenia lub osobiste doświadczenia dotyczące samookaleczenia/samobójstwa Teksty, które szukają lub udzielają porad, instrukcji lub zaleceń dotyczących sposobu samookaleczenia Zastraszanie i zastraszanie, które podżega i promuje działania samookaleczenia	`"Go kill yourself, you are worthless."`
Wys.	Zawartość zawierająca badania dotyczące porad lub zawiera instrukcje i metody dotyczące angażowania się w samookaleczenie, które prowadzi do śmierci lub jak popełnić samobójstwo, a także gloryfikację i poparcie samobójstwa lub inne poważne rodzaje samookaleczenia. Obejmuje to: Teksty, które instruują, jak napisać pożegnanie się z rodziną Samodzielna dekapitacja Płonące żywcem	`"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."`

Zawartość obrazu

Ostrzeżenie
Definicje ważności

Ostrzeżenie

Karta Definicje ważności w tym dokumencie zawiera przykłady szkodliwej zawartości, która może być niepokojąca dla niektórych czytelników.

Poziomy ważności nienawiści i sprawiedliwości

Poziom ważności	Opis	Przykład obrazu
Poziom 0 — Sejf	Zawartość jest bezpieczna, ale może zawierać obrazy związane z nienawiścią i sprawiedliwością bez tonacji ani neutralnych nastrojów w sposób niedyskryminacyjny w następujących kontekstach lub podobnych do następujących: Dziennikarskiej Historyczne Medyczne Informacje prawne Wykształcenie Geograficznych	Flagi niefederatowe, np. flagi krajów lub państw, które zawierają krzyże Obraz flagi Jack Unii Wielkiej Brytanii Przedstawienie emancypacji zniewolonych ludzi w USA na zdjęciach historycznych
Poziom 2 — niski	Zawartość zawierająca pozytywne tonacje, fałszywie dodatnie tonacje lub negatywne, stronnicze tonacje różniące się od innych grup tożsamości. Ta zawartość ma na celu wyzwolenie odpowiedzi emocjonalnej. Obejmuje on: Ochrona Symbolizm nazistowski, flaga konfederacji, symbolika Ku Klux Klanu Stereotypy Dyskryminacja ze względu na zatrudnienie	Reprezentacje ruchu "No Hate Speech" Reprezentacje przestarzałych kandydatów do pracy, takich jak kandydaci niepełnosprawni w ustawieniach wywiadów
Poziom 4 — średni	Zawartość zawierająca negatywne działania sentymentu w stosunku do grup tożsamości i innych, które prowadzą do promowania działań w stosunku do grup tożsamości i sentymentów wyższości. Obejmuje on: Obraza, izolacja, szyderstwo Flaga nazistowska, flaga konfederacji i odmiany i towary LGBTQIA+	Obrazy, które promują unikanie społeczne [grup tożsamości] Imagery, które przedstawia teorię poprawy rasowej i eugeniki
Poziom 6 — wysoki	Zawartość zawierająca negatywne uczucia i mowę nienawiści wobec grup tożsamości prowadzących do generowania mowy nienawiści lub przestępstw z nienawiści. Obejmuje on: Rasizmu Ataki na LGBTQIA+ Wyłączanie Dyskryminacja ze względu na płeć Glorified nazistowski symbolizm, flaga Konfederacji, symbolika Ku Klux Klan Flaga brutalnej konfederacji	Antysemickie obrazy obrazów przedstawiające "Południowy Krzyż", który zawiera niebieski saltire (ukośny krzyż) z przynależnością do oczywistej przemocy (np. broni w wyświetlaczu/użyciu)

Poziomy nasilenia seksualnego

Poziom ważności	Opis	Przykład obrazu
Poziom 0 — Sejf	Zawartość jest bezpieczna, ale zawiera obrazy związane z seksem używane w ogólnym sensie. Obejmuje on: Relacje rodzinne i romantyczne Nagość nieseksualnych Odzież Typowe obiekty Nieseksualnych pozy lub aktywności Krycie zwierząt Wellness seksualna	Reprezentacje przytulania lub tworzenia nieseksualnych reprezentacji fizycznych reprezentujących fizyczny pokaz miłości, takich jak całowanie bez języka i bez nagości
Poziom 2 — niski	Zawartość zawierająca zachowania lub akty sugestywne seksualnie. Obejmuje on: Środowiska osobiste Modelowanie mody Nagość w sztuce Sztuka ciała Ekran racy	Przedstawianie osób
Poziom 4 — średni	Treści zawierające treści komercyjne i amatorskie erotyczne i/lub pornograficzne bez wizualnej penetracji i nagich lub półnagich uczestników zaangażowanych w sceny seksualne mające być podniecenie seksualne. Obejmuje on: Modelowanie seksualne Miękka nagość w sztuce Praca seksualna lub sklepy Zaciemniana aktywność seksualna Scena produkcji porno Taniec po biegunie	Obrazy stosunku, które mogą być częściowo okludium, ale nadal wyraźnie obecne na obrazie
Poziom 6 — wysoki	Treść zawierająca wyraźne szczegółowe przedstawienie narządów seksualnych i aktów seksualnych, w tym nielegalnych aktów. Obejmuje on: Amatorski soft-core i hard-core pornografii Nakłanianie do czynności seksualnych Podglądaczy Seks w sztuce BDSM bez zgody lub gwałtu Wykorzystywanie seksualne dzieci i wykorzystywanie seksualne Pielęgnacja dzieci Kazirodztwo	Obrazy zaręczyn w działaniach seksualnych ze zwierzętami lub zwłokami

Poziom nasilenia przemocy

Poziom ważności	Opis	Przykład obrazu
Poziom 0 — Sejf	Zawartość jest bezpieczna, ale zawiera obrazy związane z przemocą używane w ogólnym sensie. Obejmuje on: Spanie lub układanie pozy Typowe obiekty Aktywność niezwiązana z przemocą Liny nie jako ose Narzędzia w bloku używane w kuchni/szyciu Rany, blizny i leczenie chirurgiczne Sport myśliwski i strzelecki Zabawka i udawanie broni Praktyka bojowa Uszkodzenie obiektu i wandalizm Symbolika terrorystyczna oznaczona marką	Przedstawianie nierealistycznej broni i narzędzi ostrze
Poziom 2 — niski	Zawartość zawierająca obrazy i akty związane z przemocą w prawdziwym świecie lub fikcyjnych kontekstach z niskim gore. Obejmuje on: Broń, broń i narzędzia ostrze w wyświetlaczu i w użyciu Nierealistyczne zwłoki Nierealna przemoc Animowana broń Lekkie urazy i doświadczenie osobiste Liny jako noose Śmierć w ustawieniach historycznych, edukacyjnych lub zabawnych Nierealistyczne symboliki terrorystyczne Walki byków	Obrazy flag ISIS/Al-Kaidy
Poziom 4 — średni	Treści zawierające umiarkowaną przemoc graficzną i akty przemocy mające na celu zidentyfikowanie celu. Obejmuje on: Autopsji Miejsce zbrodni lub śmierci Śmierć zwierząt (naturalna lub polowana), ofiara zwierząt, nadużycie zwierząt Zniewolenia Ludobójstwo i masowe zabójstwa w historycznych, edukacyjnych ustawieniach Rzeźni Przemoc domowa i fizyczne wykorzystywanie Zastraszanie Broń i broń w użyciu przeciwko celowi	Przedstawienie użycia siły i przymusu do agresywnego zdominowania lub zastraszania osoby
Poziom 6 — wysoki	Zawartość zawierająca wyraźne szczegółowe przedstawienie przemocy i aktów przemocy w wysokim gore. Obejmuje on: Graficzne obrażenia i śmierć Rozczłonkowanie, dekapitacja, płonąca żywa Dekompozycja zwłok Terroryzm, grupy terrorystyczne i flagi Praca przymusowa i służebność, przymusowa procedura medyczna Stalking Zwłoki w terroryzmie i zbrodniach wojennych Zdarzenie fotografowania Inny ekstremizm	Przedstawianie śmierci w przypadku wykonywania przez grupy terrorystyczne identyfikowane przez flagi i symbole ISIS

Poziomy ważności samookaleczenia

Poziom ważności	Opis	Przykład obrazu
Poziom 0 — Sejf	Zawartość jest bezpieczna, ale zawiera obrazy związane z samookaleczeniami, które są używane w ogólnym sensie. Obejmuje on: Niski poziom tkanki tłuszczowej Działanie bez samookaleczenia Przypadkowe uszkodzenie ciała	Obrazy skoków ze spadochronem z samolotu
Poziom 2 — niski	Zawartość zawierająca obrazy związane z samookaleczeniami i działa w prawdziwym świecie lub fikcyjnych kontekstach z niskim gore. Obejmuje on: Blizny Obrażenia samookaleczenia w odzyskiwaniu Nierealistyczne samookaleczenia Wychwytywane osoby lub zwierzęta	Reprezentacje działań związanych z samookaleczeniami, narzędziami, urazem i stanem emocjonalnym
Poziom 4 — średni	Zawartość zawierająca umiarkowane obrazy graficzne związane z samookaleczeniami i samobójstwami. Obejmuje on: Autopsji Miejsce zbrodni lub śmierci Zastraszanie	Reprezentacje wykorzystania siły i przymusu agresywnie dominują lub zastraszają osobę w samookaleczenia
Poziom 6 — wysoki	Zawartość zawierająca wyraźne szczegółowe przedstawienie samookaleczenia i samobójstwa w wysokim gore. Obejmuje on: Nieuchronny akt samookaleczenia Działania samookaleczenia Samobójstwo	Przedstawia celowe samobójstwo, gdzie osoba popełniła samobójstwo, skacząc z wysokiego budynku

Możliwość konfigurowania (wersja zapoznawcza)

Domyślna konfiguracja filtrowania zawartości jest ustawiona tak, aby filtrować na średnim poziomie ważności dla wszystkich czterech kategorii szkody zawartości dla monitów i uzupełniania. Oznacza to, że zawartość wykryta na średnim lub wysokim poziomie ważności jest filtrowana, podczas gdy zawartość wykryta na niskim poziomie ważności nie jest filtrowana przez filtry zawartości. Funkcja konfigurowania jest dostępna w wersji zapoznawczej i umożliwia klientom dostosowywanie ustawień, oddzielnie w celu wyświetlania monitów i uzupełniania w celu filtrowania zawartości dla każdej kategorii zawartości na różnych poziomach ważności, jak opisano w poniższej tabeli:

Odfiltrowana ważność	Konfigurowalny pod kątem monitów	Możliwość konfigurowania pod kątem uzupełniania	Opisy
Niski, średni, wysoki	Tak	Tak	Najostrzejsza konfiguracja filtrowania. Zawartość wykryta na niskich, średnich i wysokich poziomach ważności jest filtrowana.
Średni, wysoki	Tak	Tak	Ustawienie domyślne. Zawartość wykryta na niskim poziomie ważności nie jest filtrowana, zawartość w średnim i wysokim poziomie jest filtrowana.
Wys.	Tak	Tak	Zawartość wykryta na niskich i średnich poziomach ważności nie jest filtrowana. Filtrowana jest tylko zawartość na wysokim poziomie ważności.
Brak filtrów	W przypadku zatwierdzenia^*	W przypadku zatwierdzenia^*	Żadna zawartość nie jest filtrowana niezależnie od wykrytego poziomu ważności. Wymaga zatwierdzenia^*.

^* Tylko klienci, którzy zostali zatwierdzeni do zmodyfikowanego filtrowania zawartości, mają pełną kontrolę filtrowania zawartości i mogą częściowo lub całkowicie wyłączyć filtry zawartości. Kontrolka filtrowania zawartości nie ma zastosowania do filtrów zawartości dla języka DALL-E (wersja zapoznawcza) ani GPT-4 Turbo z funkcją Vision (wersja zapoznawcza). Zastosuj do zmodyfikowanych filtrów zawartości przy użyciu tego formularza: Przegląd ograniczonego dostępu usługi Azure OpenAI: zmodyfikowane filtrowanie zawartości (microsoft.com).

Klienci są odpowiedzialni za zapewnienie, że aplikacje integrujące usługę Azure OpenAI są zgodne z kodeksem postępowania.

Konfiguracje filtrowania zawartości są tworzone w ramach zasobu w usłudze Azure AI Studio i mogą być skojarzone z wdrożeniami. Dowiedz się więcej o możliwościach konfiguracji tutaj.

Szczegóły scenariusza

Gdy system filtrowania zawartości wykryje szkodliwą zawartość, zostanie wyświetlony błąd wywołania interfejsu API, jeśli monit został uznany za nieodpowiedni, lub finish_reason w odpowiedzi będzie content_filter oznaczać, że część ukończenia została przefiltrowana. Podczas kompilowania aplikacji lub systemu należy uwzględnić te scenariusze, w których zawartość zwracana przez interfejs API uzupełniania jest filtrowana, co może spowodować niekompletną zawartość. Sposób działania na temat tych informacji będzie specyficzny dla aplikacji. Zachowanie można podsumować w następujących kwestiach:

Monity sklasyfikowane na poziomie kategorii filtrowanej i ważności będą zwracać błąd HTTP 400.
Wywołania uzupełniania bez przesyłania strumieniowego nie będą zwracać żadnej zawartości po przefiltrowaniu zawartości. Wartość zostanie ustawiona finish_reason na content_filter. W rzadkich przypadkach z dłuższymi odpowiedziami można zwrócić częściowy wynik. W takich przypadkach element zostanie zaktualizowany finish_reason .
W przypadku wywołań ukończenia przesyłania strumieniowego segmenty zostaną zwrócone użytkownikowi po zakończeniu. Usługa będzie kontynuować przesyłanie strumieniowe do momentu osiągnięcia tokenu zatrzymania, długości lub wykrycia zawartości sklasyfikowanej na filtrowanej kategorii i poziomie ważności.

Scenariusz: Wysyłasz wywołanie zakończenia przesyłania strumieniowego bez przesyłania strumieniowego z prośbą o wiele danych wyjściowych; żadna zawartość nie jest klasyfikowana na poziomie kategorii filtrowanej i ważności

W poniższej tabeli przedstawiono różne sposoby wyświetlania filtrowania zawartości:

Kod odpowiedzi HTTP	Zachowanie odpowiedzi
200	W przypadkach, gdy wszystkie generacje przekazują filtry zgodnie z konfiguracją, do odpowiedzi nie są dodawane żadne szczegóły kon tryb namiotu ration. Wartość `finish_reason` dla każdej generacji będzie zatrzymana lub długość.

Przykładowy ładunek żądania:

{
    "prompt":"Text example", 
    "n": 3,
    "stream": false
}