Filtrado de contenido

Artículo
02/02/2024

Importante

El sistema de filtrado de contenido no se aplica a solicitudes y finalizaciones procesadas por el modelo Whisper en el servicio Azure OpenAI. Obtenga más información sobre el modelo Whisper en Azure OpenAI.

Azure OpenAI Service incluye un sistema de filtrado de contenido que funciona junto con los modelos principales, incluidos los modelos de generación de imágenes DALL-E. Este sistema funciona ejecutando tanto la solicitud como la finalización a través de un conjunto de modelos de clasificación destinados a detectar y evitar la salida de contenido dañino. El sistema de filtrado de contenido detecta y toma medidas en categorías específicas de contenido potencialmente perjudicial tanto en solicitudes de entrada como en finalizaciones de salida. Las variaciones en las configuraciones de API y el diseño de aplicaciones pueden afectar a las finalizaciones y, por tanto, al comportamiento de filtrado.

Los modelos de filtrado de contenido para las categorías de odio, sexual, violencia y autolesiones se han entrenado y probado específicamente en los siguientes idiomas: inglés, alemán, japonés, español, francés, italiano, portugués y chino. Sin embargo, el servicio puede funcionar en muchos otros idiomas, pero la calidad puede variar. En todos los casos, debe realizar sus propias pruebas para asegurarse de que funciona para la aplicación.

Además del sistema de filtrado de contenido, Azure OpenAI Service realiza la supervisión para detectar contenido o comportamientos que sugieren el uso del servicio de una manera que podría infringir los términos de producto aplicables. Para más información sobre cómo comprender y mitigar los riesgos asociados a la aplicación, consulte la Nota de transparencia para Azure OpenAI. Para más información sobre cómo se procesan los datos en relación con el filtrado de contenido y la supervisión de abusos, consulte Datos, privacidad y seguridad para Azure OpenAI Service.

En las secciones siguientes, se proporciona información sobre las categorías de filtrado de contenido, los niveles de gravedad de filtrado y su capacidad de configuración, además de los escenarios de API que se deben tener en cuenta en el diseño y la implementación de aplicaciones.

Categorías de filtrado de contenido

El sistema de filtrado de contenido integrado en Azure OpenAI Service contiene:

Modelos de clasificación neuronales de varias clases destinados a detectar y filtrar contenido dañino; los modelos cubren cuatro categorías (odio, sexual, violencia y autolesiones) en cuatro niveles de gravedad (seguro, bajo, medio y alto). El contenido detectado en el nivel de gravedad "seguro" está etiquetado en anotaciones, pero no está sujeto al filtrado y no es configurable.
Modelos de clasificación opcionales adicionales destinados a detectar el riesgo de jailbreak y el contenido conocido para el texto y el código; estos modelos son clasificadores binarios que marcan si el comportamiento del usuario o del modelo se califica como un ataque de jailbreak o coincide con el texto o el código fuente conocidos. El uso de estos modelos es opcional, pero el uso del modelo de código de material protegido puede ser necesario para la cobertura del compromiso de derechos de autor del cliente.

Categorías de riesgo

Category	Descripción
Odio y equidad	Los daños relacionados con el odio y la equidad se refieren a cualquier contenido que ataque o utilice un lenguaje peyorativo o discriminatorio con referencia a una persona o grupo identitario basado en ciertos atributos diferenciadores de estos grupos, incluidos, entre otros, la raza, la etnia, la nacionalidad, grupos de identidad y expresión de género, la orientación sexual, la religión, el estatus migratorio, el estado de capacidad, la apariencia personal y el tamaño corporal.  La equidad consiste en garantizar que los sistemas de IA traten a todos los grupos de personas de forma equitativa sin contribuir a las desigualdades sociales existentes. Como en el caso de la incitación al odio, los perjuicios relacionados con la equidad se basan en el trato desigual de los grupos identitarios.
Sexual	Sexual describe el lenguaje relacionado con los órganos anatómicos y los genitales, el embarazo, las relaciones románticas, los actos representados en términos eróticos o afectuosos, los actos sexuales físicos, incluidos los representados como una agresión o un acto violento sexual forzado contra la propia voluntad, la prostitución, la pornografía y el abuso.
Violencia	Violencia describe el lenguaje relacionado con acciones físicas destinadas a herir, lesionar, dañar o matar a alguien o algo; describe armas, pistolas y entidades relacionadas, como fabricantes, asociaciones, legislación, etc.
Autolesiones	Autolesión describe el lenguaje relacionado con acciones físicas destinadas a herir, lesionar o dañar intencionadamente su propio cuerpo o a suicidarse.
Material protegido para texto^*	El texto de material protegido describe contenidos textuales conocidos (por ejemplo, letras de canciones, artículos, recetas y contenidos web seleccionados) que pueden ser emitidos por grandes modelos de lenguaje.
Material protegido para código	El código de material protegido describe el código fuente que coincide con un conjunto de códigos fuente de repositorios públicos, que pueden ser emitidos por grandes modelos lingüísticos sin citar adecuadamente los repositorios de origen.

^* Si es propietario del material de texto y desea enviar contenido de texto para la protección, envíe una solicitud.

Escudos de avisos

Tipo	Descripción
Escudo de solicitudes para ataques de evasión de seguridad	Los ataques de evasión de seguridad son solicitudes de usuario diseñadas para provocar que el modelo de IA generativa muestre comportamientos que fue entrenado para evitar o romper las reglas establecidas en el mensaje del sistema. Dichos ataques pueden variar de un papel intrincado a una subversión sutil del objetivo de seguridad.
Escudo de solicitudes frente a ataques indirectos	Los ataques indirectos, también conocidos como ataques indirectos de solicitudes o ataques de inyección de solicitudes entre dominios, son una posible vulnerabilidad en la que terceros colocan instrucciones malintencionadas dentro de documentos a los que el sistema de inteligencia artificial generativa puede acceder y procesar. Requieren inserción de documentos y formato.

Advertencia

La pestaña Definiciones de gravedad de este documento contiene ejemplos de contenido dañino que puede resultar preocupante para algunos lectores.

Niveles de gravedad de odio y equidad

Nivel de gravedad	Descripción	Texto de ejemplo
Caja fuerte	El contenido es seguro, pero puede contener términos relacionados con el odio y la equidad usados en contextos genéricos y seguros, como: Education Media Estadísticas oficiales Historial Medicina Ciencia Otros contextos similares	`"Black people should not be killed by police or mistreated just because of their skin color."`
Bajo	Contenido que contiene caracterización positiva o protección de los grupos de identidades, muestra la discriminación, los estereotipos y los prejuicios, los juicios o las actitudes o opiniones relacionadas con el discurso de odio o los grupos de identidades dirigidos. Esta característica incluye: Insultos en trabajos de investigación, diccionarios o medios de comunicación con una cita directa Discurso general de odio dirigido a objetos, individuos o grupos Discurso de odio limitado o representaciones de sentimiento negativo en contextos ficticios (por ejemplo, juegos, películas, literatura)	`"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."`
Media	Contenido que contengan insultos, acoso, intimidación, deshumanización o menosprecio de personas o grupos. Esto incluye: Lenguaje que se burla e imita los atributos de los grupos identitarios Descripción de individuos o grupos como inferiores o deficientes Denegación o eliminación de la existencia de grupos identitarios Textos que niegan acontecimientos históricos, bien documentados y violentos como el Holocausto, la esclavitud o la colonización	`"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."`
Alto	Contenido que contenga discursos de odio como propaganda que amenace o llame a la violencia contra grupos identitarios, radicalice, reclute o incite a unirse a esfuerzos extremistas o difunda discursos de odio. Esto incluye: Lenguaje incendiario, ofensivo y vulgar dirigido a personas o grupos identitarios específicos Pretensiones de superioridad para justificar la discriminación, la segregación o la exclusión Textos que contengan cualquier forma de glorificación de la simbología nazi y de las SS, del KKK y de la bandera confederada fuera de entornos históricos, educativos o artísticos Textos que muestren la preparación de delitos de odio, la alabanza y glorificación de la violencia contra grupos identitarios, o que alaben, glorifiquen o respalden el genocidio.	`"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"`

Niveles de gravedad sexual

Nivel de gravedad	Descripción	Texto de ejemplo
Caja fuerte	El contenido es seguro pero puede contener términos relacionados con el sexo utilizados en contextos genéricos y seguros, como: Educación Multimedia Estadísticas oficiales Historial Medicina Ciencia Menciones de relaciones familiares o amorosas	`"Fewer young adults are having sex than in previous generations."`
Bajo	Contenido que exprese prejuicios, juicios u opiniones sobre temas relacionados con el sexo o que mencionen términos relacionados con el sexo en experiencias ficticias o reales que no sean extremadamente gráficas. Esto incluye: Menciones de anatomía sexual o escenas sexuales en contextos ficticios y artísticos Prescripciones médicas y diagnóstico Experiencias personales, problemas sexuales y traumas con cierto contenido gráfico, incluidos mecanismos y recursos para afrontarlos	`"We made out for a while, and he started to feel me up. I felt a bulge in his pants."`
Media	Contenido que describe la excitación y la actividad sexual en términos explícitos y gráficos, incluye fantasías sobre sexo y abuso sexual. Esto incluye: Menciones de estimulación sexual y masturbación Pornografía limitada a los negocios y prostitución, acompañantes, etc. como experiencias profesionales sin escenas de sexo Anuncios de productos para adultos, como juguetes sexuales Experiencias y descripciones personales relacionadas con masajes sexuales, eróticos o tántricos, clubes de striptease, espectáculos eróticos, atributos y prácticas BDSM	`"We both climaxed at the same time."`
Alto	Contenido que describe la oferta de servicios sexuales comerciales, con descripciones detalladas de la actividad sexual, agresiones sexuales y violaciones, así como intercambio erótico de poder no consentido, abuso y voyerismo. Esto también incluye contenido que se usa para promover, aprobar o glorificar actos sexuales extremos o ilegales. Esto incluye: Cualquier representación de material de abuso sexual infantil (CSAM), incluida cualquier referencia explícita o potencial al sexo entre menores de edad Captación, abuso y otros tipos de explotación infantil Referencias explícitas o potenciales al incesto, la zoofilia, la necrofilia, etc. Captación para el tráfico sexual de seres humanos, incluida la manipulación de las víctimas	`"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."`

Niveles de gravedad de violencia

Nivel de gravedad	Descripción	Texto de ejemplo
Caja fuerte	El contenido es seguro pero puede contener términos relacionados con la violencia utilizados en contextos genéricos y seguros, como: Educación Multimedia Estadísticas oficiales Historial Medicina Ciencia Objetos comunes cuando no se usan como armas Caza o tiro deportivo y especificaciones técnicas de armas de fuego	`"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."`
Bajo	Contenido en contextos ficticios (por ejemplo, juegos, literatura, artes) que representan escenas violentas o gráficas sin exaltación, aprobación o mal intención. Esto incluye: Experiencias personales de violencia (sin intención violenta) Opiniones sesgadas, prejuiciosas, sentenciosas o tendenciosas sobre la violencia Menciones de actos violentos y muerte de baja intensidad	`"Some people just need to be slapped."`
Media	Contenido que contiene representaciones gráficas de violencia y muerte de intensidad media, así como fantasías sobre actos violentos o amenazas. Esto incluye: Textos que atribuyen la culpa a la víctima o presentan a los agresores de forma positiva Referencias históricas al genocidio y al Holocausto sin aprobación ni ensalzamiento Referencias a tiroteos masivos conocidos sin aprobación ni ensalzamiento Referencias a grupos y acontecimientos terroristas y extremistas violentos sin aprobación ni ensalzamiento Textos que soliciten consejo o recomendación o textos que proporcionen instrucciones sobre cómo realizar un acto violento contra un animal, un individuo, un grupo de individuos o un objeto o infraestructura que pueda provocar daños individuales o masivos. Acoso e intimidación	`"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."`
Alto	Contenido que contenga propaganda terrorista o extremista violenta e ideología violenta en Internet que describa, alabe, apoye, respalde o glorifique asesinatos como parte de una actividad terrorista, ofertas de ayuda a organizaciones o causas terroristas. Esto incluye: Textos que solicitan instrucciones sobre la afiliación a grupos terroristas y extremistas violentos Textos que proporcionan instrucciones sobre cómo reclutar adeptos, influir en la gente hacia una causa terrorista o una ideología extremista, adoptar opiniones radicales o proporcionar formación sobre cómo operan los grupos terroristas y extremistas violentos, o proporcionar información sobre sus líderes y miembros Textos que planifican y coordinan ataques contra individuos o grupos de personas, incluidos los tiroteos, el uso de bombas y explosivos contra infraestructuras civiles o los ataques con armas blancas cuando son realizados por no combatientes o no terroristas Contenido que haga referencia al trabajo forzado, incluidos los niños, la servidumbre doméstica, el acoso y los procedimientos médicos forzados	`"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."`

Niveles de gravedad de autolesiones

Nivel de gravedad	Descripción	Texto de ejemplo
Caja fuerte	El contenido es seguro pero puede contener términos relacionados con la autolesión utilizados en contextos genéricos y seguros, como: Estadísticas oficiales Educación Multimedia Medicina Acciones que describen autolesiones accidentales, consejos de primeros auxilios, etc.	`"Binging and purging may be a warning sign for people with a history of extreme weight loss."`
Bajo	Contenido que contiene referencias a personajes planeando o cometiendo suicidio en un contexto ficticio (por ejemplo, literatura, películas) o contiene representaciones de actos de auto daño o suicidio a baja intensidad. Esto incluye: Puntos de vista personales sesgados, prejuiciosos, sentenciosos u tendenciosos sobre la autolesión Asociaciones con trastornos alimentarios, buscar o dar instrucciones para perder peso de forma drástica y poco saludable Experiencias personales relacionadas con las autolesiones, incluida la búsqueda de ayuda profesional	`"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"`
Media	Contenidos que se burla de las víctimas o supervivientes de autolesiones como los trastornos alimentarios o el suicidio, así como el acoso y la intimidación que incitan y promueven los actos de autolesión. Esto incluye: Autolesión presentada como solución a un problema Fantasías, deseos, anhelos o experiencias personales sobre autolesión/suicidio Textos que buscan o dan consejos, instrucciones o recomendaciones sobre cómo autolesionarse Acoso e intimidación que incitan y promueven actos de autolesión	`"Go kill yourself, you are worthless."`
Alto	Contenido que incluye la búsqueda de consejo o proporciona instrucciones y métodos sobre cómo realizar autolesiones que conducen a la muerte o cómo cometer suicidio, así como la glorificación y el respaldo del suicidio, u otros tipos graves de autolesión. Esto incluye: Textos que indican cómo escribir un mensaje de despedida para la familia Autodecapitación Quemarse vivo	`"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."`

Contenido de la imagen

Advertencia
Definiciones de gravedad

Advertencia

La pestaña Definiciones de gravedad de este documento contiene ejemplos de contenido dañino que puede resultar preocupante para algunos lectores.

Niveles de gravedad de odio y equidad

Nivel de gravedad	Descripción	Ejemplo de imagen
Caja fuerte	El contenido es seguro, pero puede contener imágenes relacionadas con el odio y la equidad, sin opiniones o con opiniones neutras, sin carácter discriminatorio ni ofensivo, en los siguientes contextos o en otros similares: Periodístico Historical (Historial) Medicina Información legal Educativos Geográfica	Banderas que no sean la bandera confederada de EE. UU., por ejemplo, banderas con cruces de otros países o estados. Una imagen de la bandera Union Jack de Gran Bretaña. Representación de la emancipación de personas esclavizadas en estados Unidos en fotos históricas.
Bajo	Contenido con opiniones positivas, falsas opiniones positivas o con opiniones negativas y sesgadas que hacen distinciones entre grupos de identidad y otras personas. Este contenido tiene la finalidad de suscitar una respuesta emocional. Esta característica incluye: Protección Simbología nazi, la bandera confederada de EE. UU., simbología del Ku Klux Klan Estereotipos Discriminación en el empleo	Representaciones del movimiento "No al discurso del odio". Representaciones de candidatos a puestos de trabajo desfavorecidos en las entrevistas, como los candidatos con discapacidades.
Media	Contenido con opiniones negativas hacia grupos de identidad y otras personas que incitan a la acción contra un grupo de identidad y fomentan opiniones de superioridad. Esta característica incluye: Insulto, aislamiento o ridiculización Variaciones y artículos comerciales de la bandera nazi, la bandera confederada de EE. UU. y la comunidad LGBTQIA+	Imágenes que fomentan el rechazo social de [grupos de identidad]. Imágenes que representan la teoría de la mejora racial y la eugenesia.
Alto	Contenido con opiniones negativas y discurso de odio hacia grupos de identidad que provocan la aparición de discursos de odio o delitos de odio. Esta característica incluye: Racismo Ataques contra la comunidad LGBTQIA+ Discriminación de las personas discapacitadas Discriminación por sexo Ensalzamiento de la simbología nazi, la bandera confederada de EE. UU.o la simbología del Ku Klux Klan Bandera confederada de EE. UU. violenta.	Imágenes antisemitas Imágenes que representan la "cruz sureña" (cruz de la bandera confederada de EE.UU.) que se caracteriza por una cruz azul de San Andrés (cruz diagonal) y con una afiliación claramente violenta (por ejemplo, armas de fuego en exhibición o en uso).

Niveles de gravedad sexual

Nivel de gravedad	Descripción	Ejemplo de imagen
Caja fuerte	El contenido es seguro, pero usa imágenes sexuales en un sentido general. Esta característica incluye: Relaciones familiares y románticas Desnudo no sexual Ropa Objetos comunes Postura o actividad no sexual Apareamiento animal Bienestar sexual	Representaciones de abrazos o de contactos físicos no sexuales. Representaciones de muestras físicas de afecto, como besos sin lengua y sin desnudez.
Bajo	Contenido que describe comportamientos o actos sexualmente sugerentes. Esta característica incluye: Experiencias personales Modelaje de moda Desnudez en obras de arte Arte corporal Exhibición provocativa	Representaciones de personas
Media	Contenido con contenido erótico o pornográfico comercial o amateur sin representación fotográfica visual de penetración y con personas desnudas o semidesnudas involucradas en escenas sexuales cuyo objetivo es excitar sexualmente. Esta característica incluye: Modelaje sexual Desnudez blanda en obras de arte Trabajos sexuales o tiendas de artículos sexuales Actividad sexual oculta Producción pornográfica entre bastidores Baile en barra	Representaciones de relaciones sexuales que pueden estar parcialmente ocultas pero presentes claramente en la imagen.
Alto	Contenido con representaciones explícitas y detalladas de órganos sexuales y actos sexuales, incluidos actos ilegales. Esta característica incluye: Pornografía amateur blanda y dura Oferta de servicios sexuales Voyerismo Sexo en obras de arte BDSM sin consentimiento o violación Explotación y abuso sexual infantil Captación de niños con fines sexuales Incesto	Representaciones de participación en actividades sexuales con animales o cadáveres.

Niveles de gravedad de violencia

Nivel de gravedad	Descripción	Ejemplo de imagen
Caja fuerte	El contenido es seguro, pero usa imágenes relacionadas con la violencia en un sentido general. Esta característica incluye: Persona en posición tumbada o dormida Objetos comunes Actividad no violenta Cuerdas que no hacen referencia a sogas con nudo corredizo Herramientas cortantes usadas en la cocina o para coser Heridas, cicatrices y tratamiento quirúrgico Caza y deporte de tiro Armas de fuego de juguete o de imitación. Prácticas de combate. Vandalismo y daños a objetos Símbolos terroristas sin marca	Representaciones de armas de fuego y armas blancas no realistas.
Bajo	Contenido con imágenes y actos relacionados con la violencia en contextos reales o ficticios con un nivel bajo de detalles sangrientos. Esta característica incluye: Armas de fuego, otros tipos de armas y herramientas con hojas cortantes en exposición y en uso. Cadáver no realista Violencia no realista Armas animadas Lesiones leves y experiencia personal Cuerdas que hacen referencia a sogas con nudo corredizo Muerte en contextos históricos, educativos o funerarios Simbología terrorista no realista Corridas de toros	Representaciones de banderas del Estado Islámico o al-Qaeda.
Media	Contenido con violencia gráfica moderada y actos violentos dirigidos a un objetivo determinado. Esta característica incluye: Autopsia Escena de crimen o muerte Muerte de animal (natural o por caza), sacrificio animal, abuso de animales Esclavitud Genocidio y asesinatos masivos en contextos históricos y educativos Matadero Violencia doméstica y abuso físico Acoso Armas de fuego y otros tipos de armas usadas contra un objetivo.	Representaciones del uso de la fuerza y la coerción para dominar o intimidar a una persona de forma agresiva.
Alto	Contenido con representaciones explícitas y detalladas de violencia y actos violentos con un alto nivel de detalles sangrientos. Esta característica incluye: Representaciones gráficas de lesiones y muerte Desmembramiento, decapitación, quemar vivo Descomposición de cadáveres Terrorismo, grupos y banderas terroristas Trabajo forzado y servidumbre, procedimiento médico forzado Acecho Cadáver de acto terrorista o crimen de guerra Tiroteo Otros extremismos	Representaciones de muertes perpetradas por grupos terroristas identificables por banderas y símbolos del Estado Islámico.

Niveles de gravedad de autolesiones

Nivel de gravedad	Descripción	Ejemplo de imagen
Caja fuerte	El contenido es seguro, pero usa imágenes relacionadas con la autolesión en un sentido general. Esta característica incluye: Grasa corporal baja Acto de no autolesión Lesiones corporales accidentales	Representaciones del salto con paracaídas desde un avión.
Bajo	Contenido con imágenes y actos relacionados con la autolesión en contextos reales o ficticios con un nivel bajo de detalles sangrientos. Esta característica incluye: Cicatrices Lesiones autoinfligidas en recuperación Autolesión no realista Individuos o animales demacrados	Representaciones de actos, herramientas, lesiones y estados emocionales relacionados con la autolesión.
Media	Contenido con imágenes gráficas moderadas relacionadas con la autolesión y el suicidio. Esta característica incluye: Autopsia Escena de crimen o muerte Acoso	Representaciones del uso de la fuerza y la coacción para ejercer una dominación o una intimidación agresivas sobre una persona con el fin de que se autolesione.
Alto	Contenido con representaciones explícitas y detalladas de autolesiones y suicidios con un alto nivel de detalles sangrientos. Esta característica incluye: Acto de autolesión inminente Actos de autolesión Suicidio	Representaciones de un suicidio intencionado, cuando la persona se ha suicidado tirándose de un edificio alto.

Capacidad de configuración (versión preliminar)

La configuración de filtrado de contenido predeterminada para la serie de modelos GPT se establece para filtrar en el umbral de gravedad medio para las cuatro categorías de daño de contenido (odio, violencia, sexual y autolesión) y se aplica a ambos avisos (texto, texto o imagen multi modal) y finalizaciones (texto). Esto significa que el contenido que se detecta en el nivel de gravedad medio o alto se filtra, mientras que el contenido detectado en el nivel de gravedad bajo no se filtra por los filtros de contenido. Para DALL-E, el umbral de gravedad predeterminado se establece en bajo para las solicitudes (texto) y finalizaciones (imágenes), por lo que el contenido detectado en niveles de gravedad bajo, medio o alto se filtra. La característica de configuración está disponible en versión preliminar y permite a los clientes ajustar la configuración, por separado para solicitudes y finalizaciones, para filtrar el contenido de cada categoría de contenido en distintos niveles de gravedad, tal y como se describe en la tabla siguiente:

Gravedad filtrada	Configurable para solicitudes	Configurable para finalizaciones	Descripciones
Bajo, medio, alto	Sí	Sí	Configuración de filtrado más estricta. El contenido detectado en niveles de gravedad bajo, medio y alto se filtra.
Medio y alto	Sí	Sí	El contenido detectado en el nivel de gravedad bajo no se filtra, sino que se filtra el contenido de un nivel medio y alto.
Alto	Sí	Sí	El contenido detectado en niveles de gravedad bajo y medio no se filtra. Solo se filtra el contenido en el nivel de gravedad alto. Requiere aprobación¹.
Sin filtros	Si se aprueba¹	Si se aprueba¹	No se filtra ningún contenido, independientemente del nivel de gravedad detectado. Requiere aprobación¹.

¹ En el caso de los modelos de Azure OpenAI, solo los clientes aprobados para el filtrado de contenidos modificado tienen el control total de los filtros de contenido y pueden desactivarlos. Solicite filtros de contenido modificado mediante este formulario: Revisión de acceso limitado de Azure OpenAI: filtros de contenido modificados y supervisión de abusos (microsoft.com)

Esta característica en versión preliminar está disponible para los siguientes modelos de Azure OpenAI:

Serie de modelos GPT (texto)
GPT-4 Turbo Vision 2024-04-09 (texto o imagen multimodal)
DALL-E 2 y 3 (imagen)

Las configuraciones de filtrado de contenido se crean dentro de un recurso en Azure AI Studio y se pueden asociar a implementaciones. Obtenga más información sobre la capacidad de configuración aquí.

Los clientes son responsables de garantizar que las aplicaciones que integran Azure OpenAI cumplan con el código de conducta.

Detalles del escenario

Cuando el sistema de filtrado de contenidos detecte contenido nocivo, recibirá un error en la llamada a la API si la indicación se ha considerado inapropiada o el finish_reason de la respuesta será content_filter para indicar que se ha filtrado parte de la información completada. Cuando compile su aplicación o sistema, querrá tener en cuenta estos escenarios en los que la API de finalizaciones filtra el contenido devuelto, lo que puede dar lugar a que el contenido esté incompleto. La manera de actuar sobre esta información será específica de la aplicación. El comportamiento puede resumirse en los siguientes puntos:

Los mensajes que se clasifican en una categoría filtrada y nivel de gravedad devolverán un error HTTP 400.
Las llamadas de finalización sin streaming no devolverán ningún contenido cuando se filtre el contenido. El valor finish_reason se establecerá en content_filter. En casos raros con respuestas más largas, se puede devolver un resultado parcial. En estos casos, se actualizará finish_reason.
Para las llamadas de finalización de transmisión, los segmentos se devolverán al usuario a medida que se completen. El servicio continuará transmitiendo hasta alcanzar un token de detención, una longitud o cuando se detecte el contenido clasificado en una categoría filtrada y nivel de gravedad.

Escenario: se envía una llamada de finalización sin streaming que solicita varias salidas; ningún contenido se clasifica en una categoría filtrada y en el nivel de gravedad

En la tabla siguiente se describen las distintas formas en que puede aparecer el filtrado de contenidos:

Código de respuesta HTTP	Comportamiento de respuesta
200	En los casos en que toda la generación pasa los filtros tal y como están configurados, no se agrega ningún detalle de moderación de contenido a la respuesta. El `finish_reason` para cada generación será o bien stop o bien length.