Modelos de Azure OpenAI Service

Artículo
05/03/2024

Azure OpenAI Service cuenta con una amplia gama de modelos con diferentes funcionalidades y puntos de precio. La disponibilidad de los modelos varía según la región. Para GPT-3 y otros modelos que se retirarán en julio de 2024, consulte Modelos heredados de Azure OpenAI Service.

Modelos	Descripción
GPT-4 Turbo 🆕	Los modelos de Azure OpenAI más recientes con versiones bidireccionales que pueden aceptar texto e imágenes como entrada.
GPT-4	Conjunto de modelos que mejoran GPT-3.5 y que pueden reconocer y generar lenguaje natural y código.
GPT-3.5	Conjunto de modelos que mejoran GPT-3 y que pueden reconocer y generar lenguaje natural y código.
Incrustraciones	Un conjunto de modelos que pueden convertir texto en forma vectorial numérica para facilitar la similitud del texto.
DALL-E	Una serie de modelos que pueden generar imágenes originales a partir de lenguaje natural.
Whisper	Serie de modelos en versión preliminar que pueden transcribir y traducir voz en texto.
Texto a voz (versión preliminar)	Una serie de modelos en versión preliminar que pueden sintetizar la conversión de texto a voz.

GPT-4 Turbo

GPT-4 Turbo es un modelo multimodal grande (acepta entradas de texto o imagen y genera texto) que puede resolver problemas difíciles con mayor precisión que cualquiera de los modelos anteriores de OpenAI. Al igual que GPT-3.5 Turbo y los modelos GPT-4 antiguos, GPT-4 Turbo están optimizados para chat y funcionan bien para las tareas de finalización tradicionales.

La versión más reciente de disponibilidad general de GPT-4 Turbo es:

gpt-4Versiónturbo-2024-04-09:

Este es el reemplazo de los siguientes modelos en versión preliminar:

gpt-4Versión1106-Preview:
gpt-4Versión0125-Preview:
gpt-4Versiónvision-preview:

Diferencias entre OpenAI y Azure OpenAI GPT-4 Turbo con el modelo de disponibilidad general de Vision

La versión de OpenAI del último modelo turbo 0409 admite el modo JSON y la llamada a funciones para todas las solicitudes de inferencia.
La versión de Azure OpenAI de la turbo-2024-04-09 más reciente actualmente no admite el uso del modo JSON y la llamada a funciones al realizar solicitudes de inferencia con entrada de imagen (visión). Las solicitudes de entrada basadas en texto admiten el modo JSON y las llamadas a funciones.

Diferencias de gpt-4 vision-preview

Las mejoras específicas de Azure AI Vision con GPT-4 Turbo con Vision no se admiten para la gpt-4Versión:turbo-2024-04-09. Esto incluye el reconocimiento óptico de caracteres (OCR), la conexión a tierra de objetos, las indicaciones de vídeo y un mejor tratamiento de sus datos con imágenes.

Disponibilidad regional

Para obtener información sobre la disponibilidad regional del modelo, consulte la matriz del modelo.

Implementación de GPT-4 Turbo con disponibilidad general de Vision

Para implementar el modelo de disponibilidad general en la interfaz de usuario de Studio, seleccione GPT-4 y elija la versión de turbo-2024-04-09 en el menú desplegable. La cuota predeterminada para el modelo gpt-4-turbo-2024-04-09 será la misma que la cuota actual para GPT-4-Turbo. Consulte los límites de cuota regionales.

GPT-4

GPT-4 es el predecesor de GPT-4 Turbo. Los modelos GPT-4 y GPT-4 Turbo tienen un nombre de modelo base de gpt-4. Puede distinguir entre los modelos GPT-4 y Turbo examinando la versión del modelo.

gpt-4Versión0314
gpt-4Versión0613
gpt-4-32kVersión0613

Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.

Modelos GPT-4 y GPT-4 Turbo

Estos modelos solo se pueden usar con la API de finalización de chat.

Consulte Versiones del modelo para obtener información sobre cómo azure OpenAI Service controla las actualizaciones de versiones del modelo y trabajar con modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-4.

Id. de modelo	Solicitud máxima (tokens)	Datos de entrenamiento (hasta)
`gpt-4` (0314)	8192	Septiembre de 2021
`gpt-4-32k`(0314)	32 768	Septiembre de 2021
`gpt-4` (0613)	8192	Septiembre de 2021
`gpt-4-32k` (0613)	32 768	Septiembre de 2021
`gpt-4` (1106-Preview)¹ GPT-4 Turbo versión preliminar	Entrada: 128 000 Salida: 4096	Abril de 2023
`gpt-4` (0125-Preview)¹ GPT-4 Turbo versión preliminar	Entrada: 128 000 Salida: 4096	Dic. de 2023
`gpt-4` (vision-preview)² GPT-4 Turbo con Vision (versión preliminar)	Entrada: 128 000 Salida: 4096	Abril de 2023
`gpt-4` (turbo-2024-04-09) 🆕 GPT-4 Turbo con Vision GA	Entrada: 128 000 Salida: 4096	Dic. de 2023

¹ GPT-4 Turbo Preview = gpt-4 (0125-Preview) o gpt-4 (1106-Preview). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. En versión, seleccione (0125-Preview) o (1106-Preview).

² GPT-4 Turbo con Vision (versión preliminar) = gpt-4 (vision-preview). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. Para la Versión del modelo seleccione vision-preview.

Precaución

No se recomienda usar modelos de versión preliminar en producción. Actualizaremos todas las implementaciones de modelos de versión preliminar a versiones preliminares futuras y a una versión estable. Los modelos designados en versión preliminar no siguen el ciclo de vida estándar del modelo de Azure OpenAI.

Nota:

La versión 0314 de gpt-4 y gpt-4-32k se retirará no antes del 5 de julio de 2024. La versión 0613 de gpt-4 y gpt-4-32k se retirará no antes del 30 de septiembre de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.

GPT-4 versión 0125-preview es una versión actualizada de la versión preliminar GPT-4 Turbo publicada anteriormente como versión 1106-preview.
GPT-4 versión 0125-preview completa tareas como la generación de código más completamente en comparación con gpt-4-1106-preview. Debido a esto, dependiendo de la tarea, los clientes pueden encontrar que GPT-4-0125-preview genera más salida en comparación con gpt-4-1106-preview. Se recomienda que los clientes comparen las salidas del nuevo modelo. GPT-4-0125-preview también soluciona errores en gpt-4-1106-preview con control UTF-8 para idiomas distintos del inglés. La versión de GPT-4 turbo-2024-04-09 es la versión más reciente de disponibilidad general y reemplaza 0125-Preview, 1106-preview y vision-preview.

Importante

Las versiones de gpt-4 1106-Preview y 0125-Preview se actualizarán con una versión estable de gpt-4 en el futuro. La actualización de implementación de gpt-4 1106-Preview a gpt-4 0125-Preview programada para el 8 de marzo de 2024 ya no se producirá. Las implementaciones de las versiones de gpt-4 1106-Preview y 0125-Preview establecidas en "Actualización automática a predeterminada" y "Actualizar cuando haya expirado" comenzarán a actualizarse después de que se publique la versión estable. Para cada implementación, se realiza una actualización de la versión del modelo sin interrupciones en el servicio para las llamadas API. Las actualizaciones se llevan a cabo por región y se espera que el proceso de actualización completo tarde 2 semanas. Las implementaciones de las versiones de gpt-4 1106-Preview y 0125-Preview establecidas en "No actualizar automáticamente" no se actualizarán y dejarán de funcionar cuando se actualice la versión preliminar en la región.

GPT-3.5

Los modelos GPT-3.5 pueden comprender y generar lenguaje natural o código. El modelo más capaz y rentable de la familia GPT-3.5 es GPT-3.5 Turbo, que se ha optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. GPT-3.5 Turbo está disponible para su uso con la API de finalización de chat. GPT-3.5 Turbo Instruct tiene funcionalidades similares a text-davinci-003 que usa la API de finalizaciones en lugar de la API de finalizaciones de chat. Se recomienda usar GPT-3.5 Turbo y GPT-3.5 Turbo Instruct en vez de los modelos GPT-3.5 y GPT-3.5 heredados.

gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct

Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.

Para obtener más información sobre cómo interactuar con GPT-3.5 Turbo y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.

Inserciones

text-embedding-3-large es el modelo de inserción más reciente y capaz. No es posible actualizar entre modelos de inserción. Para pasar de usar text-embedding-ada-002 a text-embedding-3-large, tendría que generar nuevas inserciones.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

En las pruebas, OpenAI informa de los modelos de inserción de tercera generación tanto grandes como pequeños que ofrecen un mejor rendimiento medio de recuperación de varios lenguajes con el punto de referencia MIRACL, a la vez que mantiene el rendimiento de las tareas en inglés con el punto de referencia MTEB.

Punto de referencia de la evaluación	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
Promedio de MIRACL	31,4	44,0	54.9
Promedio de MTEB	61,0	62,3	64,6

Los modelos de inserción de tercera generación admiten reducir el tamaño de la inserción mediante un nuevo parámetro dimensions. Normalmente, las inserciones más grandes son más costosas desde una perspectiva de proceso, memoria y almacenamiento. La capacidad de ajustar el número de dimensiones permite un mayor control sobre el costo general y el rendimiento. El parámetro dimensions no se admite en todas las versiones de la biblioteca de Python de OpenAI 1.x; para aprovechar este parámetro, se recomienda actualizar a la versión más reciente: pip install openai --upgrade.

Las pruebas del punto de referencia MTEB de OpenAI han detectado que, incluso cuando las dimensiones del modelo de tercera generación se reducen a menos de text-embeddings-ada-002 1536 dimensiones, el rendimiento sigue siendo ligeramente mejor.

DALL-E

Los modelos DALL-E generan imágenes a partir de mensajes de texto que proporciona el usuario. DALL-E 3 está disponible con carácter general para su uso con las API REST. DALL-E 2 y DALL-E 3 con SDK de cliente están en versión preliminar.

Whisper

Los modelos de Susurro se pueden usar para la conversión de voz en texto.

También puede usar el modelo de Whisper mediante la API de transcripción por lotes de Voz de Azure AI. Consulte ¿Qué es el modelo Whisper? para obtener más información sobre cuándo usar Voz de Azure AI frente a Azure OpenAI Service.

Texto a voz (versión preliminar)

Los modelos de texto a voz de OpenAI, actualmente en versión preliminar, se pueden usar para sintetizar texto a voz.

También puede usar las voces de texto a voz de OpenAI a través de Voz de Azure AI. Para obtener más información, consulte la guía Voces de texto a voz de OpenAI mediante Azure OpenAI Service o Voz de Azure AI.

Tabla de resumen de los modelos y disponibilidad por región

Nota:

En este artículo se trata principalmente la disponibilidad del modelo o región que se aplica a todos los clientes de Azure OpenAI con tipos de implementación de Estándar. Algunos clientes seleccionados tienen acceso a combinaciones de modelos o regiones que no aparecen en la tabla unificada siguiente. Para obtener más información sobre las implementaciones aprovisionadas, consulte nuestra Guía aprovisionada.

Disponibilidad del modelo de implementación estándar

Región	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, turbo-2024-04-09	gpt-4, vision-preview	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613	gpt-35-turbo-instruct, 0914	text-embedding-ada-002, 1	text-embedding-ada-002, 2	text-embedding-3-small, 1	text-embedding-3-large, 1	babbage-002, 1	dall-e-3, 3.0	davinci-002, 1	tts, 001	tts-hd, 001	whisper, 001
australiaeast	✅	✅	-	-	✅	✅	-	✅	✅	-	✅	-	-	✅	-	-	-	✅	-	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-
canadaeast	✅	✅	-	-	-	✅	-	✅	✅	✅	✅	-	-	✅	✅	✅	-	-	-	-	-	-
estado	-	-	✅	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	-	✅	-	-	-	-
eastus2	-	✅	-	✅	-	-	-	✅	-	-	✅	-	-	✅	✅	✅	-	-	-	-	-	✅
francecentral	✅	✅	-	-	-	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	-	-	-	-
japaneast	-	-	-	-	✅	-	-	✅	-	-	✅	-	-	✅	-	-	-	-	-	-	-	-
northcentralus	-	-	✅	-	-	-	-	✅	-	✅	✅	-	-	✅	-	-	✅	-	✅	✅	✅	✅
norwayeast	-	✅	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	✅
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-
southcentralus	-	-	✅	-	-	-	✅	-	-	✅	-	-	✅	✅	-	-	-	-	-	-	-	-
southindia	-	✅	-	-	-	-	-	-	✅	-	-	-	-	✅	-	-	-	-	-	-	-	✅
suecia central	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	-	✅	✅	✅	✅	✅	✅
norte de suiza	✅	-	-	-	✅	✅	-	✅	-	-	✅	-	-	✅	-	-	-	-	-	-	-	-
uksouth	-	✅	✅	-	-	-	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	-	-	-	-
westeurope	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	✅
westus	-	✅	-	-	✅	-	-	-	✅	-	-	-	-	✅	-	-	-	-	-	-	-	-
westus3	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-

Esta tabla no incluye la disponibilidad regional del ajuste preciso; consulte la sección dedicada al ajuste preciso para obtener esta información.

Cuota de modelo de implementación estándar

La cuota predeterminada de los modelos varía según el modelo y la región. Los límites de cuota predeterminados están sujetos a cambios.

La cuota de las implementaciones estándar se describe en términos de tokens por minuto (TPM).

Region	GPT-4	GPT-4-32K	GPT-4-Turbo	GPT-4-Turbo-V	GPT-35-Turbo	GPT-35-Turbo-Instruct	Text-Embedding-Ada-002	text-embedding-3-small	text-embedding-3-large	Babbage-002	Babbage-002 - finetune	Davinci-002	Davinci-002 - finetune	GPT-35-Turbo - finetune	GPT-35-Turbo-1106 - finetune	GPT-35-Turbo-0125 - finetune
australiaeast	40 000	80 000	80 000	30 K	300 000	-	350 000	-	-	-	-	-	-	-	-	-
brazilsouth	-	-	-	-	-	-	350 000	-	-	-	-	-	-	-	-	-
canadaeast	40 000	80 000	80 000	-	300 000	-	350 000	350 000	350 000	-	-	-	-	-	-	-
estado	-	-	80 000	-	240 000	240 000	240 000	350 000	350 000	-	-	-	-	-	-	-
eastus2	-	-	80 000	-	300 000	-	350 000	350 000	350 000	-	-	-	-	250 000	250 000	250 000
francecentral	20 000	60 000	80 000	-	240 000	-	240 000	-	-	-	-	-	-	-	-	-
japaneast	-	-	-	30 K	300 000	-	350 000	-	-	-	-	-	-	-	-	-
northcentralus	-	-	80 000	-	300 000	-	350 000	-	-	240 000	250 000	240 000	250 000	250 000	250 000	250 000
norwayeast	-	-	150 000	-	-	-	350 000	-	-	-	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	350 000	-	-	-	-	-	-	-	-	-
southcentralus	-	-	80 000	-	240 000	-	240 000	-	-	-	-	-	-	-	-	-
southindia	-	-	150 000	-	300 000	-	350 000	-	-	-	-	-	-	-	-	-
suecia central	40 000	80 000	150 000	30 K	300 000	240 000	350 000	-	-	240 000	250 000	240 000	250 000	250 000	250 000	250 000
norte de suiza	40 000	80 000	-	30 K	300 000	-	350 000	-	-	-	-	-	-	-	-	-
switzerlandwest	-	-	-	-	-	-	-	-	-	-	250 000	-	250 000	250 000	250 000	250 000
uksouth	-	-	80 000	-	240 000	-	350 000	-	-	-	-	-	-	-	-	-
westeurope	-	-	-	-	240 000	-	240 000	-	-	-	-	-	-	-	-	-
westus	-	-	80 000	30 K	300 000	-	350 000	-	-	-	-	-	-	-	-	-
westus3	-	-	-	-	-	-	350 000	-	-	-	-	-	-	-	-	-

1 K = 1000 tokens por minuto (TPM). La relación entre TPM y las solicitudes por minuto (RPM) se define actualmente como 6 RPM por 1000 TPM.

Disponibilidad del modelo de implementación aprovisionado

Región	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4-32k, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
australiaeast	✅	✅	✅	✅	✅	✅
brazilsouth	✅	✅	-	✅	✅	-
canadacentral	✅	-	-	✅	-	✅
canadaeast	✅	✅	-	-	✅	-
estado	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	-	✅
germanywestcentral	✅	✅	✅	✅	✅	-
japaneast	-	✅	✅	-	-	✅
koreacentral	✅	-	-	✅	✅	-
northcentralus	✅	✅	✅	✅	✅	✅
norwayeast	✅	-	✅	✅	-	-
polandcentral	✅	✅	✅	✅	✅	✅
southafricanorth	✅	✅	-	✅	✅	-
southcentralus	✅	✅	✅	✅	✅	✅
southindia	✅	✅	✅	✅	✅	✅
suecia central	✅	✅	✅	✅	✅	✅
norte de suiza	✅	✅	✅	✅	✅	✅
switzerlandwest	-	-	-	-	-	✅
uksouth	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅

¿Cómo obtengo acceso a Aprovisionado?

Debe hablar con el equipo de ventas o de cuenta de Microsoft para adquirir el rendimiento aprovisionado. Si no tiene equipo de ventas o de cuenta, desafortunadamente en este momento no puede comprar el rendimiento aprovisionado.

Para obtener más información sobre las implementaciones aprovisionadas, consulte nuestra Guía aprovisionada.

Disponibilidad del modelo GPT-4 y GPT-4 Turbo

Regiones de la nube pública

Región	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613
australiaeast	✅	✅	-	✅	-	✅
canadaeast	✅	✅	-	-	-	✅
estado	-	-	✅	-	-	-
eastus2	-	✅	-	-	✅	-
francecentral	✅	✅	-	-	-	✅
japaneast	-	-	-	✅	-	-
northcentralus	-	-	✅	-	-	-
norwayeast	-	✅	-	-	-	-
southcentralus	-	-	✅	-	-	-
southindia	-	✅	-	-	-	-
suecia central	✅	✅	-	✅	✅	✅
norte de suiza	✅	-	-	✅	-	✅
uksouth	-	✅	✅	-	-	-
westus	-	✅	-	✅	-	-

Selección del acceso al cliente

Además de las regiones anteriores que están disponibles para todos los clientes de Azure OpenAI, a algunos clientes ya existentes se les ha concedido acceso a las versiones de GPT-4 en regiones adicionales:

Modelo	Region
`gpt-4` (0314)	Este de EE. UU. Centro de Francia Centro-sur de EE. UU. Sur de Reino Unido
`gpt-4` (0613)	Este de EE. UU. Este de EE. UU. 2 Japón Oriental Sur de Reino Unido 2

Regiones de Azure Government

Los siguientes modelos GPT-4 están disponibles con Azure Government:

Id. de modelo	Disponibilidad del modelo
`gpt-4` (1106-Preview)	US Gov - Virginia US Gov: Arizona

Modelos GPT-3.5

Importante

El NUEVO modelo gpt-35-turbo (0125) tiene varias mejoras, incluida una mayor precisión a la hora de responder en los formatos solicitados y una corrección de un error que provocó un problema de codificación de texto para las llamadas a funciones de idioma no inglés.

GPT-3.5 Turbo se usa con la API de finalización de chat. GPT-3.5 Turbo versión 0301 también se puede usar con la API de finalizaciones, aunque esto no se recomienda. GPT3.3.5 Turbo, versiones 0613 y 1106 solo admite la API de finalizaciones de chat.

GPT-3.5 Turbo versión 0301 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.

Consulte Versiones del modelo para saber cómo Azure OpenAI Service controla las actualizaciones de versiones del modelo, y Uso de modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-3.5.

Nota:

La versión 0613 de gpt-35-turbo y gpt-35-turbo-16k se retirará antes del 1 de agosto de 2024. La versión 0301 de gpt-35-turbo se retirará antes del 1 de agosto de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.

Id. de modelo	Solicitud máxima (tokens)	Datos de entrenamiento (hasta)
`gpt-35-turbo`¹ (0301)	4 096	Septiembre de 2021
`gpt-35-turbo` (0613)	4 096	Septiembre de 2021
`gpt-35-turbo-16k` (0613)	16 384	Septiembre de 2021
`gpt-35-turbo-instruct` (0914)	4097	Septiembre de 2021
`gpt-35-turbo` (1106)	Entrada: 16 385 Salida: 4096	Septiembre de 2021
`gpt-35-turbo` (0125) NUEVO	Entrada: 16 385 Salida: 4096	Septiembre de 2021

Disponibilidad del modelo GPT-3.5-Turbo

Regiones de la nube pública

Región	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613	gpt-35-turbo-instruct, 0914
australiaeast	-	✅	✅	-	✅	-
canadaeast	-	✅	✅	✅	✅	-
estado	✅	✅	-	-	✅	✅
eastus2	-	✅	-	-	✅	-
francecentral	✅	✅	✅	-	✅	-
japaneast	-	✅	-	-	✅	-
northcentralus	-	✅	-	✅	✅	-
southcentralus	✅	-	-	✅	-	-
southindia	-	-	✅	-	-	-
suecia central	-	✅	✅	-	✅	✅
norte de suiza	-	✅	-	-	✅	-
uksouth	✅	✅	✅	-	✅	-
westeurope	✅	-	-	-	-	-
westus	-	-	✅	-	-	-

¹ Este modelo aceptará solicitudes > de 4096 tokens. No se recomienda superar el límite de 4096 tokens de entrada, ya que la versión más reciente del modelo está limitada a 4096 tokens. Si se producen problemas al superar 4096 tokens de entrada con este modelo, esta configuración no se admite oficialmente.

Regiones de Azure Government

Los siguientes modelos GPT-3.5 turbo están disponibles con Azure Government:

Id. de modelo	Disponibilidad del modelo
`gpt-35-turbo` (1106-Preview)	US Gov - Virginia

Modelos de incrustación

Estos modelos solo se pueden usar con solicitudes de API de incrustraciones.

Nota:

text-embedding-3-large es el modelo de inserción más reciente y capaz. No es posible actualizar entre modelos de inserción. Para migrar de usar text-embedding-ada-002 a text-embedding-3-large, tendría que generar nuevas inserciones.

Id. de modelo	Solicitud máxima (tokens)	Dimensiones de salida	Datos de entrenamiento (hasta)
`text-embedding-ada-002` (versión 2)	8191	1536	Septiembre de 2021
`text-embedding-ada-002` (versión 1)	2046	1536	Septiembre de 2021
`text-embedding-3-large`	8191	3072	Septiembre de 2021
`text-embedding-3-small`	8191	1536	Septiembre de 2021

Nota:

Al enviar una matriz de entradas para la inserción, el número máximo de elementos de entrada de la matriz por llamada al punto de conexión de inserción es 2048.

Regiones de la nube pública

Región	text-embedding-ada-002, 1	text-embedding-ada-002, 2	text-embedding-3-small, 1	text-embedding-3-large, 1
australiaeast	-	✅	-	-
brazilsouth	-	✅	-	-
canadaeast	-	✅	✅	✅
estado	✅	✅	✅	✅
eastus2	-	✅	✅	✅
francecentral	-	✅	-	-
japaneast	-	✅	-	-
northcentralus	-	✅	-	-
norwayeast	-	✅	-	-
southafricanorth	-	✅	-	-
southcentralus	✅	✅	-	-
southindia	-	✅	-	-
suecia central	-	✅	-	-
norte de suiza	-	✅	-	-
uksouth	-	✅	-	-
westeurope	-	✅	-	-
westus	-	✅	-	-
westus3	-	✅	-	-

Regiones de Azure Government

Los siguientes modelos de incrustación están disponibles con Azure Government:

Id. de modelo	Disponibilidad del modelo
`text-embedding-ada-002` (versión 2)	US Gov - Virginia US Gov: Arizona

Modelos DALL-E

Id. de modelo	Disponibilidad de características	Solicitud máxima (caracteres)
dalle2 (versión preliminar)	Este de EE. UU.	1,000
dall-e-3	Este de EE. UU., Este de Australia, Centro de Suecia	4\.000

Ajuste de modelos

babbage-002 y davinci-002 no están entrenados para seguir las instrucciones. La consulta de estos modelos base solo se debe realizar como punto de referencia a una versión optimizada para evaluar el progreso del entrenamiento.

gpt-35-turbo: el ajuste preciso de este modelo se limita a un subconjunto de regiones y no está disponible en todas las regiones en las que el modelo base está disponible.

Id. de modelo	Regiones de ajuste	Solicitud máxima (tokens)	Datos de entrenamiento (hasta)
`babbage-002`	Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza	16 384	Septiembre de 2021
`davinci-002`	Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza	16 384	Septiembre de 2021
`gpt-35-turbo` (0613)	Este de EE. UU. 2 Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza	4 096	Septiembre de 2021
`gpt-35-turbo` (1106)	Este de EE. UU. 2 Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza	Entrada: 16 385 Salida: 4096	Septiembre de 2021
`gpt-35-turbo` (0125)	Este de EE. UU. 2 Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza	16 385	Septiembre de 2021

Modelos de Whisper

Id. de modelo	Disponibilidad del modelo	Solicitud máxima (tamaño de archivo de audio)
`whisper`	Este de EE. UU. 2 Centro-Norte de EE. UU Este de Noruega Sur de la India Centro de Suecia Oeste de Europa	25 MB

Modelos de texto a voz (versión preliminar)

Id. de modelo	Disponibilidad del modelo
`tts-1`	Centro-Norte de EE. UU Centro de Suecia
`tts-1-hd`	Centro-Norte de EE. UU Centro de Suecia

Asistentes (versión preliminar)

Para Asistentes se necesita una combinación de un modelo compatible y una región compatible. Algunas herramientas y funcionalidades requieren los modelos más recientes. Los siguientes modelos están disponibles en la API de asistentes, el SDK, Inteligencia artificial de Azure Studio y Azure OpenAI Studio. La tabla siguiente es para pago por uso. Para obtener información sobre la disponibilidad de la unidad de rendimiento aprovisionada (PTU), consulte rendimiento aprovisionado.

Region	`gpt-35-turbo (0613)`	`gpt-35-turbo (1106)`	`gpt-4 (0613)`	`gpt-4 (1106)`	`gpt-4 (0125)`
Este de Australia	✅	✅	✅	✅
Este de EE. UU.	✅				✅
Este de EE. UU. 2	✅		✅	✅
Centro de Francia	✅	✅	✅	✅
Este de Noruega				✅
Centro de Suecia	✅	✅	✅	✅
Sur de Reino Unido 2	✅	✅	✅	✅

Modelos de Azure OpenAI Service

GPT-4 Turbo

Diferencias entre OpenAI y Azure OpenAI GPT-4 Turbo con el modelo de disponibilidad general de Vision

Diferencias de gpt-4 vision-preview

Disponibilidad regional

Implementación de GPT-4 Turbo con disponibilidad general de Vision

GPT-4

Modelos GPT-4 y GPT-4 Turbo

GPT-3.5

Inserciones

DALL-E

Whisper

Texto a voz (versión preliminar)

Tabla de resumen de los modelos y disponibilidad por región

Disponibilidad del modelo de implementación estándar

Cuota de modelo de implementación estándar

Disponibilidad del modelo de implementación aprovisionado

¿Cómo obtengo acceso a Aprovisionado?

Disponibilidad del modelo GPT-4 y GPT-4 Turbo

Regiones de la nube pública

Selección del acceso al cliente

Regiones de Azure Government

Modelos GPT-3.5

Disponibilidad del modelo GPT-3.5-Turbo

Regiones de la nube pública

Regiones de Azure Government

Modelos de incrustación

Regiones de la nube pública

Regiones de Azure Government

Modelos DALL-E

Ajuste de modelos

Modelos de Whisper

Modelos de texto a voz (versión preliminar)

Asistentes (versión preliminar)

Pasos siguientes

Recursos adicionales