Modelos de Azure OpenAI Service
Azure OpenAI Service cuenta con una amplia gama de modelos con diferentes funcionalidades y puntos de precio. La disponibilidad de los modelos varía según la región. Para GPT-3 y otros modelos que se retirarán en julio de 2024, consulte Modelos heredados de Azure OpenAI Service.
Modelos | Descripción |
---|---|
GPT-4 Turbo 🆕 | Los modelos de Azure OpenAI más recientes con versiones bidireccionales que pueden aceptar texto e imágenes como entrada. |
GPT-4 | Conjunto de modelos que mejoran GPT-3.5 y que pueden reconocer y generar lenguaje natural y código. |
GPT-3.5 | Conjunto de modelos que mejoran GPT-3 y que pueden reconocer y generar lenguaje natural y código. |
Incrustraciones | Un conjunto de modelos que pueden convertir texto en forma vectorial numérica para facilitar la similitud del texto. |
DALL-E | Una serie de modelos que pueden generar imágenes originales a partir de lenguaje natural. |
Whisper | Serie de modelos en versión preliminar que pueden transcribir y traducir voz en texto. |
Texto a voz (versión preliminar) | Una serie de modelos en versión preliminar que pueden sintetizar la conversión de texto a voz. |
GPT-4 Turbo
GPT-4 Turbo es un modelo multimodal grande (acepta entradas de texto o imagen y genera texto) que puede resolver problemas difíciles con mayor precisión que cualquiera de los modelos anteriores de OpenAI. Al igual que GPT-3.5 Turbo y los modelos GPT-4 antiguos, GPT-4 Turbo están optimizados para chat y funcionan bien para las tareas de finalización tradicionales.
La versión más reciente de disponibilidad general de GPT-4 Turbo es:
gpt-4
Versiónturbo-2024-04-09
:
Este es el reemplazo de los siguientes modelos en versión preliminar:
gpt-4
Versión1106-Preview
:gpt-4
Versión0125-Preview
:gpt-4
Versiónvision-preview
:
Diferencias entre OpenAI y Azure OpenAI GPT-4 Turbo con el modelo de disponibilidad general de Vision
- La versión de OpenAI del último modelo turbo
0409
admite el modo JSON y la llamada a funciones para todas las solicitudes de inferencia. - La versión de Azure OpenAI de la
turbo-2024-04-09
más reciente actualmente no admite el uso del modo JSON y la llamada a funciones al realizar solicitudes de inferencia con entrada de imagen (visión). Las solicitudes de entrada basadas en texto admiten el modo JSON y las llamadas a funciones.
Diferencias de gpt-4 vision-preview
- Las mejoras específicas de Azure AI Vision con GPT-4 Turbo con Vision no se admiten para la
gpt-4
Versión:turbo-2024-04-09
. Esto incluye el reconocimiento óptico de caracteres (OCR), la conexión a tierra de objetos, las indicaciones de vídeo y un mejor tratamiento de sus datos con imágenes.
Disponibilidad regional
Para obtener información sobre la disponibilidad regional del modelo, consulte la matriz del modelo.
Implementación de GPT-4 Turbo con disponibilidad general de Vision
Para implementar el modelo de disponibilidad general en la interfaz de usuario de Studio, seleccione GPT-4
y elija la versión de turbo-2024-04-09
en el menú desplegable. La cuota predeterminada para el modelo gpt-4-turbo-2024-04-09
será la misma que la cuota actual para GPT-4-Turbo. Consulte los límites de cuota regionales.
GPT-4
GPT-4 es el predecesor de GPT-4 Turbo. Los modelos GPT-4 y GPT-4 Turbo tienen un nombre de modelo base de gpt-4
. Puede distinguir entre los modelos GPT-4 y Turbo examinando la versión del modelo.
gpt-4
Versión0314
gpt-4
Versión0613
gpt-4-32k
Versión0613
Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.
Modelos GPT-4 y GPT-4 Turbo
- Estos modelos solo se pueden usar con la API de finalización de chat.
Consulte Versiones del modelo para obtener información sobre cómo azure OpenAI Service controla las actualizaciones de versiones del modelo y trabajar con modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-4.
Id. de modelo | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) |
---|---|---|
gpt-4 (0314) |
8192 | Septiembre de 2021 |
gpt-4-32k (0314) |
32 768 | Septiembre de 2021 |
gpt-4 (0613) |
8192 | Septiembre de 2021 |
gpt-4-32k (0613) |
32 768 | Septiembre de 2021 |
gpt-4 (1106-Preview)1GPT-4 Turbo versión preliminar |
Entrada: 128 000 Salida: 4096 |
Abril de 2023 |
gpt-4 (0125-Preview)1GPT-4 Turbo versión preliminar |
Entrada: 128 000 Salida: 4096 |
Dic. de 2023 |
gpt-4 (vision-preview)2GPT-4 Turbo con Vision (versión preliminar) |
Entrada: 128 000 Salida: 4096 |
Abril de 2023 |
gpt-4 (turbo-2024-04-09) 🆕 GPT-4 Turbo con Vision GA |
Entrada: 128 000 Salida: 4096 |
Dic. de 2023 |
1 GPT-4 Turbo Preview = gpt-4
(0125-Preview) o gpt-4
(1106-Preview). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. En versión, seleccione (0125-Preview) o (1106-Preview).
2 GPT-4 Turbo con Vision (versión preliminar) = gpt-4
(vision-preview). Para implementar este modelo, en Implementaciones, seleccione modelo gpt-4. Para la Versión del modelo seleccione vision-preview.
Precaución
No se recomienda usar modelos de versión preliminar en producción. Actualizaremos todas las implementaciones de modelos de versión preliminar a versiones preliminares futuras y a una versión estable. Los modelos designados en versión preliminar no siguen el ciclo de vida estándar del modelo de Azure OpenAI.
Nota:
La versión 0314
de gpt-4
y gpt-4-32k
se retirará no antes del 5 de julio de 2024. La versión 0613
de gpt-4
y gpt-4-32k
se retirará no antes del 30 de septiembre de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.
- GPT-4 versión 0125-preview es una versión actualizada de la versión preliminar GPT-4 Turbo publicada anteriormente como versión 1106-preview.
- GPT-4 versión 0125-preview completa tareas como la generación de código más completamente en comparación con gpt-4-1106-preview. Debido a esto, dependiendo de la tarea, los clientes pueden encontrar que GPT-4-0125-preview genera más salida en comparación con gpt-4-1106-preview. Se recomienda que los clientes comparen las salidas del nuevo modelo. GPT-4-0125-preview también soluciona errores en gpt-4-1106-preview con control UTF-8 para idiomas distintos del inglés. La versión de GPT-4
turbo-2024-04-09
es la versión más reciente de disponibilidad general y reemplaza0125-Preview
,1106-preview
yvision-preview
.
Importante
- Las versiones de
gpt-4
1106-Preview y 0125-Preview se actualizarán con una versión estable degpt-4
en el futuro. La actualización de implementación degpt-4
1106-Preview agpt-4
0125-Preview programada para el 8 de marzo de 2024 ya no se producirá. Las implementaciones de las versiones degpt-4
1106-Preview y 0125-Preview establecidas en "Actualización automática a predeterminada" y "Actualizar cuando haya expirado" comenzarán a actualizarse después de que se publique la versión estable. Para cada implementación, se realiza una actualización de la versión del modelo sin interrupciones en el servicio para las llamadas API. Las actualizaciones se llevan a cabo por región y se espera que el proceso de actualización completo tarde 2 semanas. Las implementaciones de las versiones degpt-4
1106-Preview y 0125-Preview establecidas en "No actualizar automáticamente" no se actualizarán y dejarán de funcionar cuando se actualice la versión preliminar en la región.
GPT-3.5
Los modelos GPT-3.5 pueden comprender y generar lenguaje natural o código. El modelo más capaz y rentable de la familia GPT-3.5 es GPT-3.5 Turbo, que se ha optimizado para chat y funciona bien para las tareas de finalizaciones tradicionales. GPT-3.5 Turbo está disponible para su uso con la API de finalización de chat. GPT-3.5 Turbo Instruct tiene funcionalidades similares a text-davinci-003
que usa la API de finalizaciones en lugar de la API de finalizaciones de chat. Se recomienda usar GPT-3.5 Turbo y GPT-3.5 Turbo Instruct en vez de los modelos GPT-3.5 y GPT-3.5 heredados.
gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct
Puede ver la longitud del contexto de los tokens compatible con cada modelo en la tabla de resumen de modelos.
Para obtener más información sobre cómo interactuar con GPT-3.5 Turbo y la API de finalizaciones de chat, consulte nuestro procedimiento detallado.
Inserciones
text-embedding-3-large
es el modelo de inserción más reciente y capaz. No es posible actualizar entre modelos de inserción. Para pasar de usar text-embedding-ada-002
a text-embedding-3-large
, tendría que generar nuevas inserciones.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
En las pruebas, OpenAI informa de los modelos de inserción de tercera generación tanto grandes como pequeños que ofrecen un mejor rendimiento medio de recuperación de varios lenguajes con el punto de referencia MIRACL, a la vez que mantiene el rendimiento de las tareas en inglés con el punto de referencia MTEB.
Punto de referencia de la evaluación | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Promedio de MIRACL | 31,4 | 44,0 | 54.9 |
Promedio de MTEB | 61,0 | 62,3 | 64,6 |
Los modelos de inserción de tercera generación admiten reducir el tamaño de la inserción mediante un nuevo parámetro dimensions
. Normalmente, las inserciones más grandes son más costosas desde una perspectiva de proceso, memoria y almacenamiento. La capacidad de ajustar el número de dimensiones permite un mayor control sobre el costo general y el rendimiento. El parámetro dimensions
no se admite en todas las versiones de la biblioteca de Python de OpenAI 1.x; para aprovechar este parámetro, se recomienda actualizar a la versión más reciente: pip install openai --upgrade
.
Las pruebas del punto de referencia MTEB de OpenAI han detectado que, incluso cuando las dimensiones del modelo de tercera generación se reducen a menos de text-embeddings-ada-002
1536 dimensiones, el rendimiento sigue siendo ligeramente mejor.
DALL-E
Los modelos DALL-E generan imágenes a partir de mensajes de texto que proporciona el usuario. DALL-E 3 está disponible con carácter general para su uso con las API REST. DALL-E 2 y DALL-E 3 con SDK de cliente están en versión preliminar.
Whisper
Los modelos de Susurro se pueden usar para la conversión de voz en texto.
También puede usar el modelo de Whisper mediante la API de transcripción por lotes de Voz de Azure AI. Consulte ¿Qué es el modelo Whisper? para obtener más información sobre cuándo usar Voz de Azure AI frente a Azure OpenAI Service.
Texto a voz (versión preliminar)
Los modelos de texto a voz de OpenAI, actualmente en versión preliminar, se pueden usar para sintetizar texto a voz.
También puede usar las voces de texto a voz de OpenAI a través de Voz de Azure AI. Para obtener más información, consulte la guía Voces de texto a voz de OpenAI mediante Azure OpenAI Service o Voz de Azure AI.
Tabla de resumen de los modelos y disponibilidad por región
Nota:
En este artículo se trata principalmente la disponibilidad del modelo o región que se aplica a todos los clientes de Azure OpenAI con tipos de implementación de Estándar. Algunos clientes seleccionados tienen acceso a combinaciones de modelos o regiones que no aparecen en la tabla unificada siguiente. Para obtener más información sobre las implementaciones aprovisionadas, consulte nuestra Guía aprovisionada.
Disponibilidad del modelo de implementación estándar
Región | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4, vision-preview | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | babbage-002, 1 | dall-e-3, 3.0 | davinci-002, 1 | tts, 001 | tts-hd, 001 | whisper, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - |
estado | - | - | ✅ | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - |
eastus2 | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
japaneast | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
suecia central | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norte de suiza | ✅ | - | - | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Esta tabla no incluye la disponibilidad regional del ajuste preciso; consulte la sección dedicada al ajuste preciso para obtener esta información.
Cuota de modelo de implementación estándar
La cuota predeterminada de los modelos varía según el modelo y la región. Los límites de cuota predeterminados están sujetos a cambios.
La cuota de las implementaciones estándar se describe en términos de tokens por minuto (TPM).
Region | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 000 | 80 000 | 80 000 | 30 K | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | 350 000 | - | - | - | - | - | - | - | - | - |
canadaeast | 40 000 | 80 000 | 80 000 | - | 300 000 | - | 350 000 | 350 000 | 350 000 | - | - | - | - | - | - | - |
estado | - | - | 80 000 | - | 240 000 | 240 000 | 240 000 | 350 000 | 350 000 | - | - | - | - | - | - | - |
eastus2 | - | - | 80 000 | - | 300 000 | - | 350 000 | 350 000 | 350 000 | - | - | - | - | 250 000 | 250 000 | 250 000 |
francecentral | 20 000 | 60 000 | 80 000 | - | 240 000 | - | 240 000 | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 000 | - | 300 000 | - | 350 000 | - | - | 240 000 | 250 000 | 240 000 | 250 000 | 250 000 | 250 000 | 250 000 |
norwayeast | - | - | 150 000 | - | - | - | 350 000 | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | 350 000 | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80 000 | - | 240 000 | - | 240 000 | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 000 | - | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
suecia central | 40 000 | 80 000 | 150 000 | 30 K | 300 000 | 240 000 | 350 000 | - | - | 240 000 | 250 000 | 240 000 | 250 000 | 250 000 | 250 000 | 250 000 |
norte de suiza | 40 000 | 80 000 | - | 30 K | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | 250 000 | - | 250 000 | 250 000 | 250 000 | 250 000 |
uksouth | - | - | 80 000 | - | 240 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | 240 000 | - | 240 000 | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 000 | 30 K | 300 000 | - | 350 000 | - | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | 350 000 | - | - | - | - | - | - | - | - | - |
1 K = 1000 tokens por minuto (TPM). La relación entre TPM y las solicitudes por minuto (RPM) se define actualmente como 6 RPM por 1000 TPM.
Disponibilidad del modelo de implementación aprovisionado
Región | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
brazilsouth | ✅ | ✅ | - | ✅ | ✅ | - |
canadacentral | ✅ | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | - | ✅ | - |
estado | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | ✅ | ✅ | ✅ | ✅ | - | ✅ |
germanywestcentral | ✅ | ✅ | ✅ | ✅ | ✅ | - |
japaneast | - | ✅ | ✅ | - | - | ✅ |
koreacentral | ✅ | - | - | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | ✅ | - | ✅ | ✅ | - | - |
polandcentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
southafricanorth | ✅ | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
suecia central | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norte de suiza | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandwest | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
¿Cómo obtengo acceso a Aprovisionado?
Debe hablar con el equipo de ventas o de cuenta de Microsoft para adquirir el rendimiento aprovisionado. Si no tiene equipo de ventas o de cuenta, desafortunadamente en este momento no puede comprar el rendimiento aprovisionado.
Para obtener más información sobre las implementaciones aprovisionadas, consulte nuestra Guía aprovisionada.
Disponibilidad del modelo GPT-4 y GPT-4 Turbo
Regiones de la nube pública
Región | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 |
---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | ✅ |
estado | - | - | ✅ | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | - | - | - | ✅ |
japaneast | - | - | - | ✅ | - | - |
northcentralus | - | - | ✅ | - | - | - |
norwayeast | - | ✅ | - | - | - | - |
southcentralus | - | - | ✅ | - | - | - |
southindia | - | ✅ | - | - | - | - |
suecia central | ✅ | ✅ | - | ✅ | ✅ | ✅ |
norte de suiza | ✅ | - | - | ✅ | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - |
westus | - | ✅ | - | ✅ | - | - |
Selección del acceso al cliente
Además de las regiones anteriores que están disponibles para todos los clientes de Azure OpenAI, a algunos clientes ya existentes se les ha concedido acceso a las versiones de GPT-4 en regiones adicionales:
Modelo | Region |
---|---|
gpt-4 (0314) |
Este de EE. UU. Centro de Francia Centro-sur de EE. UU. Sur de Reino Unido |
gpt-4 (0613) |
Este de EE. UU. Este de EE. UU. 2 Japón Oriental Sur de Reino Unido 2 |
Regiones de Azure Government
Los siguientes modelos GPT-4 están disponibles con Azure Government:
Id. de modelo | Disponibilidad del modelo |
---|---|
gpt-4 (1106-Preview) |
US Gov - Virginia US Gov: Arizona |
Modelos GPT-3.5
Importante
El NUEVO modelo gpt-35-turbo (0125)
tiene varias mejoras, incluida una mayor precisión a la hora de responder en los formatos solicitados y una corrección de un error que provocó un problema de codificación de texto para las llamadas a funciones de idioma no inglés.
GPT-3.5 Turbo se usa con la API de finalización de chat. GPT-3.5 Turbo versión 0301 también se puede usar con la API de finalizaciones, aunque esto no se recomienda. GPT3.3.5 Turbo, versiones 0613 y 1106 solo admite la API de finalizaciones de chat.
GPT-3.5 Turbo versión 0301 es la primera versión del modelo publicada. La versión 0613 es la segunda versión del modelo y agrega compatibilidad con llamadas de función.
Consulte Versiones del modelo para saber cómo Azure OpenAI Service controla las actualizaciones de versiones del modelo, y Uso de modelos para información sobre cómo ver y configurar la versión del modelo de las implementaciones de GPT-3.5.
Nota:
La versión 0613
de gpt-35-turbo
y gpt-35-turbo-16k
se retirará antes del 1 de agosto de 2024. La versión 0301
de gpt-35-turbo
se retirará antes del 1 de agosto de 2024. Consulte Actualizaciones de modelos para ver el comportamiento de actualización del modelo.
Id. de modelo | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) |
---|---|---|
gpt-35-turbo 1 (0301) |
4 096 | Septiembre de 2021 |
gpt-35-turbo (0613) |
4 096 | Septiembre de 2021 |
gpt-35-turbo-16k (0613) |
16 384 | Septiembre de 2021 |
gpt-35-turbo-instruct (0914) |
4097 | Septiembre de 2021 |
gpt-35-turbo (1106) |
Entrada: 16 385 Salida: 4096 |
Septiembre de 2021 |
gpt-35-turbo (0125) NUEVO |
Entrada: 16 385 Salida: 4096 |
Septiembre de 2021 |
Disponibilidad del modelo GPT-3.5-Turbo
Regiones de la nube pública
Región | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
estado | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
suecia central | - | ✅ | ✅ | - | ✅ | ✅ |
norte de suiza | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
1 Este modelo aceptará solicitudes > de 4096 tokens. No se recomienda superar el límite de 4096 tokens de entrada, ya que la versión más reciente del modelo está limitada a 4096 tokens. Si se producen problemas al superar 4096 tokens de entrada con este modelo, esta configuración no se admite oficialmente.
Regiones de Azure Government
Los siguientes modelos GPT-3.5 turbo están disponibles con Azure Government:
Id. de modelo | Disponibilidad del modelo |
---|---|
gpt-35-turbo (1106-Preview) |
US Gov - Virginia |
Modelos de incrustación
Estos modelos solo se pueden usar con solicitudes de API de incrustraciones.
Nota:
text-embedding-3-large
es el modelo de inserción más reciente y capaz. No es posible actualizar entre modelos de inserción. Para migrar de usar text-embedding-ada-002
a text-embedding-3-large
, tendría que generar nuevas inserciones.
Id. de modelo | Solicitud máxima (tokens) | Dimensiones de salida | Datos de entrenamiento (hasta) |
---|---|---|---|
text-embedding-ada-002 (versión 2) |
8191 | 1536 | Septiembre de 2021 |
text-embedding-ada-002 (versión 1) |
2046 | 1536 | Septiembre de 2021 |
text-embedding-3-large |
8191 | 3072 | Septiembre de 2021 |
text-embedding-3-small |
8191 | 1536 | Septiembre de 2021 |
Nota:
Al enviar una matriz de entradas para la inserción, el número máximo de elementos de entrada de la matriz por llamada al punto de conexión de inserción es 2048.
Regiones de la nube pública
Región | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
estado | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | - |
japaneast | - | ✅ | - | - |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
southcentralus | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - |
suecia central | - | ✅ | - | - |
norte de suiza | - | ✅ | - | - |
uksouth | - | ✅ | - | - |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | - |
Regiones de Azure Government
Los siguientes modelos de incrustación están disponibles con Azure Government:
Id. de modelo | Disponibilidad del modelo |
---|---|
text-embedding-ada-002 (versión 2) |
US Gov - Virginia US Gov: Arizona |
Modelos DALL-E
Id. de modelo | Disponibilidad de características | Solicitud máxima (caracteres) |
---|---|---|
dalle2 (versión preliminar) | Este de EE. UU. | 1,000 |
dall-e-3 | Este de EE. UU., Este de Australia, Centro de Suecia | 4\.000 |
Ajuste de modelos
babbage-002
y davinci-002
no están entrenados para seguir las instrucciones. La consulta de estos modelos base solo se debe realizar como punto de referencia a una versión optimizada para evaluar el progreso del entrenamiento.
gpt-35-turbo
: el ajuste preciso de este modelo se limita a un subconjunto de regiones y no está disponible en todas las regiones en las que el modelo base está disponible.
Id. de modelo | Regiones de ajuste | Solicitud máxima (tokens) | Datos de entrenamiento (hasta) |
---|---|---|---|
babbage-002 |
Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
16 384 | Septiembre de 2021 |
davinci-002 |
Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
16 384 | Septiembre de 2021 |
gpt-35-turbo (0613) |
Este de EE. UU. 2 Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
4 096 | Septiembre de 2021 |
gpt-35-turbo (1106) |
Este de EE. UU. 2 Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
Entrada: 16 385 Salida: 4096 |
Septiembre de 2021 |
gpt-35-turbo (0125) |
Este de EE. UU. 2 Centro-Norte de EE. UU Centro de Suecia Oeste de Suiza |
16 385 | Septiembre de 2021 |
Modelos de Whisper
Id. de modelo | Disponibilidad del modelo | Solicitud máxima (tamaño de archivo de audio) |
---|---|---|
whisper |
Este de EE. UU. 2 Centro-Norte de EE. UU Este de Noruega Sur de la India Centro de Suecia Oeste de Europa |
25 MB |
Modelos de texto a voz (versión preliminar)
Id. de modelo | Disponibilidad del modelo |
---|---|
tts-1 |
Centro-Norte de EE. UU Centro de Suecia |
tts-1-hd |
Centro-Norte de EE. UU Centro de Suecia |
Asistentes (versión preliminar)
Para Asistentes se necesita una combinación de un modelo compatible y una región compatible. Algunas herramientas y funcionalidades requieren los modelos más recientes. Los siguientes modelos están disponibles en la API de asistentes, el SDK, Inteligencia artificial de Azure Studio y Azure OpenAI Studio. La tabla siguiente es para pago por uso. Para obtener información sobre la disponibilidad de la unidad de rendimiento aprovisionada (PTU), consulte rendimiento aprovisionado.
Region | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
---|---|---|---|---|---|
Este de Australia | ✅ | ✅ | ✅ | ✅ | |
Este de EE. UU. | ✅ | ✅ | |||
Este de EE. UU. 2 | ✅ | ✅ | ✅ | ||
Centro de Francia | ✅ | ✅ | ✅ | ✅ | |
Este de Noruega | ✅ | ||||
Centro de Suecia | ✅ | ✅ | ✅ | ✅ | |
Sur de Reino Unido 2 | ✅ | ✅ | ✅ | ✅ |