¿Qué es Azure OpenAI Service?

Azure OpenAI Service proporciona acceso mediante la API de REST a los eficaces modelos de lenguaje de OpenAI, incluyendo las series de modelos de inserciones, además de GPT-4, GPT-4 Turbo con Vision, y GPT-3.5-Turbo. Además, las nuevas series de modelos GPT-4 y GPT-3.5-turbo ya tienen disponibilidad general. Estos modelos se pueden adaptar fácilmente a su tarea específica, entre las que se incluyen, entre otras, la generación de contenido, el resumen, el reconocimiento de imágenes, la búsqueda semántica y la traducción de lenguaje natural a código. Los usuarios pueden acceder al servicio a través de las API REST, el SDK de Python o nuestra interfaz basada en web en Azure OpenAI Studio.

Introducción a las características

Característica Azure OpenAI
Modelos disponibles Serie GPT-4 (incluyendo GPT-4 Turbo con Vision)
Serie GPT-3.5-Turbo
Serie Embeddings
Obtenga más información en la página Modelos.
Ajuste preciso (versión preliminar) GPT-3.5-Turbo (0613)
babbage-002
davinci-002.
Price Disponible aquí
Para obtener más información sobre GPT-4 Turbo con Vision, consulte la información de precios especial.
Compatibilidad con redes virtuales y vínculo privado Sí, a menos que use Azure OpenAI en sus datos.
Identidad administrada Sí, a través de Microsoft Entra ID
Experiencia de IU Azure Portal para la administración de recursos y cuentas,
Azure OpenAI Service Studio para la exploración de modelos y el ajuste preciso
Disponibilidad regional del modelo Disponibilidad del modelo
Filtrado de contenido Las solicitudes y finalizaciones se evalúan con respecto a nuestra política de contenido mediante sistemas automatizados. Se filtrará el contenido de gravedad alta.

Inteligencia artificial responsable

En Microsoft, estamos comprometidos con el avance de la inteligencia artificial controlado por ciertos principios que antepongan a las personas. Los modelos generativos, como los disponibles en Azure OpenAI, tienen importantes beneficios potenciales, pero, sin un diseño cuidadoso y mitigación prudente, tales modelos tienen el potencial de generar contenido incorrecto o incluso dañino. Microsoft ha realizado importantes inversiones para ayudar a evitar el abuso y el daño involuntario, lo que incluye exigir a los solicitantes que muestren casos de uso bien definidos, incorporar los principios de Microsoft para el uso responsable de la IA, crear filtros de contenido para apoyar a los clientes y proporcionar orientación sobre la implementación responsable de la IA a los clientes incorporados.

¿Cómo puedo acceder a Azure OpenAI?

¿Cómo puedo acceder a Azure OpenAI?

El acceso está actualmente limitado mientras navegamos por la alta demanda, las próximas mejoras del producto y el compromiso de Microsoft con la IA responsable. Por ahora, estamos trabajando con clientes que ya están asociados a Microsoft, con casos de uso de menor riesgo y con aquellos que se han comprometido a incorporar mitigaciones.

En el formulario de solicitud se incluye información más específica. Agradecemos su paciencia mientras trabajamos para permitir de forma responsable un acceso más amplio a Azure OpenAI.

Solicite aquí el acceso:

Aplicar ahora

Comparación de Azure OpenAI y OpenAI

Azure OpenAI Service proporciona a los clientes una inteligencia artificial de lenguaje de programación avanzado con los modelos OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper y modelos de texto a voz con la promesa empresarial y de seguridad de Azure. Azure OpenAI desarrolla conjuntamente las API con OpenAI, lo que garantiza la compatibilidad y una transición fluida de una a otra.

Con Azure OpenAI, los clientes obtienen las funcionalidades de seguridad de Microsoft Azure mientras ejecutan los mismos modelos que OpenAI. Azure OpenAI ofrece redes privadas, disponibilidad regional y filtrado de contenido de IA responsable.

Conceptos clave

Solicitudes y finalizaciones

El punto final de finalizaciones es el componente principal del servicio de API. Esta API proporciona acceso a la interfaz de entrada y salida de texto del modelo. Los usuarios solo tienen que proporcionar una solicitud de entrada que contenga el comando de texto en inglés y el modelo generará una finalización de texto.

A continuación, se muestra un ejemplo de solicitud simple y finalización:

Solicitud: """ count to 5 in a for loop """

Finalización: for i in range(1, 6): print(i)

Tokens

Tokens de texto

Para procesar el texto, Azure OpenAI lo divide en tokens. Los tokens pueden ser palabras o meros fragmentos de caracteres. Por ejemplo, la palabra "hamburger" se divide en los tokens "ham", "bur" y "ger", mientras que una palabra corta y común como "pear" es un token único. Muchos tokens comienzan con un espacio en blanco, como " hello" y " bye".

El número total de tokens que se procesan en una solicitud determinada depende de la longitud de los parámetros de entrada, salida y solicitud. La cantidad de tokens que se procesan también afectará la latencia de la respuesta y el rendimiento de los modelos.

Tokens de imagen (GPT-4 Turbo con Vision)

El coste del token de una imagen de entrada depende de dos factores principales: el tamaño de la imagen y la configuración de detalles (baja o alta) usada para cada imagen. Este es un desglose de cómo funciona:

  • Detalle: modo de baja resolución

    • Los detalles bajos permiten a la API devolver respuestas más rápidas y consumir menos tokens de entrada para casos de uso que no requieren muchos detalles.
    • Estas imágenes cuestan 85 tokens cada una, independientemente del tamaño de la imagen.
    • Ejemplo: imagen de 4096 x 8192 (pocos detalles): el coste es fijo de 85 tokens, ya que es una imagen de pocos detalles y el tamaño no afecta al coste en este modo.
  • Detalle: modo de alta resolución

    • Si hay muchos detalles permiten a la API ver la imagen con más detalle recortándola en cuadrados más pequeños. Cada cuadrado usa más tokens para generar texto.
    • El coste del token se calcula mediante una serie de pasos de escalado:
      1. La imagen se escala primero para ajustarse a un cuadrado de 2048 x 2048 mientras mantiene su relación de aspecto.
      2. A continuación, la imagen se reduce para que el lado más corto sea de 768 píxeles.
      3. La imagen se divide en mosaicos cuadrados de 512 píxeles y el número de estos iconos (redondeo para iconos parciales) determina el coste final. Cada icono cuesta 170 tokens.
      4. Se agregan 85 tokens adicionales al coste total.
    • Ejemplo: imagen de 2048 x 4096 (muy detallado)
      1. Inicialmente se ha cambiado el tamaño a 1024 x 2048 para ajustarse al cuadrado 2048.
      2. Cambio de tamaño adicional a 768 x 1536.
      3. Requiere seis mosaicos de 512px para cubrir.
      4. El coste total es de 170 × 6 + 85 = 1105 tokens.

Recursos

Azure OpenAI es una oferta de producto nueva en Azure. Puede empezar a utilizar Azure OpenAI de la misma manera que cualquier otro producto de Azure en el que crea un recurso, o bien una instancia del servicio, en la suscripción de Azure. Puede obtener más información sobre el diseño de la administración de recursos de Azure.

Implementaciones

Una vez creado un recurso de Azure OpenAI, debe implementar un modelo para poder empezar a hacer llamadas API y generar texto. Esta acción se puede realizar con las API de implementación. Estas API permiten especificar el modelo que desea usar.

Ingeniería rápida

Los modelos GPT-3, GPT-3.5 y GPT-4 de OpenAI se basan en solicitudes. Con los modelos basados en solicitudes, el usuario interactúa con el modelo ingresando una solicitud de texto, a la que el modelo responde con un texto completo. Esta finalización es la continuación del modelo del texto de entrada.

Si bien estos modelos son extremadamente poderosos, su comportamiento también es muy sensible a la solicitud. Esto hace del prompt engineering una habilidad importante que vale la pena desarrollar.

La construcción de la solicitud puede ser difícil. En la práctica, la solicitud actúa para configurar los pesos del modelo para completar la tarea deseada, pero es más un arte que una ciencia y, a menudo, requiere experiencia e intuición para crear una solicitud que tenga éxito.

Modelos

El servicio permite que los usuarios accedan a varios modelos distintos. Cada modelo proporciona una funcionalidad y un punto de precio diferentes.

Los modelos DALL-E (algunos en vista previa; consultar modelos) generan imágenes a partir de las indicaciones de texto que proporciona el usuario.

Los modelos de Whisper, actualmente en versión preliminar, se pueden usar para transcribir y traducir conversiones de voz en texto.

Los modelos de texto a voz, actualmente en versión preliminar, se pueden usar para sintetizar texto a voz.

Obtenga más información sobre cada modelo en la página de concepto de modelos.

Pasos siguientes

Más información sobre los modelos subyacentes que impulsan Azure OpenAI.