Descripciones de imágenes

Visión de Azure AI puede analizar una imagen y generar una frase inteligible que describa su contenido. El algoritmo devuelve varias descripciones según diferentes características visuales y cada descripción tiene una puntuación de confianza. El resultado final es una lista de descripciones ordenadas de mayor a menor confianza.

En este momento, el inglés es el único idioma admitido para la descripción de la imagen.

Pruebe las características de generación de subtítulos para imágenes de forma rápida y sencilla en el explorador mediante Vision Studio.

Ejemplo de descripción de imagen

La siguiente respuesta JSON muestra lo que devuelve Analyze API al describir la imagen de ejemplo según sus características visuales.

Una imagen en blanco y negro de edificios en Manhattan

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

Uso de la API

La característica de descripción de imágenes forma parte de la API Analyze Image. Puede llamar a esta API mediante una SDK nativa o con llamadas a REST. Incluya Description en el parámetro de consulta visualFeatures. Después, cuando obtenga la respuesta JSON completa, analice la cadena con el contenido de la sección "description".

Pasos siguientes

Conozca los conceptos relacionados de etiquetado de imágenes y de categorización de imágenes.