Legendas de imagens (versão 4.0)

As legendas de imagem no Image Analysis 4.0 estão disponíveis através das funcionalidades Caption e Dense Captions .

A legenda gera uma descrição de uma frase para todo o conteúdo da imagem. As legendas densas fornecem mais detalhes, gerando descrições de uma frase de até 10 regiões da imagem, além de descrever a imagem inteira. As legendas densas também retornam as coordenadas da caixa delimitadora das regiões de imagem descritas. Ambos os recursos usam os mais recentes modelos de IA inovadores baseados em Florença.

Neste momento, a legenda das imagens está disponível apenas em inglês.

Importante

As legendas de imagem no Image Analysis 4.0 só estão disponíveis nas seguintes regiões do centro de dados do Azure: Leste dos EUA, França Central, Coreia Central, Europa do Norte, Sudeste Asiático, Europa Ocidental, Oeste dos EUA, Ásia Oriental. Você deve usar um recurso Visão localizado em uma dessas regiões para obter resultados dos recursos Legenda e Legendas Densas.

Se você precisar usar um recurso de Visão fora dessas regiões para gerar legendas de imagem, use a Análise de Imagem 3.2 , que está disponível em todas as regiões do Azure AI Vision.

Experimente os recursos de legendagem de imagens de forma rápida e fácil em seu navegador usando o Vision Studio.

Legendas neutras em termos de género

As legendas contêm termos de género ("homem", "mulher", "rapaz" e "rapariga") por defeito. Você tem a opção de substituir esses termos por "pessoa" em seus resultados e receber legendas neutras em termos de gênero. Você pode fazer isso definindo o parâmetro opcional de solicitação de API, legenda neutra de gênero como true na URL da solicitação.

Exemplos de legendas e legendas densas

A resposta JSON a seguir ilustra o que a API do Analysis 4.0 retorna ao descrever a imagem de exemplo com base em seus recursos visuais.

Photo of a man pointing at a screen

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Utilizar a API

O recurso de legendagem de imagem faz parte da API Analyze Image . Inclua Caption no parâmetro de consulta de recursos . Em seguida, quando você obtiver a resposta JSON completa, analise a cadeia de caracteres para o conteúdo da "captionResult" seção.

Próximos passos