O que é a Pesquisa Visual Computacional?

Importante

Agora, o protocolo TLS 1.2 é obrigatório para todas as solicitações HTTP a este serviço. Para saber mais, confira Segurança nos Serviços Cognitivos do Azure.

O serviço de Pesquisa Visual Computacional do Azure fornece acesso a algoritmos avançados que processam imagens e retornam informações com base nos recursos visuais de seu interesse.

Serviço Descrição
OCR (reconhecimento óptico de caracteres) O serviço de OCR (reconhecimento óptico de caracteres) extrai textos de imagens. Use a nova API de Leitura para extrair um texto impresso e manuscrito de imagens e documentos. Ela usa os modelos baseados em aprendizado profundo e trabalha com textos em uma variedade de superfícies e telas de fundo. Eles incluem documentos comerciais, faturas, recibos, cartazes, cartões de visita, cartas e quadros de comunicação. As APIs de OCR dão suporte à extração de textos impressos em vários idiomas. Siga o guia de início rápido do OCR para obter uma introdução.
Análise de imagens O serviço de Análise de Imagem extrai muitos recursos visuais de imagens, como objetos, rostos, conteúdo para adulto e descrições de texto geradas automaticamente. Siga o guia de início rápido da Análise de Imagem para obter uma introdução.
Análise Espacial O serviço de Análise Espacial analisa a presença e o movimento de pessoas em um feed de vídeo e produz eventos aos quais outros sistemas podem responder. Instale o contêiner de Análise Espacial para obter uma introdução.

Pesquisa Visual Computacional para gerenciamento de ativo digital

A Pesquisa Visual Computacional pode viabilizar muitos cenários de gerenciamento de ativos digitais (DAM). O DAM é o processo comercial de organizar, armazenar e recuperar ativos de mídia avançados e gerenciar permissões e direitos digitais. Por exemplo, uma empresa pode querer agrupar e identificar imagens com base em logotipos visíveis, rostos, objetos, cores e assim por diante. Ou é possível que você queira gerar legendas para imagens automaticamente e vincular palavras-chave que possam ser pesquisadas. Para ter uma solução completa de DAM usando os Serviços Cognitivos, a Pesquisa Cognitiva do Azure e os relatórios inteligentes, confira o Guia do Acelerador de Solução de Mineração de Conhecimento no GitHub. Para ter outros exemplos de DAM, confira o repositório Modelos de Solução de Pesquisa Visual Computacional.

Requisitos de imagem

A Pesquisa Visual Computacional pode analisar imagens que atendem aos seguintes requisitos:

  • A imagem deve ser apresentada no formato JPEG, PNG, GIF ou BMP
  • O tamanho do arquivo da imagem deve ser menor que 4 MB (megabytes)
  • As dimensões da imagem devem ser maiores que 50 x 50 pixels
    • Para a API de Leitura, as dimensões da imagem de entrada precisam estar entre 50 x 50 e 10000 x 10000 pixels.

Segurança e privacidade de dados

Assim como ocorre com todos os Serviços Cognitivos, os desenvolvedores que usam o serviço de Pesquisa Visual Computacional devem estar cientes das políticas da Microsoft em relação aos dados do cliente. Confira a página de Serviços Cognitivos na Central de Confiabilidade da Microsoft para saber mais.

Próximas etapas

Siga um guia de início rápido para implementar e executar um serviço na linguagem de desenvolvimento de sua preferência.