Novidades na Pesquisa Visual Computacional

Conheça o que há de novo no serviço. Esses itens podem ser notas sobre a versão, vídeos, postagens no blog e outros tipos de informações. Marque esta página para se manter atualizado quanto ao serviço.

Setembro de 2021

A Versão Prévia Pública da API do OCR (Leitura) dá suporte a 122 idiomas

A API do OCR (Leitura) da Pesquisa Visual Computacional expande os idiomas com suporte para 122 em sua versão prévia mais recente:

  • Suporte de OCR para texto impresso em 49 novos idiomas, incluindo russo, búlgaro e outros idiomas em alfabeto cirílico, além de mais idiomas em alfabeto latino.
  • Suporte de OCR para texto manuscrito em 6 novos idiomas que incluem inglês, chinês simplificado, francês, alemão, italiano, português e espanhol.
  • Aprimoramentos para processamento de PDFs digitais e texto MRZ (Machine Readable Zone - Zona Legível por Computador) em documentos de identidade.
  • Melhorias gerais de desempenho e qualidade de IA

Confira o guia de Como usar o OCR para saber como usar os novos recursos em versão prévia.

Agosto de 2021

Expansão de idioma de marcação de imagem

A versão mais recente (v3.2) do marcador de Imagem agora é compatível com marcas em 50 idiomas. Confira a página de idiomas compatíveis para saber mais.

Maio de 2021

Atualização do contêiner de Análise Espacial

Uma nova versão do contêiner de Análise Espacial foi lançada, com um novo conjunto de recursos. O contêiner do Docker permite que você analise vídeos de streaming em tempo real para entender as relações espaciais existentes entre as pessoas e a movimentação delas em ambientes físicos.

  • Agora as operações de análise espacial podem ser configuradas para detectar a orientação que uma pessoa está vendo.

    • Um classificador de orientação pode ser habilitado para as operações personcrossingline e personcrossingpolygon configurando o parâmetro enable_orientation. É definido como off por padrão.
  • Agora as operações de análise espacial também oferecem configuração para detectar a velocidade de uma pessoa durante a movimentação/execução

    • A velocidade pode ser detectada para as operações personcrossingline e personcrossingpolygon ativando o classificador enable_speed, que está desativado por padrão. A saída é refletida nas saídas speed, avgSpeed e minSpeed.

Abril de 2021

GA da Pesquisa Visual Computacional v3.2

A API da Pesquisa Visual Computacional v 3.2 já está em disponibilidade geral com as seguintes atualizações:

Março de 2021

Atualização da Versão Prévia Pública da Pesquisa Visual Computacional 3.2

A Versão Prévia Pública da API da Pesquisa Visual Computacional v3.2 foi atualizada. A versão prévia tem todos os recursos da Pesquisa Visual Computacional, juntamente com APIs de Leitura e Análise atualizadas.

Fevereiro de 2021

Versão Prévia Pública da API de Leitura v3.2 com suporte de OCR para 73 idiomas

A versão prévia pública da API de Leitura v3.2 da Pesquisa Visual Computacional, disponível como serviço de nuvem e contêiner do Docker, inclui estas atualizações:

  • OCR para 73 idiomas incluindo idiomas latinos, chinês simplificado e tradicional, japonês e coreano.
  • Ordem natural de leitura da saída da linha de texto (somente para idiomas latinos)
  • Classificação de estilo manuscrito para linhas de texto juntamente com uma pontuação de confiança (somente em idiomas latinos).
  • Extraia o texto somente das páginas selecionadas de um documento de várias páginas.
  • Disponível como um contêiner distroless para implantação local.

Confira o guia de instruções da API de Leitura para saber mais.

Janeiro de 2021

Atualização do contêiner de Análise Espacial

Uma nova versão do contêiner de Análise Espacial foi lançada, com um novo conjunto de recursos. O contêiner do Docker permite que você analise vídeos de streaming em tempo real para entender as relações espaciais existentes entre as pessoas e a movimentação delas em ambientes físicos.

  • Agora, as operações de Análise Espacial podem ser configuradas para detectar se uma pessoa está usando uma proteção para o rosto, como uma máscara.
    • Foi habilitado um classificador de máscara para as operações personcount, personcrossingline e personcrossingpolygon configurando o parâmetro ENABLE_FACE_MASK_CLASSIFIER.
    • Os atributos face_mask e face_noMask serão retornados como metadados com a pontuação de confiança para cada pessoa detectada no fluxo de vídeo
  • A operação personcrossingpolygon foi estendida para permitir o cálculo do tempo de duração da pesquisa que uma pessoa gasta em uma zona. Você pode definir o parâmetro type na configuração de zona da operação para zonedwelltime e um novo evento do tipo personZoneDwellTimeEvent incluirá o campo durationMs populado com o número de milissegundos que a pessoa gastou na zona.
  • Alteração interruptiva: O evento personZoneEvent foi renomeado para personZoneEnterExitEvent. Esse evento é gerado pela operação personcrossingpolygon quando uma pessoa entra ou sai da zona e fornece informações direcionais com o lado numerado da zona que foi cruzada.
  • A URL de vídeo pode ser fornecida como "Parâmetro Privado/ofuscado" em todas as operações. A ofuscação é opcional agora e só funcionará se KEY e IV forem fornecidas como variáveis de ambiente.
  • A calibragem é habilitada por padrão para todas as operações. Defina o do_calibration: false para desabilitá-lo.
  • Adição de suporte para recalibragem automática (desabilitada por padrão) por meio do parâmetro enable_recalibration. Veja Operações de Análise Espacial para obter detalhes
  • Parâmetros de calibragem de câmera para o DETECTOR_NODE_CONFIG. Veja Operações de Análise Espacial para obter detalhes.

Outubro de 2020

GA da API da Pesquisa Visual Computacional v3.1

A API da Pesquisa Visual Computacional em disponibilidade geral foi atualizada para a v3.1.

Setembro de 2020

Versão prévia do contêiner de Análise Espacial

O contêiner de Análise Espacial já está em versão prévia. O recurso de Análise Espacial da Pesquisa Visual Computacional permite que você analise vídeos de streaming em tempo real para entender as relações espaciais existentes entre as pessoas e o movimento delas nos ambientes físicos. A Análise Espacial é um contêiner do Docker que pode ser usado no local.

A API de Leitura v3.1 Visualização Pública adiciona o OCR para japonês

A visualização pública da API de Leitura v3.1 da Pesquisa Visual Computacional adiciona as seguintes funcionalidades:

  • OCR para o idioma japonês

  • Para cada linha de texto, indique se a aparência está em estilo manuscrito ou impresso, juntamente com uma pontuação de confiança (somente para idiomas latinos).

  • Para um documento de várias páginas, extraia o texto somente da página ou do intervalo de páginas selecionado.

  • Esta versão prévia da API de Leitura é compatível com os idiomas inglês, holandês, francês, alemão, italiano, japonês, português, chinês simplificado e espanhol.

Confira o guia de instruções da API de Leitura para saber mais.

Julho de 2020

Visualização Pública da API de Leitura v3.1 com OCR para chinês simplificado

A versão prévia pública da API de Leitura v3.1 da Pesquisa Visual Computacional adiciona suporte ao chinês (simplificado).

  • Esta versão prévia da API de Leitura dá suporte aos idiomas inglês, holandês, francês, alemão, italiano, português, chinês simplificado e espanhol.

Confira o guia de instruções da API de Leitura para saber mais.

Maio de 2020

A API de Pesquisa Visual Computacional v3.0 entrou em disponibilidade geral, com atualizações na API de Leitura:

  • Suporte para inglês, holandês, francês, alemão, italiano, português e espanhol
  • Precisão aprimorada
  • Pontuação de confiança para cada palavra extraída
  • Novo formato de saída

Confira a Visão geral do OCR para saber mais.

Março de 2020

Janeiro de 2020

Versão prévia pública da API de Leitura 3.0

Agora você pode usar a versão 3.0 da API de Leitura para extrair texto impresso ou manuscrito de imagens. Em comparação com as versões anteriores, a 3.0 oferece:

  • Precisão aprimorada
  • Novo formato de saída
  • Pontuação de confiança para cada palavra extraída
  • Suporte para os idiomas espanhol e inglês com o parâmetro de idioma

Siga um início rápido de extração de texto para começar a usar a API 3.0.

Atualizações dos Serviços Cognitivos

Comunicados de atualização do Azure para os Serviços Cognitivos