O que é a Pesquisa Visual Computacional?What is Computer Vision?

O serviço de Pesquisa Visual Computacional do Azure fornece aos desenvolvedores acesso a algoritmos avançados que processam imagens e retornam informações, dependendo dos recursos visuais nos quais você tem interesse.Azure's Computer Vision service provides developers with access to advanced algorithms that process images and return information, depending on the visual features you're interested in. Por exemplo, a Pesquisa Visual Computacional pode determinar se uma imagem apresenta conteúdo para adulto ou pode localizar todos os rostos em uma imagem.For example, Computer Vision can determine if an image contains adult content, or it can find all of the human faces in an image.

Você pode usar Pesquisa Visual Computacional em seu aplicativo usando um SDK nativo ou invocando a API REST diretamente.You can use Computer Vision in your application through a native SDK or by invoking the REST API directly. Esta página cobre amplamente o que você pode fazer com a Pesquisa Visual Computacional.This page broadly covers what you can do with Computer Vision.

Pesquisa Visual Computacional para gerenciamento de ativo digitalComputer Vision for digital asset management

A Pesquisa Visual Computacional pode viabilizar muitos cenários de gerenciamento de ativos digitais (DAM).Computer Vision can power many digital asset management (DAM) scenarios. O DAM é o processo comercial de organizar, armazenar e recuperar ativos de mídia avançados e gerenciar permissões e direitos digitais.DAM is the business process of organizing, storing, and retrieving rich media assets and managing digital rights and permissions. Por exemplo, uma empresa pode querer agrupar e identificar imagens com base em logotipos visíveis, rostos, objetos, cores e assim por diante.For example, a company may want to group and identify images based on visible logos, faces, objects, colors, and so on. Ou é possível que você queira gerar legendas para imagens automaticamente e vincular palavras-chave que possam ser pesquisadas.Or, you might want to automatically generate captions for images and attach keywords so they're searchable. Para ter uma solução completa de DAM usando os Serviços Cognitivos, a Pesquisa Cognitiva do Azure e os relatórios inteligentes, confira o Guia do Acelerador de Solução de Mineração de Conhecimento no GitHub.For an all-in-one DAM solution using Cognitive Services, Azure Cognitive Search, and intelligent reporting, see the Knowledge Mining Solution Accelerator Guide on GitHub. Para ter outros exemplos de DAM, confira o repositório Modelos de Solução de Pesquisa Visual Computacional.For other DAM examples, see the Computer Vision Solution Templates repository.

Analisar imagens quanto a insightsAnalyze images for insight

Você pode analisar imagens para detectar e fornecer informações sobre seus recursos visuais e características.You can analyze images to detect and provide insights about their visual features and characteristics. Todos os recursos na tabela a seguir são fornecidos pela API Analisar Imagem.All of the features in the table below are provided by the Analyze Image API.

AçãoAction DESCRIÇÃODescription
Marcar recursos visuaisTag visual features Identificar e marcar recursos visuais em uma imagem, de um conjunto de milhares de objetos reconhecíveis, seres vivos, cenários e ações.Identify and tag visual features in an image, from a set of thousands of recognizable objects, living things, scenery, and actions. Quando as marcas forem ambíguas ou não pertencerem a um conhecimento comum, a resposta da API fornecerá dicas para esclarecer o contexto da tag.When the tags are ambiguous or not common knowledge, the API response provides hints to clarify the context of the tag. A marcação não está limitada ao assunto principal, como uma pessoa em primeiro plano, mas também inclui cenário (interno ou externo), móveis, ferramentas, plantas, animais, acessórios, gadgets e outros.Tagging isn't limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on.
Detectar objetosDetect objects A detecção de objetos é semelhante à marcação, mas a API retorna as coordenadas da caixa delimitadora para cada tag aplicada.Object detection is similar to tagging, but the API returns the bounding box coordinates for each tag applied. Por exemplo, se uma imagem contiver um cachorro, um gato e uma pessoa, a operação Detect listará esses objetos junto com as coordenadas na imagem.For example, if an image contains a dog, cat and person, the Detect operation will list those objects together with their coordinates in the image. Você pode usar essa funcionalidade para processar ainda mais as relações entre os objetos em uma imagem.You can use this functionality to process further relationships between the objects in an image. Também permite que você saiba quando há várias instâncias da mesma tag em uma imagem.It also lets you know when there are multiple instances of the same tag in an image.
Detectar marcasDetect brands Identifique as marcas comerciais em imagens ou vídeos de um banco de dados de milhares de logotipos globais.Identify commercial brands in images or videos from a database of thousands of global logos. Você pode usar esse recurso, por exemplo, para descobrir quais marcas são mais populares em mídia social ou mais predominantes no posicionamento de produto de mídia.You can use this feature, for example, to discover which brands are most popular on social media or most prevalent in media product placement.
Categorizar uma imagemCategorize an image Identifique e categorize uma imagem inteira usando uma taxonomia de categoria com hierarquias hereditárias de pai/filho.Identify and categorize an entire image, using a category taxonomy with parent/child hereditary hierarchies. As categorias podem ser usadas autonomamente ou com nossos novos modelos de marcação.Categories can be used alone, or with our new tagging models.
Atualmente, o inglês é o único idioma com suporte para a marcação e categorização de imagens.Currently, English is the only supported language for tagging and categorizing images.
Descrever uma imagemDescribe an image Gere uma descrição de uma imagem inteira em linguagem compreendida por humanos, usando frases completas.Generate a description of an entire image in human-readable language, using complete sentences. Os algoritmos da Pesquisa Visual Computacional geram várias descrições baseadas nos objetos identificados na imagem.Computer Vision's algorithms generate various descriptions based on the objects identified in the image. Cada uma das descrições é avaliada e uma pontuação de confiança é gerada.The descriptions are each evaluated and a confidence score generated. Uma lista é então retornada, ordenada pela pontuação de confiança mais alta à mais baixa.A list is then returned ordered from highest confidence score to lowest.
Detectar rostosDetect faces Detecte rostos em uma imagem e forneça informações sobre cada rosto detectado.Detect faces in an image and provide information about each detected face. A Pesquisa Visual Computacional retorna as coordenadas, o retângulo, o sexo e a idade de cada rosto detectado.Computer Vision returns the coordinates, rectangle, gender, and age for each detected face.
A Pesquisa Visual Computacional fornece um subconjunto da funcionalidade do serviço Detecção Facial.Computer Vision provides a subset of the Face service functionality. Você pode usar o serviço de Detecção Facial para uma análise mais detalhada, como identificação facial e detecção de pose.You can use the Face service for more detailed analysis, such as facial identification and pose detection.
Detectar tipos de imagemDetect image types Detecte características sobre uma imagem, por exemplo, se uma imagem é um desenho de linha se é, possivelmente, um clip-art.Detect characteristics about an image, such as whether an image is a line drawing or the likelihood of whether an image is clip art.
Detectar conteúdo específico de um domínioDetect domain-specific content Use modelos de domínio para detectar e identificar conteúdo específico de um assunto em uma imagem, como celebridades e pontos turísticos.Use domain models to detect and identify domain-specific content in an image, such as celebrities and landmarks. Por exemplo, se uma imagem contiver pessoas, a Pesquisa Visual Computacional poderá usar um modelo de domínio para celebridades a fim de determinar se as pessoas detectadas na imagem são celebridades conhecidas.For example, if an image contains people, Computer Vision can use a domain model for celebrities to determine if the people detected in the image are known celebrities.
Detectar o esquema de coresDetect the color scheme Analise o uso de cores em uma imagem.Analyze color usage within an image. A Pesquisa Visual Computacional pode determinar se uma imagem está em preto e branco ou em cores e, para imagens com cores, identificar as cores dominantes e de detalhes.Computer Vision can determine whether an image is black & white or color and, for color images, identify the dominant and accent colors.
Gerar uma miniaturaGenerate a thumbnail Analise o conteúdo de uma imagem para gerar uma miniatura adequada dessa imagem.Analyze the contents of an image to generate an appropriate thumbnail for that image. A Pesquisa Visual Computacional primeiro gera uma miniatura de alta qualidade e, em seguida, analisa os objetos na imagem para determinar a área de interesse.Computer Vision first generates a high-quality thumbnail and then analyzes the objects within the image to determine the area of interest. A Pesquisa Visual Computacional corta a imagem para atender aos requisitos da área de interesse.Computer Vision then crops the image to fit the requirements of the area of interest. A miniatura gerada pode ser apresentada usando uma taxa de proporção diferente da taxa de proporção da imagem original, dependendo de suas necessidades.The generated thumbnail can be presented using an aspect ratio that is different from the aspect ratio of the original image, depending on your needs.
Obter a área de interesseGet the area of interest Analise o conteúdo de uma imagem para retornar as coordenadas da área de interesse.Analyze the contents of an image to return the coordinates of the area of interest. Em vez de cortar a imagem e gerar uma miniatura, a Pesquisa Visual Computacional retorna as coordenadas da caixa delimitadora da região, de modo que o aplicativo de chamada possa modificar a imagem original conforme desejado.Instead of cropping the image and generating a thumbnail, Computer Vision returns the bounding box coordinates of the region, so the calling application can modify the original image as desired.

Extrair texto de imagensExtract text from images

Use a API de Leitura da Pesquisa Visual Computacional para extrair um texto impresso e manuscrito de imagens para um fluxo de caracteres legível por computador.You can use Computer Vision Read API to extract printed and handwritten text from images into a machine-readable character stream. A API de Leitura usa nossos modelos mais recentes e funciona com texto em uma variedade de superfícies e telas de fundo, como recibos, cartazes, cartões de visita, cartas e quadros de comunicações.The Read API uses our latest models and works with text on a variety of surfaces and backgrounds, such as receipts, posters, business cards, letters, and whiteboards. Atualmente, inglês é o único idioma com suporte.Currently, English is the only supported language.

Use também a API do OCR (reconhecimento óptico de caracteres) para extrair um texto impresso em vários idiomas.You can also use the optical character recognition (OCR) API to extract printed text in several languages. Se necessário, o OCR corrige a rotação do texto reconhecido e fornece as coordenadas de quadro de cada palavra.If needed, OCR corrects the rotation of the recognized text and provides the frame coordinates of each word. O OCR dá suporte a 25 idiomas e detecta automaticamente o idioma do texto reconhecido.OCR supports 25 languages and automatically detects the language of the recognized text.

Moderar conteúdo em imagensModerate content in images

Use a Pesquisa Visual Computacional para detectar conteúdo para adulto em uma imagem e retornar pontuações de confiança para diferentes classificações.You can use Computer Vision to detect adult content in an image and return confidence scores for different classifications. O limite para a sinalização de conteúdo pode ser definido em uma escala deslizante para acomodar suas preferências.The threshold for flagging content can be set on a sliding scale to accommodate your preferences.

Usar contêineresUse containers

Use contêineres da Pesquisa Visual Computacional para reconhecer um texto impresso e manuscrito localmente pela instalação de um contêiner do Docker padronizado mais próximo aos dados.Use Computer Vision containers to recognize printed and handwritten text locally by installing a standardized Docker container closer to your data.

Requisitos de imagemImage requirements

A Pesquisa Visual Computacional pode analisar imagens que atendem aos seguintes requisitos:Computer Vision can analyze images that meet the following requirements:

  • A imagem deve ser apresentada no formato JPEG, PNG, GIF ou BMPThe image must be presented in JPEG, PNG, GIF, or BMP format
  • O tamanho do arquivo da imagem deve ser menor que 4 MB (megabytes)The file size of the image must be less than 4 megabytes (MB)
  • As dimensões da imagem devem ser maiores que 50 x 50 pixelsThe dimensions of the image must be greater than 50 x 50 pixels
    • Para a API de Leitura, as dimensões da imagem de entrada precisam estar entre 50 x 50 e 10000 x 10000 pixels.For the Read API, the dimensions of the image must be between 50 x 50 and 10000 x 10000 pixels.

Segurança e privacidade de dadosData privacy and security

Assim como ocorre com todos os Serviços Cognitivos, os desenvolvedores que usam o serviço de Pesquisa Visual Computacional devem estar cientes das políticas da Microsoft em relação aos dados do cliente.As with all of the Cognitive Services, developers using the Computer Vision service should be aware of Microsoft's policies on customer data. Confira a página de Serviços Cognitivos na Central de Confiabilidade da Microsoft para saber mais.See the Cognitive Services page on the Microsoft Trust Center to learn more.

Próximas etapasNext steps

Introdução à Pesquisa Visual Computacional seguindo o guia de início rápido:Get started with Computer Vision by following a quickstart guide: