¿Qué es Computer Vision?What is Computer Vision?

Importante

TLS 1.2 ya se exige en todas las solicitudes HTTP para este servicio.TLS 1.2 is now enforced for all HTTP requests to this service. Para más información, consulte Seguridad de Azure Cognitive Services.For more information, see Azure Cognitive Services security.

El servicio Computer Vision de Azure proporciona acceso a algoritmos avanzados que procesan imágenes y devuelven información basada en las características visuales de interés.Azure's Computer Vision service gives you access to advanced algorithms that process images and return information based on the visual features you're interested in. Por ejemplo, Computer Vision puede determinar si una imagen tiene contenido para adultos, buscar marcas u objetos específicos o buscar rostros humanos.For example, Computer Vision can determine whether an image contains adult content, find specific brands or objects, or find human faces.

Puede crear aplicaciones de Computer Vision mediante el SDK de una biblioteca cliente o llamando a la API REST directamente.You can create Computer Vision applications through a client library SDK or by calling the REST API directly. Esta página cubre ampliamente lo que puede hacer con Computer Vision.This page broadly covers what you can do with Computer Vision.

Reconocimiento óptico de caracteres (OCR)Optical Character Recognition (OCR)

Computer Vision incluye funcionalidades de reconocimiento óptico de caracteres (OCR).Computer Vision includes Optical Character Recognition (OCR) capabilities. Puede usar la nueva Read API para extraer texto impreso y manuscrito de imágenes y documentos.You can use the new Read API to extract printed and handwritten text from images and documents. Usa los modelos basados en aprendizaje profundo y funciona con texto en diversas superficies y fondos.It uses deep learning based models and works with text on a variety of surfaces and backgrounds. Entre estos se incluyen documentos de la empresa, facturas, recibos, pósteres, tarjetas de presentación, cartas y pizarras.These include business documents, invoices, receipts, posters, business cards, letters, and whiteboards. Las API de OCR admiten la extracción de texto impreso en varios idiomas.The OCR APIs support extracting printed text in several languages. Siga un inicio rápido para comenzar.Follow a quickstart to get started.

Computer Vision para la administración de activos digitalesComputer Vision for digital asset management

Computer Vision puede funcionar en muchos escenarios de administración de activos digitales (DAM).Computer Vision can power many digital asset management (DAM) scenarios. DAM es el proceso empresarial de organización, almacenamiento y recuperación de recursos multimedia enriquecidos, y la administración de los permisos y derechos digitales.DAM is the business process of organizing, storing, and retrieving rich media assets and managing digital rights and permissions. Por ejemplo, es posible que una empresa desee agrupar e identificar imágenes basadas en logotipos, caras, objetos, colores visibles, etc.For example, a company may want to group and identify images based on visible logos, faces, objects, colors, and so on. O bien, puede que desee generar automáticamente leyendas para las imágenes y adjuntar palabras clave para que admitan búsquedas.Or, you might want to automatically generate captions for images and attach keywords so they're searchable. Para una solución DAM todo en uno que use Cognitive Services, Azure Cognitive Search e informes inteligentes, vea la Guía del acelerador de la solución de minería del conocimiento en GitHub.For an all-in-one DAM solution using Cognitive Services, Azure Cognitive Search, and intelligent reporting, see the Knowledge Mining Solution Accelerator Guide on GitHub. Para ver otros ejemplos de DAM, consulte el repositorio plantillas de la solución Computer Vision.For other DAM examples, see the Computer Vision Solution Templates repository.

Análisis de imágenes para obtener informaciónAnalyze images for insight

Puede analizar imágenes para detectar y proporcionar información detallada acerca de las características y funciones visuales.You can analyze images to provide insights about their visual features and characteristics. Todas las características de la tabla siguiente se proporcionan gracias a la API de análisis de imágenes.All of the features in the table below are provided by the Analyze Image API. Siga un inicio rápido para comenzar.Follow a quickstart to get started.

Etiquetar características visualesTag visual features

Identifique y etiquete las características visuales de una imagen a partir de un conjunto de miles de objetos, seres vivos, paisajes y acciones reconocibles.Identify and tag visual features in an image, from a set of thousands of recognizable objects, living things, scenery, and actions. Cuando las etiquetas son ambiguas o no muy comunes, la respuesta de la API contiene “indicaciones” para aclarar el contexto de la etiqueta.When the tags are ambiguous or not common knowledge, the API response provides hints to clarify the context of the tag. El etiquetado no se limita al sujeto principal, como una persona en primer plano, sino que también incluye el entorno (interior o exterior), muebles, herramientas, plantas, animales, accesorios, gadgets, etc.Tagging isn't limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on. Etiquetar características visualesTag visual features

Detección de objetosDetect objects

La detección de objetos es similar al etiquetado, pero la API devuelve las coordenadas del rectángulo delimitador para cada etiqueta aplicada.Object detection is similar to tagging, but the API returns the bounding box coordinates for each tag applied. Por ejemplo, si una imagen contiene un perro, un gato y una persona, la operación de detección mostrará estos objetos junto con sus coordenadas en la imagen.For example, if an image contains a dog, cat and person, the Detect operation will list those objects together with their coordinates in the image. Puede usar esta funcionalidad para procesar más las relaciones entre los objetos de una imagen.You can use this functionality to process further relationships between the objects in an image. También permite saber cuando hay varias instancias de la misma etiqueta en una imagen.It also lets you know when there are multiple instances of the same tag in an image. Detección de objetosDetect objects

Detección de marcasDetect brands

Identifique las marcas comerciales en imágenes o vídeos desde una base de datos de miles de logotipos globales.Identify commercial brands in images or videos from a database of thousands of global logos. Puede usar esta característica, por ejemplo, para detectar qué marcas son más populares en medios sociales o más frecuentes en la ubicación de los productos multimedia.You can use this feature, for example, to discover which brands are most popular on social media or most prevalent in media product placement. Detección de marcasDetect brands

Clasificar una imagenCategorize an image

Identifique y clasifique toda una imagen mediante una taxonomía de categoría con jerarquías hereditarias de elementos primarios y secundarios.Identify and categorize an entire image, using a category taxonomy with parent/child hereditary hierarchies. Las categorías se pueden usar solas o con nuestros nuevos modelos de etiquetado.Categories can be used alone, or with our new tagging models.
Actualmente, el inglés es el único idioma que se admite para etiquetar y clasificar imágenes.Currently, English is the only supported language for tagging and categorizing images. Clasificar una imagenCategorize an image

Describir una imagenDescribe an image

Genere una descripción de toda una imagen en lenguaje natural, con frases completas.Generate a description of an entire image in human-readable language, using complete sentences. Los algoritmos de Computer Vision generan varias descripciones en función de los objetos identificados en la imagen.Computer Vision's algorithms generate various descriptions based on the objects identified in the image. Cada una de estas descripciones se evalúa y se genera una puntuación de confianza.The descriptions are each evaluated and a confidence score generated. Después, se devuelve una lista de puntuaciones de confianza ordenadas de más alta a más baja.A list is then returned ordered from highest confidence score to lowest. Describir una imagenDescribe an image

Detección de carasDetect faces

Detecte caras en una imagen y proporcione información acerca de ellas.Detect faces in an image and provide information about each detected face. Computer Vision devuelve las coordenadas, el rectángulo, el género y la edad de los rostros que detecta.Computer Vision returns the coordinates, rectangle, gender, and age for each detected face.
Computer Vision proporciona un subconjunto de la funcionalidad del servicio Face.Computer Vision provides a subset of the Face service functionality. Puede usar el servicio Face para realizar un análisis más detallado, como la identificación facial y la detección de poses.You can use the Face service for more detailed analysis, such as facial identification and pose detection. Detección de carasDetect faces

Detectar tipos de imagenDetect image types

Detecte las características de una imagen, como por ejemplo, si una imagen es un dibujo lineal o la probabilidad de que sea una imagen prediseñada.Detect characteristics about an image, such as whether an image is a line drawing or the likelihood of whether an image is clip art. Detectar tipos de imagenDetect image types

Detectar contenido específico del dominioDetect domain-specific content

Use los modelos de dominio para detectar e identificar el contenido específico del dominio en una imagen, como celebridades y monumentos.Use domain models to detect and identify domain-specific content in an image, such as celebrities and landmarks. Por ejemplo, si una imagen contiene personas, Computer Vision puede usar un modelo de dominio para celebridades para determinar si las personas que se han detectado en la imagen son famosos conocidos.For example, if an image contains people, Computer Vision can use a domain model for celebrities to determine if the people detected in the image are known celebrities. Detectar contenido específico del dominioDetect domain-specific content

Detectar la combinación de coloresDetect the color scheme

Analice el uso del color en una imagen.Analyze color usage within an image. Computer Vision puede determinar si una imagen está en blanco y negro o en color, y en las imágenes de color, identificar los colores dominantes y de énfasis.Computer Vision can determine whether an image is black & white or color and, for color images, identify the dominant and accent colors. Detectar la combinación de coloresDetect the color scheme

Generar una miniaturaGenerate a thumbnail

Analice el contenido de una imagen para generar una miniatura adecuada de la misma.Analyze the contents of an image to generate an appropriate thumbnail for that image. En primer lugar, Computer Vision genera una miniatura de alta calidad y, después, analiza los objetos de la imagen para determinar el área de interés.Computer Vision first generates a high-quality thumbnail and then analyzes the objects within the image to determine the area of interest. Luego, Computer Vision recorta la imagen para ajustarla a los requisitos del área de interés.Computer Vision then crops the image to fit the requirements of the area of interest. La miniatura generada se puede presentar con una relación de aspecto diferente de la de la imagen original en función de sus necesidades.The generated thumbnail can be presented using an aspect ratio that is different from the aspect ratio of the original image, depending on your needs. Generar una miniaturaGenerate a thumbnail

Obtener el área de interésGet the area of interest

Analice el contenido de una imagen para devolver las coordenadas del área de interés.Analyze the contents of an image to return the coordinates of the area of interest. En lugar de recortar la imagen y generar una miniatura, Computer Vision devuelve las coordenadas del rectángulo delimitador de la región, por lo que la aplicación que realiza la llamada puede modificar la imagen original según sea necesario.Instead of cropping the image and generating a thumbnail, Computer Vision returns the bounding box coordinates of the region, so the calling application can modify the original image as desired. Obtener el área de interésGet the area of interest

Moderación del contenido de las imágenesModerate content in images

Puede usar Computer Vision para detectar contenido para adultos en una imagen y devolver puntuaciones de confianza en las distintas clasificaciones.You can use Computer Vision to detect adult content in an image and return confidence scores for different classifications. El umbral para el etiquetado de contenido se puede establecer en una escala deslizante, con el fin de que pueda ajustarlo a sus preferencias.The threshold for flagging content can be set on a sliding scale to accommodate your preferences.

Implementación local mediante contenedores de DockerDeploy on premises using Docker containers

Use los contenedores de Computer Vision para implementar características de API de forma local.Use Computer Vision containers to deploy API features on-premises. Estos contenedores de Docker permiten acercar el servicio a los datos para mejorar el cumplimiento, la seguridad o por otras razones operativas.These Docker containers enable you to bring the service closer to your data for compliance, security or other operational reasons. Computer Vision ofrece los siguientes contenedores:Computer Vision offers the following containers:

Requisitos de imagenImage requirements

Computer Vision puede analizar las imágenes que cumplan los requisitos siguientes:Computer Vision can analyze images that meet the following requirements:

  • La imagen se debe presentar en formato JPEG, PNG, GIF o BMPThe image must be presented in JPEG, PNG, GIF, or BMP format
  • El tamaño de archivo de la imagen debe ser inferior a 4 megabytes (MB)The file size of the image must be less than 4 megabytes (MB)
  • Las dimensiones de la imagen deben ser mayores que 50 x 50 píxelesThe dimensions of the image must be greater than 50 x 50 pixels
    • Para la API Read, las dimensiones de la imagen deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.For the Read API, the dimensions of the image must be between 50 x 50 and 10000 x 10000 pixels.

Seguridad y privacidad de datosData privacy and security

Al igual que sucede con todas las instancias de Cognitive Services, los desarrolladores que usan el servicio Computer Vision deben estar al tanto de las directivas de Microsoft sobre los datos de clientes.As with all of the Cognitive Services, developers using the Computer Vision service should be aware of Microsoft's policies on customer data. Para más información, consulte la página de Cognitive Services en Microsoft Trust Center.See the Cognitive Services page on the Microsoft Trust Center to learn more.

Pasos siguientesNext steps

Para empezar a usar Computer Vision, siga la guía de inicio rápido del lenguaje de desarrollo que prefiera:Get started with Computer Vision by following the quickstart guide in your preferred development language: