¿Qué es Computer Vision?What is Computer Vision?

El servicio Computer Vision de Azure proporciona a los desarrolladores acceso a algoritmos avanzados que procesan imágenes y devuelven información.Azure's Computer Vision service provides developers with access to advanced algorithms that process images and return information. Para analizar una imagen, puede cargarla o especificar la dirección URL de la misma.To analyze an image, you can either upload an image or specify an image URL. Los algoritmos de procesamiento de imágenes pueden analizar el contenido de diferentes formas, en función de las características visuales que le interesen a usted.The images processing algorithms can analyze content in several different ways, depending on the visual features you're interested in. Por ejemplo, Computer Vision puede determinar si una imagen incluye contenido explícito o para adultos, o puede buscar todos los rostros en una imagen.For example, Computer Vision can determine if an image contains adult or racy content or find all of the human faces in an image.

Puede usar Computer Vision en la aplicación mediante el uso de un SDK nativo o invocar la API REST directamente.You can use Computer Vision in your application by using either a native SDK or invoking the REST API directly. Esta página cubre ampliamente lo que puede hacer con Computer Vision.This page broadly covers what you can do with Computer Vision.

Análisis de imágenes para obtener informaciónAnalyze images for insight

Puede analizar imágenes para detectar y proporcionar información detallada acerca de las funciones visuales y las características.You can analyze images to detect and provide insights about their visual features and characteristics. Todas las características de la tabla siguiente se proporcionan gracias a la API de análisis de imágenes.All of the features in the table below are provided by the Analyze Image API.

AcciónAction DESCRIPCIÓNDescription
Etiquetar características visualesTag visual features Identifique y etiquete las características visuales de una imagen a partir de un conjunto de miles de objetos, seres vivos, paisajes y acciones reconocibles.Identify and tag visual features in an image, from a set of thousands of recognizable objects, living things, scenery, and actions. Cuando las etiquetas son ambiguas o no muy comunes, la respuesta de la API contiene “indicaciones” para aclarar el contexto de la etiqueta.When the tags are ambiguous or not common knowledge, the API response provides hints to clarify the context of the tag. El etiquetado no se limita al sujeto principal, como una persona en primer plano, sino que también incluye el entorno (interior o exterior), muebles, herramientas, plantas, animales, accesorios, gadgets, etc.Tagging isn't limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on.
Detectar objetosDetect objects La detección de objetos es similar al etiquetado, pero la API devuelve las coordenadas del rectángulo delimitador para cada etiqueta aplicada.Object detection is similar to tagging, but the API returns the bounding box coordinates for each tag applied. Por ejemplo, si una imagen contiene un perro, un gato y una persona, la operación de detección mostrará esos objetos junto con sus coordenadas en la imagen.For example, if an image contains a dog, cat and person, the Detect operation will list those objects together with their coordinates in the image. Puede usar esta funcionalidad para procesar más las relaciones entre los objetos de una imagen.You can use this functionality to process further relationships between the objects in an image. También permite saber cuando hay varias instancias de la misma etiqueta en una imagen.It also lets you know when there are multiple instances of the same tag in an image.
Detección de las marcasDetect brands Identifique las marcas comerciales en imágenes o vídeos desde una base de datos de miles de logotipos globales.Identify commercial brands in images or videos from a database of thousands of global logos. Puede usar esta característica, por ejemplo, para detectar qué marcas son más populares en medios sociales o más frecuentes en la ubicación de los productos multimedia.You can use this feature, for example, to discover which brands are most popular on social media or most prevalent in media product placement.
Clasificar una imagenCategorize an image Identifique y clasifique toda una imagen mediante una taxonomía de categoría con jerarquías hereditarias de elementos primarios y secundarios.Identify and categorize an entire image, using a category taxonomy with parent/child hereditary hierarchies. Las categorías se pueden usar solas o con nuestros nuevos modelos de etiquetado.Categories can be used alone, or with our new tagging models.
Actualmente, el inglés es el único idioma que se admite para etiquetar y clasificar imágenes.Currently, English is the only supported language for tagging and categorizing images.
Describir una imagenDescribe an image Genere una descripción de toda una imagen en lenguaje natural, con frases completas.Generate a description of an entire image in human-readable language, using complete sentences. Los algoritmos de Computer Vision generan varias descripciones en función de los objetos identificados en la imagen.Computer Vision's algorithms generate various descriptions based on the objects identified in the image. Cada una de estas descripciones se evalúa y se genera una puntuación de confianza.The descriptions are each evaluated and a confidence score generated. Después, se devuelve una lista de puntuaciones de confianza ordenadas de más alta a más baja.A list is then returned ordered from highest confidence score to lowest.
Detectar carasDetect faces Detecte caras en una imagen y proporcione información acerca de ellas.Detect faces in an image and provide information about each detected face. Computer Vision devuelve las coordenadas, el rectángulo, el género y la edad de los rostros que detecta.Computer Vision returns the coordinates, rectangle, gender, and age for each detected face.
Computer Vision proporciona un subconjunto de la funcionalidad del servicio Face.Computer Vision provides a subset of the Face service functionality. Puede usar el servicio Face para realizar un análisis más detallado, como la identificación facial y la detección de poses.You can use the Face service for more detailed analysis, such as facial identification and pose detection.
Detectar tipos de imagenDetect image types Detecte las características de una imagen, como por ejemplo, si una imagen es un dibujo lineal o la probabilidad de que sea una imagen prediseñada.Detect characteristics about an image, such as whether an image is a line drawing or the likelihood of whether an image is clip art.
Detectar contenido específico del dominioDetect domain-specific content Use los modelos de dominio para detectar e identificar el contenido específico del dominio en una imagen, como celebridades y monumentos.Use domain models to detect and identify domain-specific content in an image, such as celebrities and landmarks. Por ejemplo, si una imagen contiene personas, Computer Vision puede usar un modelo de dominio para celebridades para determinar si las personas que se han detectado en la imagen son famosos conocidos.For example, if an image contains people, Computer Vision can use a domain model for celebrities to determine if the people detected in the image are known celebrities.
Detectar la combinación de coloresDetect the color scheme Analice el uso del color en una imagen.Analyze color usage within an image. Computer Vision puede determinar si una imagen está en blanco y negro o en color, y en las imágenes de color, identificar los colores dominantes y de énfasis.Computer Vision can determine whether an image is black & white or color and, for color images, identify the dominant and accent colors.
Generar una miniaturaGenerate a thumbnail Analice el contenido de una imagen para generar una miniatura adecuada de la misma.Analyze the contents of an image to generate an appropriate thumbnail for that image. En primer lugar, Computer Vision genera una miniatura de alta calidad y, después, analiza los objetos de la imagen para determinar el área de interés.Computer Vision first generates a high-quality thumbnail and then analyzes the objects within the image to determine the area of interest. Luego, Computer Vision recorta la imagen para ajustarla a los requisitos del área de interés.Computer Vision then crops the image to fit the requirements of the area of interest. La miniatura generada se puede presentar con una relación de aspecto diferente de la de la imagen original en función de sus necesidades.The generated thumbnail can be presented using an aspect ratio that is different from the aspect ratio of the original image, depending on your needs.
Obtener el área de interésGet the area of interest Analice el contenido de una imagen para devolver las coordenadas del área de interés.Analyze the contents of an image to return the coordinates of the area of interest. En lugar de recortar la imagen y generar una miniatura, Computer Vision devuelve las coordenadas del rectángulo delimitador de la región, por lo que la aplicación que realiza la llamada puede modificar la imagen original según sea necesario.Instead of cropping the image and generating a thumbnail, Computer Vision returns the bounding box coordinates of the region, so the calling application can modify the original image as desired.

Extracción de texto de las imágenesExtract text from images

Puede usar la API Read de Computer Vision para extraer texto escrito a mano e impreso de imágenes en una secuencia de caracteres legible por máquina.You can use Computer Vision Read API to extract printed and handwritten text from images into a machine-readable character stream. La API Read utiliza modelos actualizados y funciona con texto sobre superficies y fondos distintos, como recibos, pósteres, tarjetas de visita, cartas y pizarras.The Read API uses our latest models and works with text on a variety of surfaces and backgrounds, such as receipts, posters, business cards, letters, and whiteboards. Actualmente, el inglés es el único idioma que se admite.Currently, English is the only supported language.

También puede usar la API de reconocimiento óptico de caracteres (OCR) para extraer el texto impreso en varios idiomas.You can also use the optical character recognition (OCR) API to extract printed text in several languages. Si es necesario, OCR corrige el giro del texto reconocido y proporciona las coordenadas del marco de cada palabra.If needed, OCR corrects the rotation of the recognized text and provides the frame coordinates of each word. El OCR admite 25 idiomas y detecta automáticamente el idioma del texto reconocido.OCR supports 25 languages and automatically detects the language of the recognized text.

Moderación del contenido de las imágenesModerate content in images

Puede usar Computer Vision para detectar contenido explícito y para adultos en una imagen y devolver una puntuación de confianza para ambos.You can use Computer Vision to detect adult and racy content in an image and return a confidence score for both. Puede establecer el filtro para la detección de contenido para adultos o subido de tono en una escala deslizante con el fin de que pueda ajustarlo a sus preferencias.You can set the filter for adult and racy content detection on a sliding scale to accommodate your preferences.

Uso de contenedoresUse containers

Use contenedores de Computer Vision para reconocer texto impreso y manuscrito localmente, mediante la instalación de un contenedor de Docker estándar más cercano a los datos.Use Computer Vision containers to recognize printed and handwritten text locally by installing a standardized Docker container closer to your data.

Requisitos de imagenImage requirements

Computer Vision puede analizar las imágenes que cumplan los requisitos siguientes:Computer Vision can analyze images that meet the following requirements:

  • La imagen se debe presentar en formato JPEG, PNG, GIF o BMPThe image must be presented in JPEG, PNG, GIF, or BMP format
  • El tamaño de archivo de la imagen debe ser inferior a 4 megabytes (MB)The file size of the image must be less than 4 megabytes (MB)
  • Las dimensiones de la imagen deben ser mayores que 50 x 50 píxelesThe dimensions of the image must be greater than 50 x 50 pixels
    • Para la API Read, las dimensiones de la imagen deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.For the Read API, the dimensions of the image must be between 50 x 50 and 10000 x 10000 pixels.

Seguridad y privacidad de datosData privacy and security

Al igual que sucede con todas las instancias de Cognitive Services, los desarrolladores que usan el servicio Computer Vision deben estar al tanto de las directivas de Microsoft sobre los datos de clientes.As with all of the Cognitive Services, developers using the Computer Vision service should be aware of Microsoft's policies on customer data. Para más información, consulte la página de Cognitive Services en Microsoft Trust Center.See the Cognitive Services page on the Microsoft Trust Center to learn more.

Pasos siguientesNext steps

Introducción a Computer Vision, con una guía de inicio rápido:Get started with Computer Vision by following a quickstart guide: