¿Qué es Image Analysis?
El servicio Image Analysis de Computer Vision puede extraer una gran variedad de características visuales de sus imágenes. Por ejemplo, puede determinar si una imagen tiene contenido para adultos, buscar marcas u objetos específicos o buscar rostros humanos.
Puede usar Image Analysis en la aplicación mediante el uso de un SDK de biblioteca cliente o invocar la API REST directamente. Siga el inicio rápido para comenzar.
Esta documentación contiene los siguientes tipos de artículos:
- Los inicios rápidos son instrucciones paso a paso que permiten realizar llamadas al servicio y obtener los resultados en un breve período de tiempo.
- Las guías paso a paso contienen instrucciones para usar el servicio de maneras más específicas o personalizadas.
- Los artículos conceptuales proporcionan explicaciones detalladas de la funcionalidad y las características del servicio.
- Los tutoriales son guías más largas que muestran cómo usar este servicio como componente en soluciones empresariales más amplias.
Características de Image Analysis
Puede analizar imágenes para detectar y proporcionar información detallada acerca de las características y funciones visuales. Todas las características de la lista siguiente se proporcionan gracias a la API Analyze Image. Siga un inicio rápido para comenzar.
Etiquetar características visuales
Identifique y etiquete las características visuales de una imagen a partir de un conjunto de miles de objetos, seres vivos, paisajes y acciones reconocibles. Cuando las etiquetas son ambiguas o no muy comunes, la respuesta de la API contiene “indicaciones” para aclarar el contexto de la etiqueta. El etiquetado no se limita al sujeto principal, como una persona en primer plano, sino que también incluye el entorno (interior o exterior), muebles, herramientas, plantas, animales, accesorios, gadgets, etc. Etiquetar características visuales
Detección de objetos
La detección de objetos es similar al etiquetado, pero la API devuelve las coordenadas del rectángulo delimitador para cada etiqueta aplicada. Por ejemplo, si una imagen contiene un perro, un gato y una persona, la operación de detección mostrará estos objetos junto con sus coordenadas en la imagen. Puede usar esta funcionalidad para procesar más las relaciones entre los objetos de una imagen. También permite saber cuando hay varias instancias de la misma etiqueta en una imagen. Detección de objetos
Detección de marcas
Identifique las marcas comerciales en imágenes o vídeos desde una base de datos de miles de logotipos globales. Puede usar esta característica, por ejemplo, para detectar qué marcas son más populares en medios sociales o más frecuentes en la ubicación de los productos multimedia. Detección de marcas
Clasificar una imagen
Identifique y clasifique toda una imagen mediante una taxonomía de categoría con jerarquías hereditarias de elementos primarios y secundarios. Las categorías se pueden usar solas o con nuestros nuevos modelos de etiquetado.
Actualmente, el inglés es el único idioma que se admite para etiquetar y clasificar imágenes. Clasificar una imagen
Describir una imagen
Genere una descripción de toda una imagen en lenguaje natural, con frases completas. Los algoritmos de Computer Vision generan varias descripciones en función de los objetos identificados en la imagen. Cada una de estas descripciones se evalúa y se genera una puntuación de confianza. Después, se devuelve una lista de puntuaciones de confianza ordenadas de más alta a más baja. Describir una imagen
Detección de caras
Detecte caras en una imagen y proporcione información acerca de ellas. Computer Vision devuelve las coordenadas, el rectángulo, el género y la edad de los rostros que detecta.
Computer Vision proporciona un subconjunto de la funcionalidad del servicio Face. Puede usar el servicio Face para realizar un análisis más detallado, como la identificación facial y la detección de poses. Detección de caras
Detectar tipos de imagen
Detecte las características de una imagen, como por ejemplo, si una imagen es un dibujo lineal o la probabilidad de que sea una imagen prediseñada. Detectar tipos de imagen
Detectar contenido específico del dominio
Use los modelos de dominio para detectar e identificar el contenido específico del dominio en una imagen, como celebridades y monumentos. Por ejemplo, si una imagen contiene personas, Computer Vision puede usar un modelo de dominio para celebridades para determinar si las personas que se han detectado en la imagen son famosos conocidos. Detectar contenido específico del dominio
Detectar la combinación de colores
Analice el uso del color en una imagen. Computer Vision puede determinar si una imagen está en blanco y negro o en color, y en las imágenes de color, identificar los colores dominantes y de énfasis. Detectar la combinación de colores
Generar una miniatura
Analice el contenido de una imagen para generar una miniatura adecuada de la misma. En primer lugar, Computer Vision genera una miniatura de alta calidad y, después, analiza los objetos de la imagen para determinar el área de interés. Luego, Computer Vision recorta la imagen para ajustarla a los requisitos del área de interés. La miniatura generada se puede presentar con una relación de aspecto diferente de la de la imagen original en función de sus necesidades. Generar una miniatura
Obtener el área de interés
Analice el contenido de una imagen para devolver las coordenadas del área de interés. En lugar de recortar la imagen y generar una miniatura, Computer Vision devuelve las coordenadas del rectángulo delimitador de la región, por lo que la aplicación que realiza la llamada puede modificar la imagen original según sea necesario. Obtener el área de interés
Moderación del contenido de las imágenes
Puede usar Computer Vision para detectar contenido para adultos en una imagen y devolver puntuaciones de confianza en las distintas clasificaciones. El umbral para el etiquetado de contenido se puede establecer en una escala deslizante, con el fin de que pueda ajustarlo a sus preferencias.
Requisitos de imagen
Image Analysis funciona con imágenes que cumplen los requisitos siguientes:
- La imagen se debe presentar en formato JPEG, PNG, GIF o BMP
- El tamaño de archivo de la imagen debe ser inferior a 4 megabytes (MB)
- Las dimensiones de la imagen deben ser mayores que 50 x 50 píxeles
Seguridad y privacidad de datos
Al igual que sucede con todas las instancias de Cognitive Services, los desarrolladores que usan el servicio Computer Vision deben estar al tanto de las directivas de Microsoft sobre los datos de clientes. Para más información, consulte la página de Cognitive Services en Microsoft Trust Center.
Pasos siguientes
Para empezar a usar Image Analysis, siga la guía de inicio rápido del lenguaje de desarrollo que prefiera: