¿Qué es Video Indexer?What is Video Indexer? (versión preliminar)(preview)

Video Indexer es una aplicación en nube creada con Azure Media Analytics, Cognitive Services (como Face API, Microsoft Translator, Computer Vision API y Custom Speech Service) y Azure Search.Video Indexer is a cloud application built using Azure Media Analytics, Cognitive Services (such as the Face API, Microsoft Translator, the Computer Vision API, and Custom Speech Service), and Azure Search. Le permite extraer la siguiente información de sus vídeos mediante tecnologías de inteligencia artificial:It enables you to extract the following insights from your videos using artificial intelligence technologies:

  • Detección automática del idioma: Video Indexer puede detectar automáticamente el idioma del vídeo.Automatic language detection: Video Indexer can automatically detect the language of the video. La detección automática del idioma actualmente admite inglés, español, francés, alemán, italiano, chino (simplificado), japonés y ruso.Auto language detection currently supports English, Spanish, French, German, Italian, Chinese (Simplified), Japanese, Russian. Volverá al inglés cuando no se pueda detectar ningún idioma.Will fallback to English when the language can't be detected.
  • Transcripción de audio: Video Indexer tiene la funcionalidad de voz a texto, que permite a los clientes obtener una transcripción de las palabras habladas.Audio transcription: Video Indexer has speech-to-text functionality, which enables customers to get a transcript of the spoken words. Los idiomas admitidos son inglés, español, francés, alemán, italiano, chino (simplificado), portugués (Brasil), japonés y ruso (y muchos más que se incluirán en el futuro).Supported languages include English, Spanish, French, German, Italian, Chinese (Simplified), Portuguese (Brazilian), Japanese, and Russian (with many more to come in the future).
  • Seguimiento e identificación facial: las tecnologías de reconocimiento facial permiten la detección de las caras en un vídeo.Face tracking and identification: Face technologies enable detection of faces in a video. Las caras detectadas se comparan con una base de datos de celebridades para evaluar cuáles están presentes en el vídeo.The detected faces are matched against a celebrity database to evaluate which celebrities are present in the video. Los clientes también pueden etiquetar caras que no coinciden con una celebridad.Customers can also label faces that do not match a celebrity. Video Indexer crea un modelo de cara basado en esas etiquetas y puede reconocer esas caras en los vídeos enviados en el futuro.Video Indexer builds a face model based on those labels and can recognize those faces in videos submitted in the future.
  • Indexación de hablantes: Video Indexer tiene la funcionalidad de asignar y comprender qué orador dice qué palabras y cuándo.Speaker indexing: Video Indexer has the ability to map and understand which speaker spoke which words and when.
  • Reconocimiento de texto visual: con esta tecnología, el servicio Video Indexer extrae el texto que se muestra en los vídeos.Visual text recognition: With this technology, Video Indexer service extracts text that is displayed in the videos.
  • Detección de actividad de voz: la detección habilita Video Indexer para separar el ruido de fondo y la actividad de la voz.Voice activity detection: Detection enables Video Indexer to separate background noise and voice activity.
  • Detección de escena: Video Indexer tiene la capacidad de realizar un análisis visual sobre el vídeo para determinar cuándo se cambia una escena en un vídeo.Scene detection: Video Indexer has the ability to perform visual analysis on the video to determine when a scene changes in a video.
  • Extracción de fotogramas clave: Video Indexer detecta automáticamente los fotogramas clave de un vídeo.Keyframe extraction: Video Indexer automatically detects keyframes in a video.
  • Análisis de sentimiento: Video Indexer realiza un análisis de sentimiento sobre el texto extraído utilizando reconocimiento de voz a texto y el reconocimiento óptico de caracteres, y proporciona esa información en forma de opiniones positivas, negativas o neutras, junto con códigos de tiempo.Sentiment analysis: Video Indexer performs sentiment analysis on the text extracted using speech-to-text and optical character recognition, and provides that information in the form of positive, negative, or neutral sentiments, along with timecodes.
  • Traducción: Video Indexer puede traducir la transcripción del audio de un idioma a otro.Translation: Video Indexer has the ability to translate the audio transcript from one language to another. Se admiten los idiomas siguientes: inglés, español, francés, alemán, italiano, chino simplificado, portugués de Brasil, japonés y ruso.The following languages are supported: English, Spanish, French, German, Italian, Chinese-Simplified, Portuguese-Brazilian, Japanese, and Russian. Una vez traducido, el usuario puede incluso obtener subtítulos en el reproductor de vídeo en otros idiomas.Once translated, the user can even get captioning in the video player in other languages.
  • Moderación del contenido visual: esta tecnología permite la detección de contenido para adultos o atrevido que esté presente en el vídeo y puede utilizarse para el filtrado de contenido.Visual content moderation: This technology enables detection of adult and/or racy material present in the video and can be used for content filtering.
  • Extracción de palabras clave: Video Indexer extrae palabras clave basadas en la transcripción de las palabras habladas y el texto reconocido por el módulo de reconocimiento de texto visual.Keywords extraction: Video Indexer extracts keywords based on the transcript of the spoken words and text recognized by visual text recognizer.
  • Etiquetas: Video Indexer proporciona etiquetas para objetos visuales como gato, perro, mesa, coche, así como acciones como estar de pie, correr o volar.Labels: Video Indexer provides labels for visual objects such as cat, dog, table, car, as well as actions such as standing, running or flying.
  • Marcas: Video Indexer extrae marcas comerciales basadas en la transcripción de las palabras habladas y el texto reconocido por el módulo de reconocimiento de texto visual.Brands: Video Indexer extracts business brands based on the transcript of the spoken words and text recognized by visual text recognizer.

Cuando Video Indexer termina de procesar y analizar, se puede revisar, ajustar, buscar y publicar la información de vídeo.Once Video Indexer is done processing and analyzing, you can review, curate, search, and publish the video insights.

Tanto si su rol es el de administrador de contenido como el de desarrollador, el servicio Video Indexer puede satisfacer sus necesidades.Whether your role is a content manager or a developer, the Video Indexer service is able to address your needs. Los administradores de contenido pueden utilizar el portal web de Video Indexer para consumir el servicio sin tener que escribir una sola línea de código; consulte el artículo de introducción al portal de Video Indexer.Content managers can use the Video Indexer web portal to consume the service without writing a single line of code, see Get started using the Video Indexer portal. Los desarrolladores pueden aprovechar las API para procesar el contenido a escala; consulte Uso de Video Indexer REST API.Developers can take advantage of APIs to process content at scale, see Use Video Indexer REST API. El servicio también permite a los clientes utilizar widgets para publicar secuencias de vídeo y extraer información en sus propias aplicaciones; consulte el tema sobre la inserción de widgets visuales en la aplicación.The service also enables customers to use widgets to publish video streams and extracted insights in their own applications, see Embed visual widgets in your application.

Puede suscribirse al servicio mediante una cuenta existente de AAD, LinkedIn, Facebook, Google o MSA.You can sign up for the service using existing AAD, LinkedIn, Facebook, Google, or MSA account. Para más información, consulte la introducción.For more information, see getting started.

EscenariosScenarios

A continuación se presentan algunos escenarios en los que Video Indexer puede ser útil.Below are a few scenarios where Video Indexer can be useful

  • Búsqueda: las información extraída del vídeo se puede utilizar para mejorar la experiencia de búsqueda en una biblioteca de vídeos.Search – Insights extracted from the video can be used to enhance the search experience across a video library. Por ejemplo, la indexación de palabras habladas y caras puede permitir la experiencia de búsqueda de momentos en un vídeo en los que una persona en particular ha pronunciado ciertas palabras o cuando se han visto juntas a dos personas.For example, indexing spoken words and faces can enable the search experience of finding moments in a video where a particular person spoke certain words or when two people were seen together. La búsqueda basada en esta información de los vídeos se puede aplicar a agencias de noticias, instituciones educativas, emisoras, propietarios de contenido de entretenimiento, aplicaciones de línea de negocio de empresas y, en general, a cualquier sector que tenga una biblioteca de vídeos en la que los usuarios necesiten buscar.Search based on such insights from videos is applicable to news agencies, educational institutes, broadcasters, entertainment content owners, enterprise LOB apps and in general to any industry that has a video library that users need to search against.

  • Monetización: Video Indexer puede ayudar a mejorar el valor de los vídeos.Monetization – Video Indexer can help improve the value of videos. Por ejemplo, los sectores que dependen de los ingresos por publicidad (por ejemplo, los medios de comunicación, las redes sociales, etc.), pueden entregar anuncios más relevantes con los conocimientos extraídos como señales adicionales para el servidor de anuncios (la presentación de un anuncio de calzado deportivo es más relevante en medio de un partido de fútbol que en una competición de natación).As an example, industries that rely on ad revenue (for example, news media, social media, etc.), can deliver more relevant ads by using the extracted insights as additional signals to the ad server (presenting a sports shoe ad is more relevant in the middle of a football match vs. a swimming competition).

  • Involucración del usuario: la información del vídeo se puede utilizar para mejorar la involucración de los usuarios al posicionar momentos de vídeo más relevantes para ellos.User engagement – Video insights can be used to improve user engagement by positioning the relevant video moments to users. Como ejemplo, considere un vídeo educativo que explique las esferas durante los primeros 30 minutos y las pirámides durante los siguientes 30 minutos.As an example, consider an educational video that explains spheres for the first 30 minutes and pyramids in the next 30 minutes. El estudiante que lee sobre las pirámides se beneficiaría más si el vídeo se posiciona a partir del marcador de 30 minutos.A student reading about pyramids would benefit more if the video is positioned starting from the 30-minute marker.

Para más información, consulte este blog.For more information, see this blog.

Pasos siguientesNext steps

Ya está listo para empezar a trabajar con Video Indexer.You're ready to get started with Video Indexer. Para más información, consulte los siguientes artículos.For more information, see the following articles: