Co je Video Indexer?What is Video Indexer?

Azure Video Indexer je cloudová aplikace sestavená s využitím služeb Azure Media Analytics, Azure Search, Cognitive Services (jako jsou rozhraní API pro rozpoznávání tváře, Microsoft Translator, rozhraní API pro počítačové zpracování obrazu a služba Custom Speech).Azure Video Indexer is a cloud application built on Azure Media Analytics, Azure Search, Cognitive Services (such as the Face API, Microsoft Translator, the Computer Vision API, and Custom Speech Service). Umožňuje extrahovat přehledy z videí pomocí modelů Video Indexeru popsaných níže:It enables you to extract the insights from your videos using Video Indexer models described below:

  • Automatické rozpoznávání jazyka: Automaticky identifikuje převládající mluvený jazyk.Automatic language detection: Automatically identifies the dominant spoken language. Mezi podporované jazyky patří angličtina, španělština, francouzština, němčina, italština, zjednodušená čínština, japonština, ruština a brazilská portugalština.Supported languages include English, Spanish, French, German, Italian, Chinese (Simplified), Japanese, Russian, and Portuguese (Brazilian). Pokud jazyk nejde rozpoznat, přejde se zpátky k angličtině.Will fallback to English when the language can't be detected.
  • Přepis zvuku: Převede řeč na text v 10 jazycích a umožňuje rozšíření.Audio transcription: Converts speech to text in 10 languages and allows extensions. Mezi podporované jazyky patří angličtina, španělština, francouzština, němčina, italština, zjednodušená čínština, japonština, arabština, ruština a brazilská portugalština.Supported languages include English, Spanish, French, German, Italian, Chinese (Simplified), Japanese, Arabic, Russian, and Portuguese (Brazilian).
  • Tvorba titulků: Vytvoří titulky ve třech formátech: VTT, TTML, SRT.Closed captioning: Creates closed captioning in three formats: VTT, TTML, SRT.
  • Dvoukanálové zpracování: Pomocí automatické detekce oddělí přepis a sloučí vše do jediné časové osy.Two channel processing: Auto detects, separate transcript and merges to single timeline.
  • Snížení šumu: Vyčistí telefonní zvuk nebo záznamy s velkým šumem (pomocí filtrů Skypu).Noise reduction: Clears up telephony audio or noisy recordings (based on Skype filters).
  • Přizpůsobení přepisu (CRIS): Trénuje a spouští rozšířené vlastní modely převodu řeči na text k vytváření přepisů specifických pro dané odvětví.Transcript customization (CRIS): Trains and executes extended custom speech to text models to create industry-specific transcripts.
  • Výčet mluvčích: Mapuje a poznává, který mluvčí řekl která slova a kdy.Speaker enumeration: Maps and understands which speaker spoke which words and when.
  • Statistiky mluvčích: Poskytuje statistiky o poměru řeči jednotlivých mluvčích.Speaker statistics: Provides statistics for speakers speech ratios.
  • Vizuální rozpoznávání znaků (OCR): Extrahuje text, který je vizuálně zobrazený ve videu.Visual text recognition (OCR): Extracts text that is visually displayed in the video.
  • Extrakce klíčových snímků: Zjistí stabilní klíčové snímky ve videu.Keyframe extraction: Detects stable keyframes in a video.
  • Analýza citového zabarvení: Identifikuje kladná, záporná a neutrální zabarvení řeči a vizuálního textu.Sentiment analysis: Identifies positive, negative, and neutral sentiments from speech and visual text.
  • Zmírnění vizuálního obsahu: Detekuje vizuální obsah jen pro dospělé nebo nevhodný obsah.Visual content moderation: Detects adult and/or racy visuals.
  • Extrakce klíčových slov: Extrahuje klíčová slova z řeči a vizuálního textu.Keywords extraction: Extracts keywords from speech and visual text.
  • Identifikace popisků: Identifikuje vizuální objekty a zobrazené akce.Labels identification: Identifies visual objects and actions displayed.
  • Extrakce značek: Extrahuje značky z řeči a vizuálního textu.Brands extraction: Extracts brands from speech and visual text.
  • Detekce tváří: Detekuje a seskupí tváře, které jsou ve videu zobrazené.Face detection: Detects and groups faces appearing in the video.
  • Extrakce miniatur tváří („nejlepší tvář“): Automaticky identifikuje nejvhodnější zachycenou tvář v každé skupině tváří (podle kvality, velikosti a čelní polohy) a extrahuje ji jako obrázek.Thumbnail extraction for faces ("best face"): Automatically identifies the best captured face in each group of faces (based on quality, size, and frontal position) and extract it as an image asset.
  • Identifikace celebrit: Rozpozná celebrity ve videu podle databáze 1 milionu celebrit.Celebrity identification: Recognizes celebrities in the video based on a database of 1M celebrities. Zdroje pochází z IMDb, Wikipedie a nejvlivnějších osob z LinkedIn.The source comes from IMDB, Wikipedia, and top Linkedin influencers.
  • Vlastní identifikace tváří: Rozpozná tváře na videu podle vlastního modelu vytrénovaného pro konkrétní účet.Custom face identification: Recognizes faces in the video based on a custom model trained for the specific account.
  • Zmírnění textového obsahu: Detekuje explicitní text v přepisu zvuku.Textual content moderation: Detects explicit text in the audio transcript.
  • Detekce záběrů: Zjistí, kdy se ve videu změnila scéna.Shot detection: Determines when a scene changes in the video.
  • Detekce černých snímků: Identifikuje černé snímky ve videu.Black frame detection: Identifies black frames presented in the video.
  • Zvukové efekty: Identifikuje zvukové efekty, jako je tleskání, řeč a ticho.Audio effects: Identifies audio effects such as hand claps, speech, and silence.
  • Dedukce témat: Dedukuje hlavní témata z přepisů.Topic inference: Makes inference of main topics from transcripts. Zahrnuje taxonomii IPTC 1. úrovně.The 1st-level IPTC taxonomy is included.
  • Rozpoznávání emocí: Identifikuje emoce podle náznaků v řeči a zvuku. Rozpozná tyto emoce: radost, smutek, hněv nebo strach.Emotion detection: Identifies emotions based on speech and audio cues. The emotion could be: joy, sadness, anger, or fear.
  • Artefakty: Extrahuje bohatou sadu artefaktů s „další úrovní podrobností“ pro každý z modelů.Artifacts: Extracts rich set of "next level of details" artifacts for each of the models.
  • Překlad: Vytvoří překlady přepisu zvuku do 54 různých jazyků.Translation: Creates translations of the audio transcript to 54 different languages.

Jakmile Video Indexer dokončí zpracování a analýzu, můžete přehledné informace o videích revidovat, kurátorovat, prohledávat a publikovat.Once Video Indexer is done processing and analyzing, you can review, curate, search, and publish the video insights.

Služba Video Indexer dokáže splnit vaše požadavky, ať už jste vývojář, nebo správce obsahu.Whether your role is a content manager or a developer, the Video Indexer service is able to address your needs. Správci obsahu můžou pomocí webového portálu Video Indexer tuto službu využívat, aniž by museli napsat jediný řádek kódu. Další informace najdete v článku Začínáme s webem Video Indexer.Content managers can use the Video Indexer web portal to consume the service without writing a single line of code, see Get started with the Video Indexer website. Vývojáři mohou využít rozhraní API ke zpracování obsahu ve velkém měřítku, viz téma věnované použití rozhraní REST API služby Video Indexer.Developers can take advantage of APIs to process content at scale, see Use Video Indexer REST API. Tato služba také zákazníkům umožňuje používat widgety k publikování datových proudů videa a extrahovaných přehledů ve vlastních aplikacích. Další informace najdete v tématu Vložení vizuálních widgetů do vaší aplikace.The service also enables customers to use widgets to publish video streams and extracted insights in their own applications, see Embed visual widgets in your application.

K registraci této služby můžete využít existující účet služeb AAD, LinkedIn, Facebook, Google nebo MSA.You can sign up for the service using existing AAD, LinkedIn, Facebook, Google, or MSA account. Další informace najdete v tématu Začínáme.For more information, see getting started.

ScénářeScenarios

Dál najdete několik scénářů, ve kterých se Video Indexer může hoditBelow are a few scenarios where Video Indexer can be useful

  • Hledání – Přehledy extrahované z videa se dají využít k vylepšení vyhledávání v knihovně videí.Search – Insights extracted from the video can be used to enhance the search experience across a video library. Například indexování mluveného slova a tváří umožňuje ve videu vyhledávat okamžiky, kdy konkrétní osoba říká určitá slova nebo kdy jsou dva lidé vidět pohromadě.For example, indexing spoken words and faces can enable the search experience of finding moments in a video where a particular person spoke certain words or when two people were seen together. Hledání založené na takovýchto přehledech z videí je užitečné pro zpravodajské agentury, vzdělávací instituce, provozovatele vysílání, vlastníky zábavního obsahu, podnikové obchodní aplikace a obecně pro libovolné obory využívající knihovnu videí, ve kterých musí uživatelé vyhledávat.Search based on such insights from videos is applicable to news agencies, educational institutes, broadcasters, entertainment content owners, enterprise LOB apps and in general to any industry that has a video library that users need to search against.

  • Finanční zhodnocení – Video Indexer umožňuje zvýšit hodnotu videí.Monetization – Video Indexer can help improve the value of videos. Například obory, které závisejí na výnosech z reklam (například sdělovací prostředky, sociální média atd.), mohou využít extrahované přehledy jako další signály pro reklamní server a poskytovat díky nim relevantnější reklamy (reklama na sportovní obuv je relevantnější během fotbalového utkání než při plaveckých soutěžích).As an example, industries that rely on ad revenue (for example, news media, social media, etc.), can deliver more relevant ads by using the extracted insights as additional signals to the ad server (presenting a sports shoe ad is more relevant in the middle of a football match vs. a swimming competition).

  • Zapojení uživatelů – Video Insights se dá využít k lepšímu zapojení uživatelů díky možnosti předkládání relevantních videookamžiků.User engagement – Video insights can be used to improve user engagement by positioning the relevant video moments to users. Jako příklad si představte vzdělávací video, které prvních 30 minut vysvětluje kulové plochy a dalších 30 minut pyramidy.As an example, consider an educational video that explains spheres for the first 30 minutes and pyramids in the next 30 minutes. Studentovi, který si čte o pyramidách, by víc pomohlo, kdyby se video nastavilo tak, aby se spustilo od značky 30 minut.A student reading about pyramids would benefit more if the video is positioned starting from the 30-minute marker.

Další informace najdete na tomto blogu.For more information, see this blog.

Další krokyNext steps

Jste připraveni začít pracovat s Video Indexerem.You're ready to get started with Video Indexer. Další informace najdete v následujících článcích:For more information, see the following articles: