Automatická identifikace mluveného jazyka s využitím modelu identifikace jazyka
Důležité
Vzhledem k oznámení o vyřazení služby Azure Media Services vám Azure AI Video Indexer oznámí úpravy funkcí Azure AI Video Indexeru. Informace o tom, co to znamená pro váš účet Azure AI Video Indexer, najdete v tématu Změny související s vyřazením služby Azure Media Service (AMS). Podívejte se na průvodce přípravou na vyřazení AMS: Průvodce aktualizací VI a migrací.
Azure AI Video Indexer podporuje automatickou identifikaci jazyka (LID), což je proces automatické identifikace mluveného jazyka ze zvukového obsahu. Multimediální soubor se přepisuje v dominantním identifikovaném jazyce.
Podívejte se na seznam podporovaných jazyků Azure AI Video Indexeru v podporovaných jazycích.
Nezapomeňte si projít část Pokyny a omezení .
Volba automatické identifikace jazyka při indexování
Při indexování nebo přeindexování videa pomocí rozhraní API zvolte auto detect
možnost v parametru sourceLanguage
.
Pokud používáte portál, přejděte na domovskou stránku Azure AI Video Indexeru na videasvého účtu a najeďte myší na název videa, které chcete přeindexovat. V pravém dolním rohu vyberte tlačítko Znovu indexovat . V dialogovém okně Znovu indexovat video zvolte v rozevíracím seznamu Jazyk zdroje videa možnost Automaticky rozpoznat.
Výstup modelu
Azure AI Video Indexer video přepisuje podle nejpravděpodobnějšího jazyka, pokud je > 0.6
spolehlivost daného jazyka . Pokud jazyk nelze identifikovat s jistotou, předpokládá se, že mluvený jazyk je angličtina.
Dominantní jazyk modelu je k dispozici ve formátu JSON přehledů sourceLanguage
jako atribut (v kořenovém adresáři, videích nebo přehledech). Odpovídající skóre spolehlivosti je také k dispozici v rámci atributu sourceLanguageConfidence
.
"insights": {
"version": "1.0.0.0",
"duration": "0:05:30.902",
"sourceLanguage": "fr-FR",
"language": "fr-FR",
"transcript": [...],
. . .
"sourceLanguageConfidence": 0.8563
}
Řízení a omezení.
Automatická identifikace jazyka (LID) podporuje následující jazyky:
Podívejte se na seznam podporovaných jazyků Azure AI Video Indexeru v podporovaných jazycích.
- Pokud zvuk obsahuje jiné jazyky než podporovaný seznam, výsledek je neočekávaný.
- Pokud Azure AI Video Indexer nedokáže identifikovat jazyk s vysokou spolehlivostí (větší než 0,6), je záložní jazyk angličtina.
- V současné době nepodporuje soubory se zvukem ve smíšeném jazyce. Pokud zvuk obsahuje smíšené jazyky, výsledek je neočekávaný.
- Výsledky modelu můžou mít vliv na zvuk s nízkou kvalitou.
- Model vyžaduje alespoň jednu minutu řeči ve zvuku.
- Model je navržený tak, aby rozpoznal spontánně konverzační řeč (ne hlasové příkazy, zpívání atd.).
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro