Автоматическое определение языка для речи с использованием модели идентификации языка
Внимание
Из-за объявления об Службы мультимедиа Azure выхода на пенсию Индексатор видео Azure объявляет корректировки функций Индексатора видео Azure. Ознакомьтесь с изменениями, связанными с выходом на пенсию службы мультимедиа Azure (AMS), чтобы понять, что это означает для учетной записи Индексатора видео Azure. Ознакомьтесь с руководством по обновлению и миграции AMS: VI.
Индексатор видео Azure AI поддерживает автоматическую идентификацию языка (LID), которая является процессом автоматической идентификации языка из звукового содержимого. Файл мультимедиа транскрибируется на доминирующем языке.
Список поддерживаемых языков Индексатора видео в Azure AI см. на поддерживаемых языках.
Обязательно ознакомьтесь с разделом "Рекомендации и ограничения ".
Выбор автоматического определения языка при индексировании
При индексировании видео или его повторном индексировании с помощью API выберите параметр auto detect
в параметре sourceLanguage
.
При использовании портала перейдите к видео учетной записи на домашней странице Индексатора видео Azure ИИ и наведите указатель мыши на имя видео, которое вы хотите переиндексировать. В правом нижнем углу нажмите кнопку "Переиндексировать ". В диалоговом окне Повторное индексирование видео в раскрывающемся списке Исходный язык видео выберите пункт автоматическое распознавание.
Выходные данные модели
Индексатор видео Azure AI транскрибирует видео в соответствии с наиболее вероятным языком, если достоверность для этого языка > 0.6
. Если язык не может быть идентифицирован с уверенностью, предполагается, что речь идет на английском языке.
Модель с главным языком доступна в формате JSON аналитики в качестве sourceLanguage
атрибута (в разделе root/videos/Insights). В атрибуте также доступна соответствующая оценка достоверности sourceLanguageConfidence
.
"insights": {
"version": "1.0.0.0",
"duration": "0:05:30.902",
"sourceLanguage": "fr-FR",
"language": "fr-FR",
"transcript": [...],
. . .
"sourceLanguageConfidence": 0.8563
}
Рекомендации и ограничения
Автоматическая идентификация языка (LID) поддерживает следующие языки.
Список поддерживаемых языков Индексатора видео в Azure AI см. на поддерживаемых языках.
- Если звук содержит языки, отличные от поддерживаемого списка, результат непредвиден.
- Если индексатор видео Azure AI не может определить язык с достаточной уверенностью (больше 0,6), резервный язык — английский.
- В настоящее время файлы с смешанным языком не поддерживаются. Если аудио содержит смешанные языки, результат будет непредвиденным.
- Низкое качество звука может повлиять на результаты модели.
- Для модели требуется по крайней мере одна минута речи в аудио.
- Модель предназначена для распознавания спонтанной речи (а не голосовых команд, пения и т. д.).
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по