Автоматическое определение языка для речи с использованием модели идентификации языка

Внимание

Из-за объявления об Службы мультимедиа Azure выхода на пенсию Индексатор видео Azure объявляет корректировки функций Индексатора видео Azure. Ознакомьтесь с изменениями, связанными с выходом на пенсию службы мультимедиа Azure (AMS), чтобы понять, что это означает для учетной записи Индексатора видео Azure. Ознакомьтесь с руководством по обновлению и миграции AMS: VI.

Индексатор видео Azure AI поддерживает автоматическую идентификацию языка (LID), которая является процессом автоматической идентификации языка из звукового содержимого. Файл мультимедиа транскрибируется на доминирующем языке.

Список поддерживаемых языков Индексатора видео в Azure AI см. на поддерживаемых языках.

Обязательно ознакомьтесь с разделом "Рекомендации и ограничения ".

Выбор автоматического определения языка при индексировании

При индексировании видео или его повторном индексировании с помощью API выберите параметр auto detect в параметре sourceLanguage.

При использовании портала перейдите к видео учетной записи на домашней странице Индексатора видео Azure ИИ и наведите указатель мыши на имя видео, которое вы хотите переиндексировать. В правом нижнем углу нажмите кнопку "Переиндексировать ". В диалоговом окне Повторное индексирование видео в раскрывающемся списке Исходный язык видео выберите пункт автоматическое распознавание.

Снимок экрана: место для выбора автоматического обнаружения.

Выходные данные модели

Индексатор видео Azure AI транскрибирует видео в соответствии с наиболее вероятным языком, если достоверность для этого языка > 0.6. Если язык не может быть идентифицирован с уверенностью, предполагается, что речь идет на английском языке.

Модель с главным языком доступна в формате JSON аналитики в качестве sourceLanguage атрибута (в разделе root/videos/Insights). В атрибуте также доступна соответствующая оценка достоверности sourceLanguageConfidence.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Рекомендации и ограничения

Автоматическая идентификация языка (LID) поддерживает следующие языки.

Список поддерживаемых языков Индексатора видео в Azure AI см. на поддерживаемых языках.

  • Если звук содержит языки, отличные от поддерживаемого списка, результат непредвиден.
  • Если индексатор видео Azure AI не может определить язык с достаточной уверенностью (больше 0,6), резервный язык — английский.
  • В настоящее время файлы с смешанным языком не поддерживаются. Если аудио содержит смешанные языки, результат будет непредвиденным.
  • Низкое качество звука может повлиять на результаты модели.
  • Для модели требуется по крайней мере одна минута речи в аудио.
  • Модель предназначена для распознавания спонтанной речи (а не голосовых команд, пения и т. д.).