Что такое устройства обработки речи?

Статья
01/22/2024

Служба Речь поддерживает широкий ряд устройств и источников звука. Вы можете использовать обработку звука по умолчанию, доступную на устройстве. В противном случае пакет SDK службы "Речь" может использовать наши расширенные алгоритмы обработки звука, предназначенные для эффективной работы со службой "Речь". Он обеспечивает точное распознавание речи в дальней зоне за счет подавления шума, эхоподавления, формирования луча и дереверберации.

Обработка звука

Обработка звука — это улучшения, применяемые к потоку аудиоданных для повышения качества звука. Примеры распространенных улучшений: автоматическое управление усилением (AGC), шумоподавление и эхоподавление (AEC). Пакет SDK службы "Речь" интегрирует Microsoft Audio Stack (MAS), позволяющий любому приложению или продукту использовать предоставляемые им возможности обработки звука для входных аудиоданных.

Пакеты средств разработки для устройств

Пакет SDK службы "Речь" предназначен для работы со специальными пакетами средств разработки и массивами микрофонов, имеющими различные конфигурации. Например, можно использовать один из следующих пакетов средств разработки Azure.

Azure Percept DK содержит предварительно настроенный аудиопроцессор и линейный массив из четырех микрофонов. Вы можете использовать голосовые команды, ключевое слово распознавание и многое поле речи с помощью служб ИИ Azure.
Azure Kinect DK — это набор разработчиков пространственных вычислений с расширенными датчиками ИИ, которые предоставляют сложные модели распознавания и речи Azure AI. Это небольшое многофункциональное устройство с несколькими режимами содержит датчик глубины, массив пространственных микрофонов с видеокамерой и датчик ориентации.

Следующие шаги

Основные понятия обработки звука

Что такое устройства обработки речи?

Обработка звука

Рекомендации по микрофонной решетке

Пакеты средств разработки для устройств

Следующие шаги

Дополнительные ресурсы