Что такое устройства обработки речи?

Служба Речь поддерживает широкий ряд устройств и источников звука. Вы можете использовать обработку звука по умолчанию, доступную на устройстве. В противном случае пакет SDK службы "Речь" может использовать наши расширенные алгоритмы обработки звука, предназначенные для эффективной работы со службой "Речь". Он обеспечивает точное распознавание речи в дальней зоне за счет подавления шума, эхоподавления, формирования луча и дереверберации.

Обработка звука

Обработка звука — это улучшения, применяемые к потоку аудиоданных для повышения качества звука. Примеры распространенных улучшений: автоматическое управление усилением (AGC), шумоподавление и эхоподавление (AEC). Пакет SDK службы "Речь" интегрирует Microsoft Audio Stack (MAS), позволяющий любому приложению или продукту использовать предоставляемые им возможности обработки звука для входных аудиоданных.

Рекомендации по микрофонной решетке

Пакет SDK службы "Речь" лучше всего работает с массивом микрофонов, разработанным в соответствии с нашими рекомендациями. Дополнительные сведения см. в статье Рекомендации по массиву микрофонов.

Пакеты средств разработки для устройств

Пакет SDK службы "Речь" предназначен для работы со специальными пакетами средств разработки и массивами микрофонов, имеющими различные конфигурации. Например, можно использовать один из следующих пакетов средств разработки Azure.

  • Azure Percept DK содержит предварительно настроенный аудиопроцессор и линейный массив из четырех микрофонов. Вы можете использовать голосовые команды, ключевое слово распознавание и многое поле речи с помощью служб ИИ Azure.
  • Azure Kinect DK — это набор разработчиков пространственных вычислений с расширенными датчиками ИИ, которые предоставляют сложные модели распознавания и речи Azure AI. Это небольшое многофункциональное устройство с несколькими режимами содержит датчик глубины, массив пространственных микрофонов с видеокамерой и датчик ориентации.

Следующие шаги