O que são dispositivos de Fala?

O serviço de Fala funciona com uma ampla variedade de dispositivos e fontes de áudio. Você pode usar o processamento de áudio padrão disponível em um dispositivo. Caso contrário, o SDK de fala tem uma opção para usar nossos algoritmos avançados de processamento de áudio projetados para funcionar bem com o Serviço de fala. Ele fornece um reconhecimento de fala em campo distante mais preciso por meio da supressão de ruído, cancelamento de eco, beamforming e remoção da reverberação.

Processamento de áudio

O processamento de áudio consiste em aprimoramentos aplicados a um fluxo de áudio para melhorar a qualidade de áudio. Exemplos de aprimoramentos comuns incluem AGC (controle automático de ganho), supressão de ruído e AEC (cancelamento de eco acústico). O SDK de fala integra o MAS (Microsoft Audio Stack), permitindo que qualquer aplicativo ou produto use os recursos de processamento de áudio no áudio de entrada.

Recomendações de matriz de microfone

O SDK de Fala funciona melhor com uma matriz de microfone projetada de acordo com nossas diretrizes recomendadas. Para obter detalhes, consulte Recomendações da matriz de microfone.

Kits de desenvolvimento de dispositivo

O SDK de Fala foi projetado para funcionar com kits de desenvolvimento criados para uma finalidade específica, além de diversas configurações de matriz de microfone. Por exemplo, você pode usar um destes kits de desenvolvimento do Azure.

  • O Azure Percept DK contém um processador de áudio pré-configurado e uma matriz linear de quatro microfones. Você pode usar comandos de voz, detecção de palavra-chave e fala de campo distante com a ajuda dos serviços de IA do Azure.
  • O Azure Kinect DK é um kit de desenvolvedor de computação espacial com sensores de IA avançados que fornecem modelos de fala e pesquisa visual sofisticados da Visão de IA do Azure. Em um dispositivo pequeno que inclui tudo e com diversos modos, ele contém um sensor de profundidade, uma matriz de microfone espacial com uma câmera de vídeo e um sensor de orientação.

Próximas etapas