Visão geral do dispositivo Azure Percept Audio

Importante

Desativação do Azure Percept DK:

Atualização 22 de fevereiro de 2023: uma atualização de firmware para os componentes acessórios Visão e Áudio do Percept DK (também conhecido como Som de Visão e Áudio) agora está disponível aqui e permitirá que os componentes acessórios continuem funcionando além da data de desativação.

A versão prévia pública do Azure Percept estará evoluindo para dar suporte a novas plataformas de dispositivos de borda e experiências de desenvolvedor. Como parte dessa evolução, o Azure Percept DK e o Audio Accessory e os serviços de suporte associados do Azure para o Percept DK serão desativados em 30 de março de 2023.

A partir de 30 de março de 2023, o Azure Percept DK e o Audio Accessory não terão mais suporte de nenhum serviço do Azure, incluindo o Azure Percept Studio, atualizações do sistema operacional, atualizações de contêineres, exibição de fluxo da Web e integração de Visão Personalizada. A Microsoft não fornecerá mais suporte de sucesso do cliente e quaisquer serviços de suporte associados. Para obter mais informações, visite a Postagem no blog sobre o aviso de desativação.

O Azure Percept Audio é um dispositivo acessório que adiciona recursos de IA de fala ao Azure Percept DK. Ele contém um processador de áudio pré-configurado e uma matriz linear de quatro microfones, permitindo que você use comandos de voz, detecção de palavra-chave e a fala de campo distante com a ajuda dos Serviços Cognitivos do Azure. Ele é integrado de pronto para uso com o Azure Percept DK, o Azure Percept Studio e outros serviços de gerenciamento do Azure Edge.

Componentes do Azure Percept Audio

O Azure Percept Audio contém os seguintes componentes principais:

  • Dispositivo do Azure Percept Audio (SoM) pronto para produção com uma matriz linear de quatro microfones e processamento de áudio por meio do codec XMOS
  • Placa de desenvolvedor (intermediária): botões de 2x, LEDs de 3x, Micro USB e conector de áudio 3,5 mm
  • Cabos necessários: cabo FPC, micro tipo B para USB-A
  • Cartão de boas-vindas
  • Placa de montagem mecânica com montagem integrada da série 80/20 1010

Recursos de computação

O Azure Percept Audio passa a entrada de áudio por meio da pilha de fala que é executada na CPU da placa da operadora do Azure Percept DK em uma forma de nuvem híbrida. Portanto, o Azure Percept Audio requer uma placa de operadora com um SO que dê suporte à pilha de fala para executar. ​

O processamento de áudio é realizado como a seguir:

  • Azure Percept Audio: captura e converte o áudio e o envia para o conector de áudio e DK.

  • Azure Percept DK: a pilha de fala executa a forma de feixe e o cancelamento de eco e processa o áudio de entrada para otimizar a fala. Após o processamento, ele executa a detecção de palavra-chave.

  • Nuvem: processa comandos e frases de linguagem natural, a verificação de palavra-chave e readaptação. ​

  • Offline: se o dispositivo estiver offline, ele detectará a palavra-chave e capturará a telemetria do status da conexão com a Internet. Pode ser observado um aumento falso na taxa de aceitação para a detecção de palavra-chave, pois a verificação de palavra-chave na nuvem não pode ser executada. ​

Introdução

Criar um protótipo sem código

Crie uma solução de fala sem código no Azure Percept Studio usando modelos de assistente de voz do Azure Percept para cenários automotivos, hotelaria, serviços de saúde e estoque.

Gerenciar sua solução de fala sem código

Informações técnicas adicionais