Panoramica del dispositivo Azure Percept Audio

Articolo
02/07/2023

Importante

Ritiro di Azure Percept DK:

Aggiornamento 22 febbraio 2023: un aggiornamento del firmware per i componenti accessori Percept DK Vision e Audio (noto anche come Visione e SOM audio) è ora disponibile qui e consentirà ai componenti accessori di continuare a funzionare oltre la data di ritiro.

L'anteprima pubblica di Azure Percept sarà in continua evoluzione per supportare nuove piattaforme per dispositivi perimetrali e esperienze per sviluppatori. Nell'ambito di questa evoluzione, Azure Percept DK e Audio Accessorio e i servizi di supporto associati per Percept DK verranno ritirati il 30 marzo 2023.

A partire dal 30 marzo 2023, Azure Percept DK e Audio Accessorio non sarà più supportato da alcun servizio di Azure, tra cui Azure Percept Studio, aggiornamenti del sistema operativo, aggiornamenti dei contenitori, visualizzare il flusso Web e Visione personalizzata integrazione. Microsoft non fornirà più supporto per il successo dei clienti e eventuali servizi di supporto associati. Per altre informazioni, visitare il post di blog sull'avviso di ritiro.

Azure Percept Audio è un dispositivo accessorio che aggiunge funzionalità di intelligenza artificiale vocale ad Azure Percept DK. Contiene un processore audio preconfigurato e una matrice lineare a quattro microfoni, che consente di usare i comandi vocali, l'spoting delle parole chiave e la voce in campo lontano con l'aiuto di Servizi cognitivi di Azure. È integrato all'avanguardia con Azure Percept DK, Azure Percept Studio e altri servizi di gestione perimetrali di Azure.

componenti Azure Percept Audio

Azure Percept Audio contiene i componenti principali seguenti:

Dispositivo Azure Percept Audio (SoM) pronto per la produzione con una matrice lineare a quattro microfoni ed elaborazione audio tramite codec XMOS
Scheda sviluppatore (interposer): pulsanti 2x, LED 3x, Micro USB e jack audio da 3,5 mm
Cavi obbligatori: cavo FPC, microtipo USB-B a USB-A
Scheda di benvenuto
Piastra di montaggio meccanico con montaggio integrato serie 80/20 1010

Funzionalità di calcolo

Azure Percept Audio passa l'input audio attraverso lo stack di riconoscimento vocale eseguito sulla CPU della scheda del gestore telefonico di Azure Percept DK in modo cloud perimetrale ibrido. Pertanto, Azure Percept Audio richiede una scheda del gestore telefonico con un sistema operativo che supporta lo stack di riconoscimento vocale per l'esecuzione.

L'elaborazione audio viene eseguita come segue:

Azure Percept Audio: acquisisce e converte l'audio e lo invia al jack DK e audio.
Azure Percept DK: lo stack di riconoscimento vocale esegue la forma del fascio e l'annullamento dell'eco ed elabora l'audio in ingresso per ottimizzare la voce. Dopo l'elaborazione, esegue l'spotting delle parole chiave.
Cloud: elabora i comandi e le frasi del linguaggio naturale, la verifica delle parole chiave e la ripetizione del training.
Offline: se il dispositivo è offline, rileverà la parola chiave e acquisirà i dati di telemetria dello stato della connessione Internet. È possibile osservare un aumento della frequenza di accettazione false per l'spotting delle parole chiave quando non è possibile eseguire la verifica delle parole chiave nel cloud.

Introduzione

Creare un prototipo senza codice

Creare una soluzione di riconoscimento vocale senza codice in Azure Percept Studio usando i modelli di Assistente vocale di Azure Percept per scenari di ospitalità, assistenza sanitaria, inventario e automotive.

Panoramica del dispositivo Azure Percept Audio

componenti Azure Percept Audio

Funzionalità di calcolo

Introduzione

Creare un prototipo senza codice

Gestire la soluzione di riconoscimento vocale senza codice

Informazioni tecniche aggiuntive

Risorse aggiuntive