Che cosa sono i dispositivi Voce?

Il servizio Voce è compatibile con una vasta gamma di dispositivi e sorgenti audio. È possibile usare l'elaborazione audio predefinita disponibile in un dispositivo. In caso contrario, Speech SDK offre un'opzione che consente di usare gli algoritmi avanzati di elaborazione audio progettati per funzionare correttamente con il servizio Voce. Fornisce un riconoscimento vocale accurato sul campo tramite eliminazione del rumore, annullamento dell'eco, beamforming e dereverberation.

Elaborazione audio

L'elaborazione audio è un miglioramento applicato a un flusso di audio per migliorare la qualità audio. Esempi di miglioramenti comuni includono il controllo del guadagno automatico (AGC), l'eliminazione del rumore e l'annullamento dell'eco acustica (AEC). Speech SDK integra Microsoft Audio Stack (MAS), consentendo a qualsiasi applicazione o prodotto di usare le funzionalità di elaborazione audio sull'audio di input.

Raccomandazioni per gli array di microfoni

Speech SDK funziona meglio con una matrice di microfoni progettata in base alle linee guida consigliate. Per informazioni dettagliate, vedere Raccomandazioni sulla matrice di microfoni.

Kit di sviluppo di dispositivi

Speech SDK è progettato per lavorare con kit di sviluppo appositamente creati e diverse configurazioni della matrice di microfoni. Ad esempio, è possibile usare uno di questi kit di sviluppo di Azure.

  • Azure Percept DK contiene un processore audio preconfigurato e una matrice lineare a quattro microfoni. È possibile usare i comandi vocali, l'individuazione delle parole chiave e la voce di campo lontano con l'aiuto dei servizi di intelligenza artificiale di Azure.
  • Azure Kinect DK è un kit di sviluppo per l'elaborazione spaziale con sensori avanzati di intelligenza artificiale che forniscono sofisticati modelli di Visione artificiale e riconoscimento vocale di Azure. Come dispositivo piccolo all-in-one con più modalità, contiene un sensore di profondità, una matrice di microfoni spaziali con una videocamera e un sensore di orientamento.

Passaggi successivi