什麼是語音裝置？

發行項
01/23/2024

語音服務可與各種裝置和音訊來源搭配運作。您可以使用裝置上可用的預設音訊處理。否則，語音 SDK 有一個選項可讓您使用我們的進階音訊處理演算法，其設計目的是要與語音服務搭配運作良好。它透過噪音抑制、回聲取消、梁形和德維器提供精確的遠場語音識別。

音訊處理

音訊處理是套用至音訊數據流的增強功能，以改善音訊品質。常見的增強功能範例包括自動增益控制（AGC）、噪音抑制和聲場迴音取消（AEC）。語音 SDK 整合 Microsoft Audio Stack （MAS），允許任何應用程式或產品在其輸入音訊上使用其音訊處理功能。

麥克風陣列建議

語音 SDK 最適合使用根據我們建議的指導方針設計的麥克風數位。如需詳細資訊，請參閱麥克風數位建議。

裝置開發工具包

語音 SDK 的設計目的是要搭配用途建置的開發工具包，以及不同的麥克風數位組組態。例如，您可以使用其中一個 Azure 開發工具包。

Azure Percept DK 包含預先設定的音訊處理器和四個麥克風線性數位。您可以藉助 Azure AI 服務，使用語音命令、關鍵字定位和遠場語音。
Azure Kinect DK 是具有進階 AI 感應器的空間計算開發人員套件，可提供精密的 Azure AI 視覺和語音模型。作為具有多個模式的全方位小型裝置，它包含深度感測器、具有攝影機的空間麥克風數位，以及方向感測器。

下一步

音訊處理概念