什麼是語音裝置?

語音服務可與各種裝置和音訊來源搭配運作。 您可以使用裝置上可用的預設音訊處理。 否則,語音 SDK 有一個選項可讓您使用我們的進階音訊處理演算法,其設計目的是要與 語音服務搭配運作良好。 它透過噪音抑制、回聲取消、梁形和德維器提供精確的遠場 語音識別

音訊處理

音訊處理是套用至音訊數據流的增強功能,以改善音訊品質。 常見的增強功能範例包括自動增益控制(AGC)、噪音抑制和聲場迴音取消(AEC)。 語音 SDK 整合 Microsoft Audio Stack (MAS),允許任何應用程式或產品在其輸入音訊上使用其音訊處理功能。

麥克風陣列建議

語音 SDK 最適合使用根據我們建議的指導方針設計的麥克風數位。 如需詳細資訊,請參閱 麥克風數位建議

裝置開發工具包

語音 SDK 的設計目的是要搭配用途建置的開發工具包,以及不同的麥克風數位組組態。 例如,您可以使用其中一個 Azure 開發工具包。

  • Azure Percept DK 包含預先設定的音訊處理器和四個麥克風線性數位。 您可以藉助 Azure AI 服務,使用語音命令、關鍵字定位和遠場語音。
  • Azure Kinect DK 是具有進階 AI 感應器的空間計算開發人員套件,可提供精密的 Azure AI 視覺和語音模型。 作為具有多個模式的全方位小型裝置,它包含深度感測器、具有攝影機的空間麥克風數位,以及方向感測器。

下一步