設定音訊格式和語音

已完成

合成語音時,您可以使用 SpeechConfig 物件自訂由 Azure AI 語音服務傳回的音訊。

音訊格式

Azure AI 語音服務支援語音合成產生之音訊串流的多種輸出格式。 視您的具體需求而定,您可選擇自己需要的格式:

  • 音訊檔類型
  • 取樣速率
  • 位元深度

SDK 中支援的格式會以 SpeechSynthesisOutputFormat 列舉表示。 例如: SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm

若要指定所需的輸出格式,請使用 SpeechConfig 物件的 SetSpeechSynthesisOutputFormat 方法:

speechConfig.SetSpeechSynthesisOutputFormat(SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm);

如需支援格式及其列舉值的完整清單,請參閱 Azure AI 語音 SDK 文件

語音

Azure AI 語音服務提供多種語音,可讓您用來個人化支援語音功能的應用程式。 您可使用以下兩種語音:

  • 標準語音 - 從音訊範例建立的合成語音。
  • 類神經網路語音 - 使用深度神經網路建立的自然發音語音。

語音會以名稱識別,其中識別的資訊包括地區設定和人員姓名en-GB-George

若要在 SpeechConfig 中指定語音合成,請將其 SpeechSynthesisVoiceName 屬性設為您要使用的語音:

speechConfig.SpeechSynthesisVoiceName = "en-GB-George";

如需有關語音的資訊,請參閱 Azure AI 語音 SDK 文件