語音 API 服務的類型

您可以使用 Azure 認知服務語音服務來執行口語語言轉換,包括語音轉換、文字轉換語音、語音翻譯和說話者辨識。

注意

如果您想要收集字詞或片語的深入解析,或取得口語或撰寫語言的詳細內容分析,請使用 適用于語言的 Azure 認知服務

服務

  • 語音轉換文字 可以即時或批次將音訊串流轉換成文字。
  • 文字到語音 轉換可讓應用程式將文字轉換成類似人類語音的語音。
  • 語音翻譯 提供音訊資料流程的多語言語音轉換和語音轉換文字翻譯。

如何選擇語音服務

此流程圖可協助您選擇符合您需求的語音服務:

顯示如何選擇語音服務的圖表。

圖表左側說明音訊到音訊或音訊到文字處理程式。

  • 語音轉換文字可用來將語音從音訊來源轉換成文字格式。
  • 語音轉換用來將語音翻譯成其他語言的語音。

圖表右側解說文字到音訊進程。

  • 文字轉換語音可用來從文字來源產生語音音訊。

一般使用案例

下表建議一些常見使用案例的服務。

使用案例 要使用的服務
提供錄製或即時影片的隱藏式輔助字幕 語音轉文字
建立通話或會議的文字記錄 語音轉文字
實作自動化記事聽寫 語音轉文字
判斷預定的使用者輸入以進行進一步處理 語音轉文字
產生使用者輸入的口語回應 文字轉換語音
建立電話系統的語音功能表 文字轉換語音
在免操作案例中大聲朗讀電子郵件或簡訊 文字轉換語音
在公用位置廣播公告,例如月臺或機場 文字轉換語音
產生語音的即時隱藏式輔助字幕,或同時翻譯口語交談的雙向翻譯 語音轉文字

參與者

本文由 Microsoft 維護。 它原本是由下列參與者所撰寫。

主要作者:

其他參與者:

若要查看非公用LinkedIn設定檔,請登入 LinkedIn。

下一步