什麼是語音轉換文字?

在此概觀中,您將了解語音服務的語音轉換文字功能的優點和功能,這是 Azure AI 服務的一部分。 語音轉換文字可用於將音訊串流即時批次謄寫為文字。

注意

如需比較即時批次謄寫的價格,請參閱語音服務定價

如需可用語音轉換文字語言的完整清單,請參閱語言和語音支援

即時語音轉換文字

透過即時語音轉換文字,可以在辨識麥克風或檔案中的語音時轉錄語音。 針對需要即時謄寫音訊的應用程式使用即時語音轉換文字,例如:

可透過語音 SDK語音 CLI 實現即時語音轉換文字。

批次轉譯

批次謄寫是用來謄寫儲存體中的大量音訊。 您可使用共用存取簽章 (SAS) URI 來指向音訊檔案,並以非同步方式接收轉譯結果。 針對需要大量謄寫音訊的應用程式使用批次謄寫,例如:

  • 預先錄製音訊的轉譯、標題 或字幕
  • 連絡中心通話後分析
  • 自動分段標記

可透過以下方式進行批次謄寫:

自訂語音

透過 自訂語音,您可以評估及改善應用程式和產品的語音辨識精確度。 自訂語音模型可用於即時語音轉換文字語音翻譯批次謄寫

提示

裝載的部署端點不需要搭配 Batch 轉譯 API 使用自定義語音。 如果自訂語音模型僅用於批次謄寫,則可以節省資源。 如需詳細資訊,請參閱 語音服務定價

開箱即用的語音辨識功能運用通用語言模型作為基礎模型。這個功能是以 Microsoft 擁有的資料定型,且能夠反映常用的口語語言。 基底模型會預先定型代表各種常見領域之方言和注音。 當您提出語音辨識要求時,預設會使用每個 支持語言 的最新基底模型。 基礎模型在大部分的語音辨識案例中運作良好。

自定義模型可用來增強基底模型,藉由提供文字數據來定型模型,以改善應用程式特有的領域特定詞彙的辨識。 它也可以藉由提供音訊數據與參考轉譯,來改善應用程式特定音訊條件的辨識。 如需詳細資訊,請參閱 自定義語音語音轉換文字 REST API

自訂選項會依語言或地區設定而有所不同。 若要確認支援,請參閱 語音服務的語言和語音支援。

負責 AI

AI 系統不僅包含技術,也包含使用它的人員、受其影響的人員,以及其部署所在的環境。 閱讀透明度資訊,了解在系統中負責任 AI 的使用和部署資訊。

下一步