語音合成標記語言 (SSML) 概觀

發行項
01/22/2024

語音合成標記語言（SSML）是以 XML 為基礎的標記語言，可用來微調文字到語音輸出屬性，例如音調、發音、說話速率、音量等等。它提供您比純文字輸入更多的控制和彈性。

提示

您可以使用語音庫來聽到不同樣式的語音，並音調讀取範例文字。

使用案例

SSML 的設計目的是讓您彈性地讓語音輸出聽起來，並提供不同的屬性來自定義該輸出。您可以使用 SSML 來：

定義輸入文字結構，以決定文字到語音輸出的結構、內容和其他特性。例如，您可以使用 SSML 來定義段落、句子、中斷或暫停或無聲。您可以用事件卷標來包裝文字，例如書籤或viseme，您的應用程式稍後可以處理。 viseme 是語音的視覺描述，即語音的個別語音聲音，以口語表示。
選擇語音、語言、名稱、樣式和角色。您可以在單一 SSML 檔中使用多個語音。您也可以調整強調、說話速率、音調和音量。 SSML 也可以插入預先錄製的音訊，例如音效或音樂筆記。
控制輸出音訊的發音。例如，您可以使用 SSML 搭配音素和自訂語彙來改善發音。您也可以使用 SSML 來定義單字或數學運算式的發音方式。

使用 SSML 的方式

SSML 功能適用於可能符合使用案例的各種工具。

重要

系統會針對轉換成語音的每個字元收費，包括標點符號。雖然 SSML 檔本身無法計費，但服務會計算您用來調整文字轉換成語音方式的選擇性元素，例如語音和音調，作為可計費字元。如需詳細資訊，請參閱定價注意事項。

您可以透過下列方式使用 SSML︰

音訊內容建立工具可讓您在Speech Studio中撰寫純文字和SSML。您可以接聽輸出音訊並調整 SSML 以改善語音合成。如需詳細資訊，請參閱語音合成與音訊內容建立工具。
批次合成 API 會透過 inputs 屬性接受 SSML。
語音 CLI 會透過 spx synthesize --ssml SSML 命令行自變數接受 SSML。
語音 SDK 會透過不同支援語言的「口語」SSML 方法接受 SSML。

下一步