語音合成與音訊內容建立工具

您可以使用 Speech Studio 的音訊內容建立工具進行文字轉換語音合成,不需要撰寫任何程式碼。 您可以依目前方式使用輸出音訊,或做為進一步自定義的起點。

針對各種案例建置高度自然的音訊內容,例如音訊手冊、新聞廣播、視訊旁白和聊天機器人。 您可運用音訊內容建立有效率地微調文字轉換語音的語音,並設計自訂的音訊體驗。

此工具是以 語音合成標記語言 (SSML) 為基礎。 它可讓您即時調整文字轉換語音的輸出屬性,或進行批次合成,例如語音字元、語音樣式、說話速度、發音和韻律。

  • 無程式碼方法:您可以使用音訊內容建立工具進行文字轉換語音合成,不需要撰寫任何程式碼。 輸出音訊可能是您想要的最終交付專案。 例如,您可以使用播客或視訊旁白的輸出音訊。
  • 開發人員易記:您可以接聽輸出音訊並調整 SSML 以改善語音合成。 然後,您可以使用 語音 SDK語音 CLI 將 SSML 整合到您的應用程式。 例如,您可以使用 SSML 來建置聊天機器人。

您可以輕鬆地存取廣泛的語言和語音組合。 這些語音包括最先進的預先建置神經語音,以及您建置的自定義神經語音。

若要深入瞭解,請在YouTube上檢視音訊內容建立教學課程影片

開始使用

語音 Studio 中的音訊內容建立工具是免費的存取權,但您需支付語音服務使用量的費用。 若要使用此工具,您必須使用 Azure 帳戶登入並建立語音資源。 針對每個 Azure 帳戶,您都有免費的每月語音配額,其中包含 050 萬個預先建置神經語音的字元(稱為定價頁面上類神經)。 通常,每月分配的數量足以容納大約3-5人的小型內容小組。

下一節將說明如何建立 Azure 帳戶並取得語音資源。

步驟 1:建立 Azure 帳戶

若要使用音訊內容建立,您需要 Microsoft 帳戶Azure 帳戶

Azure 入口網站 是您管理 Azure 帳戶的集中式位置。 您可以建立語音資源、管理產品存取,以及監視從簡單 Web 應用程式到複雜雲端部署的所有專案。

步驟 2:建立語音資源

註冊 Azure 帳戶之後,您必須在 Azure 帳戶中建立語音資源,才能存取語音服務。 在 Azure 入口網站建立語音資源。 如需詳細資訊,請參閱建立多服務資源

部署新的語音資源需要一些時間。 部署完成之後,您就可以開始使用音訊內容建立工具。

注意

如果您打算使用神經語音,請確定您在支援類神經語音的區域建立資源。

步驟 3:使用您的 Azure 帳戶和語音資源登入音訊內容建立

  1. 取得 Azure 帳戶和語音資源之後,請登入 Speech Studio,然後選取 [ 音訊內容建立]。

  2. 選取您想要使用的 Azure 訂用帳戶和語音資源,然後選取 [ 使用資源]。

    下次登入音訊內容建立時,您會直接連結到目前語音資源下的音訊工作檔案。 您可以在 Azure 入口網站檢查您的 Azure 訂用帳戶詳細數據和狀態。

    如果您沒有可用的語音資源,而且您是 Azure 訂用帳戶的擁有者或系統管理員,您可以選取 [建立新資源],在 Speech Studio 中建立語音資源

    如果您有特定 Azure 訂用帳戶的使用者角色,您可能沒有建立新語音資源的許可權。 要取得存取權,請連絡您的管理員。

    若要隨時切換您的語音資源,請選取頁面頂端 設定

    若要切換目錄,請選取 設定 或移至您的配置檔。

使用工具

下圖顯示微調文字轉換語音輸出的程序。

Diagram of the sequence of steps for fine-tuning text to speech outputs.

上圖中的每個步驟如下所述:

  1. 選擇您想要使用之語音資源。

  2. 使用純文字或 SSML 腳本建立音訊微調檔案 。 輸入或上傳您的內容到音訊內容建立。

  3. 選擇文稿內容的語音和語言。 「音訊內容建立」包含所有預建的文字轉換語音內容。 您可以使用預先建置的神經語音或自訂神經語音。

    注意

    網關存取適用於自定義神經語音,可讓您建立類似於自然語音的高畫質語音。 如需詳細資訊,請參閱 Gating 程式

  4. 選取您想要預覽的內容,然後選取 [播放 ] (三角形圖示) 以預覽預設合成輸出。

    如果您對文字進行任何變更,請選取 [停止 ] 圖示,然後再次選取 [ 播放 ] 以重新產生已變更腳本的音訊。

    藉由調整發音、中斷、音調、速率、音調、語音樣式等來改善輸出。 如需選項的完整清單,請參閱 語音合成標記語言

    如需微調語音輸出的詳細資訊,請檢視如何使用 Microsoft Azure AI 語音將文字轉換成語音 (英文) 影片。

  5. 儲存並 匯出微調的音訊

    當您在系統中儲存微調曲目時,您可以繼續工作並反覆運算輸出。 當您滿意輸出時,您可以使用匯出功能建立音訊建立工作。 您可以觀察匯出工作的狀態,並下載輸出以搭配您的應用程式和產品使用。

建立音訊微調檔案

您可以透過下列兩種方式之一,將內容放入音訊內容建立工具:

  • 選項 1

    1. 選取 [新增>文本檔] 以建立新的音訊微調檔案。

    2. 在編輯視窗中輸入或貼上您的內容。 每個檔案的允許字元數為 20,000 或更少。 如果您的文稿包含超過 20,000 個字元,您可以使用選項 2 自動將您的內容分割成多個檔案。

    3. 選取 [儲存]。

  • 選項 2

    1. 選取 [上傳>文字檔] 以匯入一或多個文本檔。 支援純文字和 SSML。

      如果您的腳本檔案超過 20,000 個字元,請依段落、字元或正則表示式來分割內容。

    2. 當您上傳文字檔時,請確定它們符合下列需求:

      屬性 說明
      File format 純文字 (.txt)*
      SSML 文字 (.txt)**
      不支援 Zip 檔案。
      編碼格式 UTF-8
      File name 每個檔案都必須有唯一的名稱。 不支援重複的檔案。
      Text length 字元限制為 20,000。 如果您的檔案超過限制,請根據工具中的指示加以分割。
      SSML 限制 每個 SSML 檔案只能包含單一 SSML 片段。

      * 純文字範例

      Welcome to use Audio Content Creation to customize audio output for your products.
      

      ** SSML 文字範例

      <speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" version="1.0" xml:lang="en-US">
          <voice name="en-US-AvaMultilingualNeural">
          Welcome to use Audio Content Creation <break time="10ms" />to customize audio output for your products.
          </voice>
      </speak>
      

匯出微調的音訊

檢閱音訊輸出並滿意您的微調和調整之後,您可以匯出音訊。

  1. 選取 [導出 ] 以建立音訊建立工作。

    建議您 匯出至音訊庫 ,以輕鬆地在雲端中儲存、尋找及搜尋音訊輸出。 您可以透過 Azure Blob 記憶體,更妥善地與應用程式整合。 您也可以直接將音訊下載到本機磁碟。

  2. 選擇微調音訊的輸出格式。 下表列出支援的音訊格式和取樣率

    格式 8 kHz 取樣率 16 kHz 取樣率 24 kHz 取樣率 48 kHz 取樣率
    Wav riff-8khz-16bit-mono-pcm riff-16khz-16bit-mono-pcm riff-24khz-16bit-mono-pcm riff-48khz-16bit-mono-pcm
    M p 3 N/A audio-16khz-128kbitrate-mono-mp3 audio-24khz-160kbitrate-mono-mp3 audio-48khz-192kbitrate-mono-mp3
  3. 若要檢視工作的狀態,請選取 [ 工作清單] 索引標籤

    如果工作失敗,請參閱完整報表的詳細資訊頁面。

  4. 當工作完成時,您的音訊可在 [音訊庫] 窗格上下載。

  5. 選取您要下載並 下載的檔案。

    現在您已準備好在應用程式或產品中使用自定義微調音訊。

設定 BYOS 和對 Blob 的匿名公用讀取存取

如果您失去自備 儲存體 (BYOS) 的訪問許可權,則無法檢視、建立、編輯或刪除檔案。 若要繼續存取,您必須移除目前的儲存體,並在 Azure 入口網站中重新設定 BYOS。 若要深入了解如何設定 BYOS,請參閱在 App Service 中掛接 Azure 儲存體作為本機共用

設定 BYOS 權限之後,您必須設定相關容器和 Blob 的匿名公用讀取存取。 否則,Blob 資料無法用於公用存取,而且無法存取 Blob 中的語彙檔案。 根據預設,容器的公用存取設定會停用。 若要授與匿名使用者對容器及其 Blob 的讀取權限,請先將 [允許 Blob 公用存取] 設定為 [啟用] 以允許儲存體帳戶的公用存取,然後設定容器的 (命名為 acc-public-files) 公用存取層級 (僅限 Blob 的匿名讀取存取)。 如需深入了解如何設定匿名公用讀取存取,請參閱設定對容器和 Blob 的匿名公用讀取存取

新增或移除音訊內容建立使用者

如果多個使用者想要使用音訊內容建立,您可以將 Azure 訂用帳戶和語音資源的存取權授與他們。 如果您將使用者新增至 Azure 訂用帳戶,他們可以存取 Azure 訂用帳戶下的所有資源。 但是,如果您只將使用者新增至語音資源,則他們只能存取語音資源,而不能存取此 Azure 訂用帳戶下的其他資源。 具有語音資源存取權的使用者可以使用音訊內容建立工具。

您授與存取權的用戶必須設定 Microsoft 帳戶。 如果他們有 Microsoft 帳戶,他們可以在短短幾分鐘內建立一個帳戶。 他們可以使用現有的電子郵件並將其連結至 Microsoft 帳戶,也可以建立並使用 Outlook 電子郵件地址作為 Microsoft 帳戶。

將使用者新增至語音資源

若要將使用者新增至語音資源,以便他們能夠使用音訊內容建立,請執行下列動作:

  1. Azure 入口網站 中,選取 [所有服務]。
  2. 然後選取 [Azure AI 服務],瀏覽至特定的語音資源。

    注意

    您也可以為整個資源群組、訂用帳戶或管理群組設定 Azure RBAC。 若要這樣做,請選取所需的範圍層級,然後流覽至所需的專案(例如,選取 [資源群組 ],然後按下您想要的資源群組)。

  3. 選取 左側瀏覽窗格中的 [存取控制][IAM ]。
  4. 選取 [新增 -> 新增角色指派]。
  5. 在下一個畫面的 [ 角色] 索引標籤上,選取您要新增的角色(在此案例中為 擁有者)。
  6. 在 [ 成員] 索引標籤上,輸入使用者的電子郵件地址,然後在目錄中選取使用者的名稱。 電子郵件地址必須連結到 Microsoft Entra ID 信任的 Microsoft 帳戶。 用戶可以使用其個人電子郵件地址輕鬆地註冊 Microsoft 帳戶
  7. 在 [檢閱 + 指派] 索引標籤上,選取 [檢閱 + 指派] 以指派角色。

以下是接下來會發生什麼事:

電子郵件邀請會自動傳送給使用者。 他們可以選取 [接受邀請>接受] 以在其電子郵件中加入 Azure,以接受它。 然後,系統會將他們重新導向至 Azure 入口網站。 他們不需要在 Azure 入口網站 採取進一步行動。 幾分鐘后,使用者就會獲派語音資源範圍的角色,讓他們能夠存取此語音資源。 如果使用者未收到邀請電子郵件,您可以在 [角色指派] 底下搜尋其帳戶,並進入其配置檔。 尋找已接受的身分>識別邀請,然後選取 [管理] 以重新傳送電子郵件邀請。 您也可以複製並傳送邀請連結給它們。

用戶現在流覽或重新整理 [音訊內容建立 ] 產品頁面,並使用其 Microsoft 帳戶登入。 他們會在所有語音產品中選取 [ 音訊內容建立 ] 區塊。 他們會選擇彈出視窗中的語音資源,或在右上角的設定中選擇語音資源。

如果他們找不到可用的語音資源,他們可以檢查以確保它們位於正確的目錄中。 若要這樣做,他們會選取右上角的帳戶配置檔,然後選取 [目前目錄] 旁的 [切換]。 如果有一個以上的目錄可用,這表示它們可以存取多個目錄。 他們可以切換至不同的目錄,並移至 設定,以查看正確的語音資源是否可用。

位於相同語音資源的使用者會在音訊內容建立工具中看到彼此的工作。 如果您想要讓每個使用者在音訊內容建立中擁有唯一且私人的工作場所, 請為每個使用者建立新的語音資源 ,併為每個使用者提供語音資源的唯一存取權。

從語音資源移除使用者

  1. 在 Azure 入口網站中搜尋 [Azure AI 服務],選取您要從中移除使用者的語音資源。

  2. 選取 [訪問控制][IAM],然後選取 [ 角色指派] 索引 標籤,以檢視此語音資源的所有角色指派。

  3. 選取您要移除的用戶、選取 [移除],然後選取 [ 確定]。

    Screenshot of the 'Remove' button on the 'Remove role assignments' pane.

讓使用者授與其他人的存取權

如果您想要允許使用者授與其他使用者的存取權,您必須為語音資源指派擁有者角色,並將使用者設定為 Azure 目錄讀取器。

  1. 將使用者新增為語音資源的擁有者。 如需詳細資訊,請參閱 將使用者新增至語音資源

    Screenshot showing the 'Owner' role on the 'Add role assignment' pane.

  2. Azure 入口網站 中,選取左上方的折疊功能表,選取 [Microsoft Entra ID],然後選取 [使用者]。

  3. 搜尋使用者的 Microsoft 帳戶,移至其詳細數據頁面,然後選取 [ 指派的角色]。

  4. 選取 [ 新增指派>目錄讀取器]。 如果 [ 新增指派] 按鈕無法使用,表示您沒有存取權。 只有此目錄的全域管理員可以將指派新增至使用者。

下一步