自訂神經語音精簡版 (預覽)

Speech Studio 提供兩種自定義神經語音 (CNV) 專案類型:CNV 精簡版和 CNV 專業版。

  • 自定義神經語音(CNV)專業版可讓您上傳透過專業錄音室收集的訓練數據,並建立更高品質的語音,與人類樣本幾乎無法區分。 CNV 專業存取權會根據資格和使用準則而受到限制。 要求進入表單存取權。
  • 自定義神經語音 (CNV)lite 是公開預覽中的項目類型。 您可以先示範和評估自定義神經語音,再投資專業錄音來建立更高品質的語音。 不需要任何應用程式。 Microsoft 會限制並選取錄製和測試範例,以搭配 CNV 精簡版使用。 您必須申請 CNV 專業人員的完整存取權,才能部署和使用 CNV 精簡版模型做為商務用途。

透過 CNV 精簡專案,您可以閱讀 Microsoft 提供的 20-50 預先定義的腳本,在線錄製您的語音。 記錄至少 20 個範例之後,您就可以開始定型模型。 成功定型模型之後,您可以檢閱模型,並查看另一組預先定義的腳本所產生的 20 個輸出範例。

請參閱自定義神經語音支持的語言

比較項目類型

下表摘要說明 CNV 精簡版與 CNV 專業專案類型之間的主要差異。

項目 精簡版 (預覽) Pro
目標案例 示範或評估 聊天機器人的品牌和字元語音,或音訊內容閱讀等專業案例。
訓練資料 使用Speech Studio線上錄製 攜帶您自己的數據。 建議在專業工作室錄製。
用於錄製的腳本 在Speech Studio 中提供 使用符合使用案例的您自己的腳本。 Microsoft 提供 參考的範例腳本
必要的數據大小 20-50 語句 300-2000 語句
定型時間 少於一個計算小時 大約 20-40 個計算時數
語音品質 中等品質 高品質
可用性 任何人都可以在線記錄範例,並訓練模型以供示範和評估之用。 如果您想要部署 CNV 精簡模型以供商務使用,則需要完整存取自定義神經語音。 數據上傳不受限制,但您只能在核准存取後定型及部署 CNV 專業模型。 CNV 專業存取權會根據資格和使用準則而受到限制。 要求進入表單存取權。
定價 每單位價格同樣適用於CNNV精英和CNNV專業專案。 請查看這裡的定價詳細數據。 每單位價格同樣適用於CNNV精英和CNNV專業專案。 請查看這裡的定價詳細數據。

建立自定義神經語音精簡專案

若要建立自定義神經語音精簡專案,請遵循下列步驟:

  1. 登入 Speech Studio

  2. 選取要使用的訂用帳戶和語音資源。

    重要

    自定義神經語音定型目前僅適用於某些區域。 如需詳細資訊,請參閱區域數據表中的腳註。

  3. 選取 [自定義語音>建立專案]。

  4. 選取 [自定義神經語音精簡>檔] [下一步]。

    注意

    若要建立自定義神經語音 Pro 專案,請參閱 建立自定義神經語音的專案。

  5. 請遵循精靈所提供的指示來建立您的專案。

  6. 依名稱選取新專案,或選取 [移至專案]。 您會在左面板中看到這些功能表項: 記錄和建置、 檢閱模型部署模型
    Screenshot with an overview of the CNV lite record, train, test, and deploy workflow.

CNV 精英專案在 90 天后到期,除非 提交語音人才錄製的口頭聲明

記錄並建置 CNV 精簡模型

使用在線提供的腳本錄製至少 20 個語音樣本(最多 50 個)。 此處錄製的語音範例可用來建立語音的合成版本。

以下是協助您錄製語音範例的一些秘訣:

  • 使用良好的麥克風。 使用高品質的麥克風提高樣本的清晰度。 說出離麥克風約 8 英吋的距離,以避免嘴部噪音。
  • 避免背景雜訊。 在沒有背景噪音或回音的情況下,在安靜的房間里錄製。
  • 自然放鬆和說話。 讓自己在閱讀句子時表達情緒。
  • 以一個擷取記錄。 若要保持一致的能量等級,請在一個會話中記錄所有句子。
  • 正確發音每個字,並清楚說話。

若要記錄並建置 CNV 精簡模型,請遵循下列步驟:

  1. 選取 [自定義語音> 您的專案名稱 >記錄並建置]。
  2. 選取開始使用
  3. 仔細閱讀語音人才使用規定。 選取複選框以確認使用規定。
  4. 選取 [ 接受]
  5. 按下麥克風圖示以啟動雜訊檢查。 此雜訊檢查只需要幾秒鐘的時間,您不需要在它期間說話。
  6. 如果偵測到雜訊,您可以再次選取 [ 檢查] 以重複雜訊檢查。 如果未偵測到雜訊,您可以選取 [完成 ] 繼續進行下一個步驟。 Screenshot of the noise check results when noise was detected.
  7. 檢閱錄製秘訣,然後選取 [取得]。 為了獲得最佳結果,請在錄製語音範例之前,移至無背景噪音的安靜區域。
  8. 按麥克風圖示以開始錄製。 Screenshot of the record sample dashboard.
  9. 按下停止圖示以停止錄製。
  10. 檢閱品質計量。 錄製每個範例之後,請先檢查其品質計量,再繼續進行下一個範例。
  11. 記錄更多範例。 雖然您可以建立只有 20 個範例的模型,但建議您記錄最多 50 個,以取得更好的品質。
  12. 選取 [定型模型 ] 以啟動定型程式。

定型程式大約需要一個計算小時。 您可以在 [檢閱模型] 頁面中檢查定型程序的進度。

檢閱模型

若要檢閱 CNV 精簡模型並聆聽您自己的合成語音,請遵循下列步驟:

  1. 選取 [自定義語音> 您的項目名稱 >檢閱模型]。 您可以在這裏檢閱語音模型名稱、模型語言、範例數據大小和定型進度。 語音名稱是由附加至項目名稱的「類神經」一詞所組成。
  2. 選取語音模型名稱以檢閱模型詳細資料,並聆聽樣本文字轉換語音結果。
  3. 選取播放圖示以聽到您的語音說出每個腳本。 Screenshot of the review sample output dashboard.

提交口頭陳述

語音人才錄製的口頭陳述是必要條件,您才能 為企業使用部署模型

若要提交語音人才口頭陳述,請遵循下列步驟:

  1. 選取 [自定義語音> 您的項目名稱>部署模型>管理您的語音人才]。 Screenshot of the record voice talent consent dashboard.
  2. 選取該模型。
  3. 輸入語音人才名稱和公司名稱。
  4. 讀取和記錄 語句。 選取麥克風圖示以開始錄製。 選取停止圖示以停止錄製。
  5. 選取 [ 提交 ] 以提交語句。
  6. 檢查儀錶板底部文本數據表中的處理狀態。 狀態為 [成功] 之後,您就可以 部署模型

部署模型

若要部署您的語音模型,並在應用程式中使用它,您必須取得自定義神經語音的完整存取權。 要求進入表單存取權。 在大約10個工作天內,您會收到具有核准狀態的電子郵件。 您也需要語音人才錄製的口頭陳述,才能為企業使用部署模型。

若要部署 CNV 精簡版模型,請遵循下列步驟:

  1. 選取 [自定義語音> 您的項目名稱>部署模型>部署模型]。
  2. 選取語音模型名稱,然後選取 [ 下一步]。
  3. 輸入端點的名稱和描述,然後選取 [ 下一步]。
  4. 選取複選框以同意使用規定,然後選取 [ 下一步]。
  5. 選取 [部署] 以部署模型。

您可以從這裡使用 CNV 精簡語音模型,就像使用 CNV 專業語音模型一樣。 例如,您可以在 建立端點之後暫停或繼續 端點,以限制花費並節省未使用的資源。 您也可以在 Speech Studio 的 音訊內容建立 工具 中存取語音。

下一步