使用語言識別模型自動識別口說語言

重要

由於 Azure 媒體服務 淘汰公告,Azure AI 影片索引器會宣告 Azure AI 影片索引器功能調整。 請參閱 Azure 媒體服務 (AMS) 淘汰 的相關變更,以瞭解 Azure AI 影片索引器帳戶的意義。 請參閱準備AMS淘汰:VI更新和移轉指南

Azure AI 影片索引器支援自動語言識別 (LID),這是從音訊內容自動識別口語的程式。 媒體檔案會以主要識別語言進行轉譯。

請參閱支援語言的 Azure AI 影片索引器語言所支援的清單。

請務必檢閱 指導方針和限制 一節。

選擇索引的自動語言識別

使用 API 編製或 重新編製 影片索引時,請選擇 auto detect 參數中的 sourceLanguage 選項。

使用入口網站時,請移至 Azure AI 影片索引器首頁上的帳戶影片,並將滑鼠停留在您想要重新編製索引的影片名稱上。 在右下角,選取 [重新編制索引] 按鈕。 在 [重新編製影片索引] 對話框中,從 [視訊來源語言] 下拉式方塊中選擇 [自動偵測]。

顯示選取自動偵測位置的螢幕快照。

模型輸出

如果該語言的信心為 > 0.6,Azure AI 影片索引器會根據最有可能的語言轉譯影片。 如果無法以信賴方式識別語言,則會假設口語是英文。

模型主要語言可在深入解析 JSON 中使用,作為 sourceLanguage 屬性 (在 root/videos/insights 下)。 屬性下 sourceLanguageConfidence 也提供對應的信賴分數。

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

指導方針與限制

自動語言識別 (LID) 支援下列語言:

請參閱支援語言的 Azure AI 影片索引器語言所支援的清單。

  • 如果音訊包含支援清單以外的語言,結果會非預期。
  • 如果 Azure AI 影片索引器無法識別具有足夠信賴度的語言(大於 0.6),後援語言為英文。
  • 目前不支援具有混合語言音訊的檔案。 如果音訊包含混合語言,結果會非預期。
  • 低品質音訊可能會影響模型結果。
  • 模型在音訊中至少需要一分鐘的語音。
  • 此模型的設計目的是要辨識自發的對話語音(不是語音命令、唱歌等等)。