使用語言識別模型自動識別口說語言

發行項
03/23/2024

重要

由於 Azure 媒體服務淘汰公告，Azure AI 影片索引器會宣告 Azure AI 影片索引器功能調整。請參閱 Azure 媒體服務（AMS）淘汰的相關變更，以瞭解 Azure AI 影片索引器帳戶的意義。請參閱準備AMS淘汰：VI更新和移轉指南。

Azure AI 影片索引器支援自動語言識別（LID），這是從音訊內容自動識別口語的程式。媒體檔案會以主要識別語言進行轉譯。

請參閱支援語言的 Azure AI 影片索引器語言所支援的清單。

請務必檢閱指導方針和限制一節。

選擇索引的自動語言識別

使用 API 編製或重新編製影片索引時，請選擇 auto detect 參數中的 sourceLanguage 選項。

使用入口網站時，請移至 Azure AI 影片索引器首頁上的帳戶影片，並將滑鼠停留在您想要重新編製索引的影片名稱上。在右下角，選取 [重新編制索引] 按鈕。在 [重新編製影片索引] 對話框中，從 [視訊來源語言] 下拉式方塊中選擇 [自動偵測]。

顯示選取自動偵測位置的螢幕快照。

模型輸出

如果該語言的信心為 > 0.6，Azure AI 影片索引器會根據最有可能的語言轉譯影片。如果無法以信賴方式識別語言，則會假設口語是英文。

模型主要語言可在深入解析 JSON 中使用，作為 sourceLanguage 屬性（在 root/videos/insights 下）。屬性下 sourceLanguageConfidence 也提供對應的信賴分數。

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

指導方針與限制

自動語言識別（LID）支援下列語言：