使用語言識別模型自動識別口說語言
重要
由於 Azure 媒體服務 淘汰公告,Azure AI 影片索引器會宣告 Azure AI 影片索引器功能調整。 請參閱 Azure 媒體服務 (AMS) 淘汰 的相關變更,以瞭解 Azure AI 影片索引器帳戶的意義。 請參閱準備AMS淘汰:VI更新和移轉指南。
Azure AI 影片索引器支援自動語言識別 (LID),這是從音訊內容自動識別口語的程式。 媒體檔案會以主要識別語言進行轉譯。
請參閱支援語言的 Azure AI 影片索引器語言所支援的清單。
請務必檢閱 指導方針和限制 一節。
選擇索引的自動語言識別
使用 API 編製或 重新編製 影片索引時,請選擇 auto detect
參數中的 sourceLanguage
選項。
使用入口網站時,請移至 Azure AI 影片索引器首頁上的帳戶影片,並將滑鼠停留在您想要重新編製索引的影片名稱上。 在右下角,選取 [重新編制索引] 按鈕。 在 [重新編製影片索引] 對話框中,從 [視訊來源語言] 下拉式方塊中選擇 [自動偵測]。
模型輸出
如果該語言的信心為 > 0.6
,Azure AI 影片索引器會根據最有可能的語言轉譯影片。 如果無法以信賴方式識別語言,則會假設口語是英文。
模型主要語言可在深入解析 JSON 中使用,作為 sourceLanguage
屬性 (在 root/videos/insights 下)。 屬性下 sourceLanguageConfidence
也提供對應的信賴分數。
"insights": {
"version": "1.0.0.0",
"duration": "0:05:30.902",
"sourceLanguage": "fr-FR",
"language": "fr-FR",
"transcript": [...],
. . .
"sourceLanguageConfidence": 0.8563
}
指導方針與限制
自動語言識別 (LID) 支援下列語言:
請參閱支援語言的 Azure AI 影片索引器語言所支援的清單。
- 如果音訊包含支援清單以外的語言,結果會非預期。
- 如果 Azure AI 影片索引器無法識別具有足夠信賴度的語言(大於 0.6),後援語言為英文。
- 目前不支援具有混合語言音訊的檔案。 如果音訊包含混合語言,結果會非預期。
- 低品質音訊可能會影響模型結果。
- 模型在音訊中至少需要一分鐘的語音。
- 此模型的設計目的是要辨識自發的對話語音(不是語音命令、唱歌等等)。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應