關鍵片語擷取認知技能

關鍵片語擷 技能會評估非結構化文字,並針對每個記錄傳回關鍵片語清單。 此技能使用 Azure AI 語言所提供的關鍵片語機器學習模型。

如果您需要快速識別記錄中的主要交談點,這項功能就很有用。 例如,假設輸入文字「食物很美味,而且有精彩的員工」,服務會傳回「食物」和「美妙的員工」。

注意

此技能會系結至 Azure AI 服務,而且需要 每天超過每個索引器 20 份檔的計費資源 。 內建技能的執行會以現有的 Azure AI 服務隨用隨付價格收費。

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

資料限制

記錄的大小上限應為50,000個字元,如所 String.Length測量。 如果您需要在將數據傳送至關鍵片語擷取器之前中斷數據,請考慮使用 文字分割技能。 如果您使用文字分割技能,請將頁面長度設定為 5000 以獲得最佳效能。

技能參數

參數會區分大小寫。

輸入 描述
defaultLanguageCode (選擇性)要套用至未明確指定語言的文件的語言代碼。 如果未指定預設語言代碼,則會使用英文 (en) 作為預設語言代碼。
查看支援語言的完整清單。
maxKeyPhraseCount (選擇性)要產生的主要片語數目上限。
modelVersion (選擇性)指定 呼叫關鍵片語 API 時要使用的模型 版本。 它預設為未指定時的最新可用。 除非有必要,否則建議您不要指定此值。

技能輸入

輸入 描述
text 要分析的文字。
languageCode 字串,表示記錄的語言。 如果未指定此參數,則會使用預設語言程式代碼來分析記錄。
查看支援語言的完整清單。

技能輸出

輸出 描述
keyPhrases 從輸入文字擷取的關鍵片語清單。 關鍵片語會依重要性順序傳回。

範例定義

請考慮具有下列欄位的 SQL 記錄:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

然後您的技能定義可能如下所示:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

範例輸出

針對上述範例,技能的輸出會寫入擴充樹狀結構中名為 「document/myKeyPhrases」 的新節點,因為這是 targetName 我們指定的 。 如果您未指定 targetName,則會是 “document/keyPhrases”。

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

您可以使用 「document/myKeyPhrases」 作為其他技能的 輸入,或做為輸出字段對應的來源。

警告

如果您提供不支援的語言代碼,則會產生警告,而且不會擷取關鍵片語。 如果您的文字是空的,就會產生警告。 如果您的文字大於 50,000 個字元,則只會分析前 50,000 個字元,併發出警告。

另請參閱