Kognitivní dovednost extrakce klíčových frází

Článek
11/15/2023

Dovednost extrakce klíčových frází vyhodnocuje nestrukturovaný text a pro každý záznam vrátí seznam klíčových frází. Tato dovednost využívá modely strojového učení klíčové fráze poskytované jazykem Azure AI.

Tato funkce je užitečná, pokud potřebujete rychle identifikovat hlavní body mluvení v záznamu. Například při zadání textu "Jídlo bylo vynikající a tam byl nádherný personál", služba vrátí "jídlo" a "nádherný personál".

Poznámka:

Tato dovednost je vázána na služby Azure AI a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

Omezení dat

Maximální velikost záznamu by měla být 50 000 znaků měřená String.Lengthhodnotou . Pokud potřebujete data před odesláním do extraktoru klíčových frází rozdělit, zvažte použití dovednosti Rozdělení textu. Pokud používáte dovednost rozdělení textu, nastavte délku stránky na 5 000 pro nejlepší výkon.

Parametry dovedností

Parametry rozlišují malá a velká písmena.

Vstupy	Popis
`defaultLanguageCode`	(Volitelné) Kód jazyka, který se použije u dokumentů, které explicitně nezadávají jazyk. Pokud není zadaný výchozí kód jazyka, použije se angličtina (en) jako výchozí kód jazyka. Projděte si kompletní seznam podporovaných jazyků.
`maxKeyPhraseCount`	(Volitelné) Maximální počet klíčových frází, které se mají vytvořit.
`modelVersion`	(Volitelné) Určuje verzi modelu, kterou se má použít při volání rozhraní API pro klíčové fráze. Výchozí hodnota je nejnovější dostupná, pokud není zadána. Tuto hodnotu doporučujeme nezadávat, pokud není nutná.

Vstupy dovedností

Vstup	Popis
`text`	Text, který se má analyzovat.
`languageCode`	Řetězec označující jazyk záznamů. Pokud tento parametr není zadaný, použije se k analýze záznamů výchozí kód jazyka. Projděte si kompletní seznam podporovaných jazyků.

Výstupy dovedností

Výstup	Popis
`keyPhrases`	Seznam klíčových frází extrahovaných ze vstupního textu Klíčové fráze se vrátí v pořadí podle důležitosti.

Ukázková definice

Představte si záznam SQL, který obsahuje následující pole:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

Definice dovedností pak může vypadat takto:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Ukázkový výstup

V předchozím příkladu se výstup vaší dovednosti zapíše do nového uzlu v rozšířeném stromu s názvem document/myKeyPhrases, protože je targetName to ten, který jsme zadali. Pokud neurčíte targetName, bude to "document/keyPhrases".

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

Jako vstup do jiných dovedností nebo jako zdroj mapování výstupního pole můžete použít "document/myKeyPhrases".

Upozornění

Pokud zadáte nepodporovaný kód jazyka, vygeneruje se upozornění a nezextrahují se klíčové fráze. Pokud je text prázdný, vytvoří se upozornění. Pokud je text větší než 50 000 znaků, analyzuje se pouze prvních 50 000 znaků a zobrazí se upozornění.