Der kognitive Skill „Schlüsselbegriffserkennung“Key Phrase Extraction cognitive skill

Der Skill Schlüsselbegriffserkennung bewertet unstrukturierten Text und gibt für jeden Datensatz eine Liste mit Schlüsselbegriffen zurück.The Key Phrase Extraction skill evaluates unstructured text, and for each record, returns a list of key phrases. Bei dieser Qualifikation werden die Machine Learning-Modelle verwendet, die in Cognitive Services über die Textanalyse bereitgestellt werden.This skill uses the machine learning models provided by Text Analytics in Cognitive Services.

Diese Funktion ist nützlich, wenn Sie die wichtigsten Gesprächspunkte in dem Datensatz schnell identifizieren müssen.This capability is useful if you need to quickly identify the main talking points in the record. Zum Beispiel, wenn der eingegebene Text „Das Essen war köstlich, und es gab hervorragendes Personal“ lautet, gibt der Dienst „Essen“ und „hervorragendes Personal“ zurück.For example, given input text "The food was delicious and there were wonderful staff", the service returns "food" and "wonderful staff".

Hinweis

Wenn Sie den Umfang erweitern, indem Sie die Verarbeitungsfrequenz erhöhen oder weitere Dokumente oder KI-Algorithmen hinzufügen, müssen Sie eine kostenpflichtige Cognitive Services-Ressource anfügen.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. Gebühren fallen beim Aufrufen von APIs in Cognitive Services sowie für die Bildextraktion im Rahmen der Dokumentaufschlüsselungsphase in Azure Search an.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Search. Für die Textextraktion aus Dokumenten fallen keine Gebühren an.There are no charges for text extraction from documents.

Die Ausführung integrierter Qualifikationen wird nach dem bestehenden nutzungsbasierten Preis für Cognitive Services berechnet.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. Die Preise für die Bildextraktion werden auf der Preisseite von Azure Search beschrieben.Image extraction pricing is described on the Azure Search pricing page.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkillMicrosoft.Skills.Text.KeyPhraseExtractionSkill

DatengrenzwerteData limits

Die maximale Größe eines Datensatzes ist 50.000 Zeichen, gemessen durch String.Length.The maximum size of a record should be 50,000 characters as measured by String.Length. Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an die Schlüsselbegriffserkennung senden, denken Sie daran, den Skill „Text teilen“ zu verwenden.If you need to break up your data before sending it to the key phrase extractor, consider using the Text Split skill.

SkillparameterSkill parameters

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.Parameters are case-sensitive.

EingabenInputs BESCHREIBUNGDescription
defaultLanguageCodedefaultLanguageCode (Optional) Der Sprachcode, der auf Dokumente angewendet wird, in denen die Sprache nicht explizit angegeben ist.(Optional) The language code to apply to documents that don't specify language explicitly. Wenn kein Standardsprachcode festgelegt ist, wird Englisch (en) als Standardsprachcode verwendet.If the default language code is not specified, English (en) will be used as the default language code.
Siehe die vollständige Liste der unterstützten Sprachen.See Full list of supported languages.
maxKeyPhraseCountmaxKeyPhraseCount (Optional) Die maximale Anzahl der Schlüsselbegriffe, die erzeugt werden.(Optional) The maximum number of key phrases to produce.

SkilleingabenSkill inputs

EingabenInputs BESCHREIBUNGDescription
texttext Der zu analysierende TextThe text to be analyzed.
languageCodelanguageCode Eine Zeichenfolge, die die Sprache der Datensätze angibt.A string indicating the language of the records. Wenn dieser Parameter nicht angegeben ist, wird der Standardsprachcode zur Analyse der Datensätze verwendet.If this parameter is not specified, the default language code will be used to analyze the records.
Siehe die vollständige Liste der unterstützten Sprachen.See Full list of supported languages

BeispieldefinitionSample definition

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "languageCode",
        "source": "/document/languagecode" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

BeispieleingabeSample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
             "language": "en"
           }
      }
    ]

BeispielausgabeSample output

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
            "keyPhrases": 
            [
              "world’s glaciers", 
              "huge rivers of ice", 
              "Canadian Rockies", 
              "iconic landscapes",
              "Mount Everest region",
              "Continued warming"
            ]
           }
      }
    ]
}

Fehler und WarnungenErrors and warnings

Wenn Sie einen nicht unterstützte Sprachcode bereitstellen, tritt ein Fehler auf, und es werden keine Schlüsselbegriffe extrahiert.If you provide an unsupported language code, an error is generated and key phrases are not extracted. Wenn Ihr Text leer ist, wird eine Warnung angezeigt.If your text is empty, a warning will be produced. Wenn Ihre Text mehr als 50.000 Zeichen umfasst, werden nur die ersten 50.000 Zeichen analysiert und eine Warnung ausgegeben.If your text is larger than 50,000 characters, only the first 50,000 characters will be analyzed and a warning will be issued.

Weitere InformationenSee also