Der kognitive Skill „Schlüsselbegriffserkennung“

Der Skill Schlüsselbegriffserkennung bewertet unstrukturierten Text und gibt für jeden Datensatz eine Liste mit Schlüsselbegriffen zurück. Bei diesem Skill werden die Machine Learning-Modelle für die Schlüsselbegriffserkennung verwendet, die von Azure Cognitive Services for Language bereitgestellt werden.

Diese Funktion ist nützlich, wenn Sie die wichtigsten Gesprächspunkte in dem Datensatz schnell identifizieren müssen. Zum Beispiel, wenn der eingegebene Text „Das Essen war köstlich, und es gab hervorragendes Personal“ lautet, gibt der Dienst „Essen“ und „hervorragendes Personal“ zurück.

Hinweis

Dieser Skill ist an Cognitive Services gebunden und erfordert eine abrechenbare Ressource für Transaktionen, die 20 Dokumente pro Indexer und Tag überschreiten. Die Ausführung integrierter Qualifikationen wird nach dem bestehenden nutzungsbasierten Preis für Cognitive Services berechnet.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

Datengrenzwerte

Die maximale Größe eines Datensatzes ist 50.000 Zeichen, gemessen durch String.Length. Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an die Schlüsselbegriffserkennung senden, denken Sie daran, den Skill „Text teilen“ zu verwenden.

Skillparameter

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.

Eingaben BESCHREIBUNG
defaultLanguageCode (Optional) Der Sprachcode, der auf Dokumente angewendet wird, in denen die Sprache nicht explizit angegeben ist. Wenn kein Standardsprachcode festgelegt ist, wird Englisch (en) als Standardsprachcode verwendet.
Siehe die vollständige Liste der unterstützten Sprachen.
maxKeyPhraseCount (Optional) Die maximale Anzahl der Schlüsselbegriffe, die erzeugt werden.
modelVersion (Optional) Gibt die Version des Modells an, die beim Aufruf der Schlüsselbegriffs-API verwendet wird. Wenn nichts angegeben ist, wird standardmäßig die neueste verfügbare Version verwendet. Es wird empfohlen, diesen Wert nur anzugeben, wenn es notwendig ist.

Skilleingaben

Eingabe BESCHREIBUNG
text Der zu analysierende Text
languageCode Eine Zeichenfolge, die die Sprache der Datensätze angibt. Wenn dieser Parameter nicht angegeben ist, wird der Standardsprachcode zur Analyse der Datensätze verwendet.
Siehe die vollständige Liste der unterstützten Sprachen.

Skillausgaben

Output BESCHREIBUNG
keyPhrases Eine Liste mit aus dem Eingabetext extrahierten Schlüsselausdrücken. Die Schlüsselausdrücke werden in der Reihenfolge ihrer Wichtigkeit zurückgegeben.

Beispieldefinition

Gehen Sie von einem SQL-Datensatz mit den folgenden Feldern aus:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

Ihre Skilldefinition sieht dann möglicherweise folgendermaßen aus:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Beispielausgabe

Im obigen Beispiel wird die Ausgabe Ihres Skills in einen neuen Knoten in der angereicherten Informationsstruktur namens „document/myKeyPhrases“ geschrieben, da dies der angegebene Wert für targetName ist. Wenn Sie keinen Wert für targetName angeben, wird „document/keyPhrases“ verwendet.

document/myKeyPhrases

            [
              "world’s glaciers", 
              "huge rivers of ice", 
              "Canadian Rockies", 
              "iconic landscapes",
              "Mount Everest region",
              "Continued warming"
            ]

Sie können „document/myKeyPhrase“ als Eingabe für andere Skills oder als Quelle für eine Ausgabefeldzuordnung verwenden.

Warnungen

Wenn Sie einen nicht unterstützte Sprachcode bereitstellen, wird eine Warnung generiert, und es werden keine Schlüsselbegriffe extrahiert. Wenn Ihr Text leer ist, wird eine Warnung angezeigt. Wenn Ihre Text mehr als 50.000 Zeichen umfasst, werden nur die ersten 50.000 Zeichen analysiert und eine Warnung ausgegeben.

Weitere Informationen