Extrahieren von Schlüsselbegriffen aus Text

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Extrahiert Schlüsselbegriffe aus dem angegebenen Text.

Kategorie: Textanalyse

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird erläutert, wie Sie das Modul Extrahieren von Schlüsselbegriffen aus Text in Machine Learning Studio (klassisch) verwenden, um eine Textspalte vorab zu verarbeiten. Bei einer Spalte mit Text in natürlicher Sprache extrahiert das Modul einen oder mehrere aussagekräftige Ausdrücke. Ein Ausdruck kann ein einzelnes Wort, ein zusammengesetztes Nomen oder ein Modifizierer plus ein Nomen sein.

Dieses Modul ist ein Wrapper für die Verarbeitung von APIs für die Verarbeitung natürlicher Sprache für die Schlüsselbegriffsextraktion. Die Ausdrücke werden im Kontext des Satzes aus verschiedenen Gründen als potenziell aussagekräftig analysiert:

  • Der Ausdruck erfasst das Thema des Satzes.
  • Der Ausdruck enthält eine Kombination aus Modifizierer und Nomen, die die Stimmung angibt.

Angenommen, der analysierte Satz ist: "Es war ein großartiges Hotel, in dem Sie bleiben können, mit einzigartiger Freundlichkeit und benutzerfreundlichen Mitarbeitern."

Das Modul Extract Key Phrases from Text (Schlüsselbegriffe aus Text extrahieren) gibt möglicherweise die folgenden Schlüsselbegriffe zurück:

  • Hotel "Hotel"
  • freundliche Mitarbeiter
  • einzigartige Kulm

Konfigurieren des Extrahierens von Schlüsselbegriffen aus Text

Um Schlüsselbegriffe zu extrahieren, müssen Sie ein Dataset verbinden, das eine Textspalte enthält.

  1. Fügen Sie ihrem Experiment in Machine Learning Studio (klassisch) das Modul Extract Key Phrases from Text (Schlüsselbegriffe aus Text extrahieren) hinzu. Verbinden Sie dann ein Dataset mit mindestens einer Volltextspalte.

  2. Verwenden Sie die Spaltenauswahl, um eine Spalte vom Typ Zeichenfolge auszuwählen, aus der Schlüsselbegriffe extrahiert werden.

  3. Wählen Sie unter Sprache eine Sprache aus, die beim Analysieren von Ausdrücken verwendet werden soll. Wenn Sie eine Sprache angeben, werden nur Ausdrücke in der Zielsprache ausgegeben.

  4. Wenn die Textspalte Ausdrücke in mehreren Sprachen enthält, wählen Sie die Option In Spalten identifizierte Sprache aus. Es wird eine neue Spaltenauswahl angezeigt, mit der Sie eine Spalte in Ihrem DataSet auswählen können, die einen Sprachbezeichner enthält. Der Sprachbezeichner kann entweder der Sprachname oder der Iso6391-Kulturbezeichner sein. Beispielsweise sind entweder "Englisch" oder "en" akzeptabel.

    Tipp

    Bevor Sie Schlüsselbegriffe aus Text extrahieren ausführen, verwenden Sie das Modul Sprachen erkennen, um die Sprache in jeder Zeile zu identifizieren und den Bezeichner für Sie zu generieren. Ein Fehler wird ausgelöst, wenn die Sprachbezeichnerspalte Sprachen enthält, die nicht von Extract Key Phrases from Text (Schlüsselbegriffe aus Text extrahieren) unterstützt werden.

Ergebnisse

Die Ausgabe des Moduls ist ein Dataset, das eine Spalte mit durch Komma getrennten Schlüsselbegriffen enthält.

Die folgenden Beispielergebnisse gelten beispielsweise für ein Eingabe-Dataset, das Überprüfungen in mehreren Sprachen enthält:

Stichworten
"story", "good book", "adventure story", "story of events", "good characters"
primerlaserio,personiereres,fan,aventura,isla
  • Alle Ausgabeaussätze sind in einer einzelnen Spalte enthalten. es werden keine anderen Spalten übergeben, und es wird kein Bezeichner hinzugefügt. Wenn Sie die Ausgabephrasen jedoch mit dem Quelltext ausrichten möchten, können Sie die Ausgabephrasen mit der Eingabe mithilfe des Moduls Spalten hinzufügen neu erstellen.

  • Die Ausgabe der Schlüsselbegriffsextraktion kennzeichnet nicht die Sprache einzelner Ausdrücke.

  • Wenn eine Sprache enthalten ist, die vom Modul Schlüsselbegriffe extrahieren nicht unterstützt wird, wird ein Fehler ausgelöst (0039). Um Fehler zu vermeiden, achten Sie darauf, Eingabetext herausfiltern, der über einen inkompatiblen Sprachbezeichner verfügt.

    Wenn nur wenige Zeilen anderer Sprachen vorhanden sind, können Sie den Fehler auch vermeiden, indem Sie den Sprachbezeichner weglassen und den text mit einer einzigen Sprachauswahl analysieren. Wenn Sie dies tun, sind die Ergebnisse jedoch sehr schlecht, da ganze Sätze in den anderen Sprachen möglicherweise als einzelner Schlüsselaussatz ausgegeben werden.

Beispiele

Im folgenden Beispiel wird veranschaulicht, wie Sie dieses Modul verwenden, um Schlüsselbegriffe zu extrahieren und dann eine Wortwolke aus den Ausdrücken zu erstellen: Extrahieren von Schlüsselbegriffen und Anzeigen der Wortwolke

Weitere Beispiele für Azure KI-Katalog Textverarbeitung mithilfe von Machine Learning.

Technische Hinweise

Dieses Modul unterstützt derzeit die folgenden Sprachen:

  • Niederländisch
  • Englisch
  • Französisch
  • Deutsch
  • Italienisch
  • Spanisch

Für weitere Sprachen sollten Sie die Textanalyse-API in Azure Cognitive Services. Weitere Informationen finden Sie unter Extrahieren von Schlüsselbegriffen in Textanalyse

Erwartete Eingaben

Name Type Beschreibung
Dataset Datentabelle Die Tabelle, die den zu verarbeitenden Text enthält.

Modulparameter

Name Typ Range Optional Standard Beschreibung
Spalte "Kultursprache" ColumnSelection language:Column contains language Name oder ein basierter Index der Spalte, die die Kulturspracheninformationen enthält
Textspalte ColumnSelection Erforderlich Name oder ein basierter Index der Textspalte.
Sprache T_Language Englisch, Spanisch, Französisch, Niederländisch, Deutsch, Italienisch, Spalte enthält Sprache Erforderlich Englisch Wählen Sie die Sprache des zu verarbeitenden Texts aus.

Ausgaben

Name Type Beschreibung
Ergebnisdataset Datentabelle Die extrahierten Schlüsselbegriffe

Ausnahmen

Ausnahme Beschreibung
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0010 Eine Ausnahme tritt auf, wenn Eingabedatasets übereinstimmende Spaltennamen aufweisen sollten, dies aber nicht der Fall ist.
Fehler 0016 Eine Ausnahme tritt auf, wenn an das Modul übergebene Eingabedatasets kompatible Spaltentypen aufweisen sollten, dies aber nicht der Fall ist.
Fehler 0008 Eine Ausnahme tritt auf, wenn der Parameter nicht im Bereich liegt.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.

Siehe auch

Textanalyse
Modulliste von A bis Z