KonstituentenanalyseConstituency Parsing

Wichtig

Die Vorschauversion für die linguistische Analyse wurde am 9. August 2018 außer Betrieb genommen.The Linguistic Analysis preview was decommissioned on August 9, 2018. Es wird empfohlen, Azure Machine Learning-Textanalysemodule für die Textverarbeitung und -analyse zu verwenden.We recommend using Azure Machine Learning text analytics modules for text processing and analysis.

Erfahren Sie, wie mit der Konstituentenanalyse (auch als „Phrasenstrukturanalyse“ bezeichnet) die Ausdrücke im Text identifiziert werden.The goal of constituency parsing (also known as "phrase structure parsing") is to identify the phrases in the text. Dies kann beim Extrahieren von Informationen aus Texten nützlich sein.This can be useful when extracting information from text. Kunden sollten nach in einem großen Textkörper Funktionsnamen oder Schlüsselphrasen suchen und die Modifizierer und Aktionen untersuchen, die diese einzelnen Phrasen umgeben.Customers might want to find feature names or key phrases from a big body of text, and to see the modifiers and actions surrounding each such phrase.

PhrasenPhrases

Für einen Linguisten stellt eine Phrase mehr als nur eine Abfolge von Wörtern dar.To a linguist, a phrase is more than just a sequence of words. Eine Phrase besteht aus einer Gruppe von Wörtern und spielt eine bestimmte Rolle im Satz.To be a phrase, a group of words has to come together to play a specific role in the sentence. Diese Wortgruppe kann zusammengesetzt oder vollständig ersetzt werden, und der Satz sollte trotzdem flüssig und grammatikalisch korrekt bleiben.That group of words can be moved together or replaced as a whole, and the sentence should remain fluent and grammatical.

Sehen Sie sich den folgenden Satz an:Consider the sentence

I want to find a new hybrid automobile with Bluetooth. (Ich suche ein neues Hybridauto mit Bluetooth-Funktionalität.)I want to find a new hybrid automobile with Bluetooth.

Dieser Satz enthält die Nominalphrase: „a new hybrid automobile with Bluetooth“ (ein neues Hybridauto mit Bluetooth-Funktionalität).This sentence contains the noun phrase: "a new hybrid automobile with Bluetooth". Wodurch zeichnet sich diese Phrase aus?How do we know that this is a phrase? Der Satz kann (wenn auch etwas poetisch anmutend) umgeschrieben werden, indem die gesamte Phrase an den Anfang verschoben wird:We can rewrite the sentence (somewhat poetically) by moving that whole phrase to the front:

A new hybrid automobile with Bluetooth I want to find. (Ein neues Hybridauto mit Bluetooth-Funktionalität suche ich.)A new hybrid automobile with Bluetooth I want to find.

Alternativ kann diese Phrase durch eine Phrase mit ähnlicher Funktion und Bedeutung ersetzt werden, z.B. durch „a fancy new car“ (ein schickes, neues Auto):Or we could replace that phrase with a phrase of similar function and meaning, like "a fancy new car":

I want to find a fancy new car. (Ich suche ein schickes neues Auto.)I want to find a fancy new car.

Würde stattdessen eine andere Untergruppe von Wörtern ersetzt werden, kämen ungewöhnliche oder unverständliche Sätze zustande.If instead we picked different subset of words, these replacement tasks would lead to strange or unreadable sentences. Werfen wir einen Blick darauf, was geschieht, wenn der Teil „find a new“ (ein neues suchen) an den Anfang verschoben wird:Consider what happens when we move "find a new" to the front:

Find a new I want to hybrid automobile with Bluetooth. (Ein neues suchen ich nach einem Hybridauto mit Bluetooth-Funktionalität.)Find a new I want to hybrid automobile with Bluetooth.

Das Ergebnis: Ein sehr sperriger und unverständlicher Satz.The results is very difficult to read and understand.

Das Ziel eines Parsers besteht darin, alle diese Phrasen ausfindig zu machen.The goal of a parser is to find all such phrases. Interessanterweise sind die Phrasen in der natürlichen Sprache oftmals ineinander geschachtelt.Interestingly, in natural language, the phrases tend to be nested inside one another. Eine natürliche Darstellung dieser Phrasen ist eine Struktur wie etwa im folgenden Beispiel:A natural representation of these phrases is a tree, such as the following:

Struktur

In dieser Struktur handelt es sich bei den mit „NP“ gekennzeichneten Verzweigungen um Nominalphrasen.In this tree, the branches marked "NP" are noun phrases. Von diesen Phrasen gibt es mehrere: I (ich), a new hybrid automobile (ein neues Hybridauto), Bluetooth (Bluetooth-Funktionalität) und a new hybrid automobile with Bluetooth (ein neues Hybridauto mit Bluetooth-Funktionalität).There are several such phrases: I, a new hybrid automobile, Bluetooth, and a new hybrid automobile with Bluetooth.

Arten von PhrasenPhrase Types

BezeichnungLabel BESCHREIBUNGDescription BeispielExample
ADJPADJP AdjektivphraseAdjective Phrase „so rude“"so rude"
ADVPADVP AdverbialphraseAdverb Phrase „clear through“"clear through"
CONJPCONJP KonjunktionalphraseConjunction Phrase „as well as“"as well as"
FRAGFRAG Fragment, das für unvollständige oder lückenhafte Eingaben verwendet wirdFragment, used for incomplete or fragmentary inputs „Highly recommended...“"Highly recommended..."
INTJINTJ Interjection, AusrufInterjection „Hooray“"Hooray"
LSTLST Listenmarkierung, einschließlich InterpunktionList marker, including punctuation „#4)“"#4)"
NACNAC Not A Constituent, kein Konstituent: Wird verwendet, um die Eingrenzung einer nicht konstituierenden Phrase anzugebenNot A Constituent, used to indicate scoping of a non-constituent phrase „and for a good deal“ in „you get things and for a good deal“"and for a good deal" in "you get things and for a good deal"
NPNP NominalphraseNoun Phrase „a tasty potato pancake“"a tasty potato pancake"
NXNX Wird in bestimmten komplexen NPs verwendet, um den Hauptteil zu kennzeichnenUsed within certain complex NPs to mark the head
PPPP PräpositionalphrasePrepositional Phrase „in the pool“"in the pool"
PRNPRN Parenthetical, EinklammerungParenthetical „(so called)“"(so called)"
PRTPRT PartikelParticle „out“ in „ripped out“"out" in "ripped out"
QPQP Quantity Phrase, Mengenausdruck (z.B. komplexe/r Maßeinheit/Betrag) in einer NominalphraseQuantity Phrase (i.e., complex measure/amount) within a Noun Phrase „around $75“"around $75"
RRCRRC Reduced Relative Clause, verkürzter RelativsatzReduced Relative Clause. „still unresolved“ in „many issues still unresolved“"still unresolved" in "many issues still unresolved"
SS SatzSentence or clause. „This is a sentence.“"This is a sentence."
SBARSBAR Subordinate Clause, Nebensatz: Wird häufig durch eine subordinierende Konjunktion eingeleitet.Subordinate clause, often introduced by a subordinating conjunction „as I left“ in „I looked around as I left.“"as I left" in "I looked around as I left."
SBARQSBARQ Direkte Frage, die durch ein W-Wort oder eine W-Phrase eingeleitet wirdDirect question introduced by a wh-word or -phrase „What was the point?“"What was the point?"
SINVSINV Inverted Declarative Sentence, Ausagesatz in umgekehrter ReihenfolgeInverted declarative sentence „At no time were they aware.“"At no time were they aware." (Beachten Sie, dass das Subjekt „they“ hinter das Verb „were“ verschoben wurde.)(note how the normal subject "they" was moved to after the verb "were")
SQSQ Ja/Nein-Frage in umgekehrter Reihenfolge oder Hauptsatz einer W-FrageInverted yes/no question, or main clause of a wh- question „Did they get the car?“"Did they get the car?"
UCPUCP Unlike Coordinated Phrase, ungleichartige koordinierte PhraseUnlike Coordinated Phrase „small and with bugs“ (Beachten Sie, dass eine Adjektiv- und eine Präpositionalphrase durch ein „and“ verbunden werden.)"small and with bugs" (note how an adjective and a preposition phrase are conjoined with "and")
VPVP VerbalphraseVerb Phrase „ran into the woods“"ran into the woods"
WHADJPWHADJP Wh-Adjective Phrase, Adjektivphrase mit W-WortWh-adjective Phrase „how uncomfortable“"how uncomfortable"
WHADVPWHADVP Wh-Adverb Phrase, Adverbialphrase mit W-WortWh-adverb Phrase „when“"when"
WHNPWHNP Wh-Noun Phrase, Nominalphrase mit W-WortWh-noun Phrase „which potato“, „how much soup“"which potato", "how much soup"
WHPPWHPP Wh-Prepositional Phrase, Präpositionalphrase mit W-WortWh-prepositional Phrase „in which country“"in which country"
XX Unbekannt, nicht eindeutig oder nicht einklammerbar.Unknown, uncertain, or unbracketable. Das erste „the“ in „the... the soup“first "the" in "the... the soup"

SpezifikationSpecification

Bei den hier aufgeführten Strukturen werden S-Phrasen aus der Penn Treebank verwendet.Trees here use the S-expressions from the Penn Treebank.