Extrahieren von Daten mit EntitätenExtract data with entities

Eine Entität extrahiert zur Vorhersagelaufzeit Daten aus einer Benutzeräußerung.An entity extracts data from a user utterance at prediction runtime. Ein optionaler sekundärer Zweck besteht darin, die Vorhersage der Absicht oder anderer Entitäten zu verstärken, indem die Entität als Feature verwendet wird.An optional, secondary purpose is to boost the prediction of the intent or other entities by using the entity as a feature.

Es gibt mehrere Arten von Entitäten:There are several types of entities:

  • Durch maschinelles Lernen erworbene Entität: Hierbei handelt es sich um die primäre Entität.machine-learning entity - this is the primary entity. Sie sollten Ihr Schema mit diesem Entitätstyp entwerfen, bevor Sie andere Entitäten verwenden.You should design your schema with this entity type before using other entities.
  • Nicht durch maschinelles Lernen erworbene, als erforderliches Feature verwendete Entität: für exakte Textübereinstimmungen, Musterübereinstimmungen oder die Erkennung durch vordefinierte EntitätenNon-machine-learning used as a required feature - for exact text matches, pattern matches, or detection by prebuilt entities
  • Pattern.any: zum Extrahieren von Freiformtext (beispielsweise Buchtitel) aus einem MusterPattern.any - to extract free-form text such as book titles from a Pattern

Durch maschinelles Lernen erworbene Entitäten verfügen über die größte Auswahl an Optionen für die Datenextraktion.machine-learning entities provide the widest range of data extraction choices. Nicht durch maschinelles Lernen erworbene Entitäten basieren auf einem Textabgleich und werden als erforderliches Feature für eine durch maschinelles Lernen erworbene Entität oder für eine Absicht verwendet.Non-machine-learning entities work by text matching and are used as a required feature for a machine-learning entity or intent.

Darstellen von Daten durch EntitätenEntities represent data

Entitäten sind Daten, die Sie aus der Äußerung extrahieren möchten, z. B. Namen, Datumsangaben, Produktnamen oder signifikante Wortgruppen.Entities are data you want to pull from the utterance, such as names, dates, product names, or any significant group of words. Eine Äußerung kann viele Entitäten oder auch überhaupt keine enthalten.An utterance can include many entities or none at all. Eine Clientanwendung benötigt die Daten eventuell, um die jeweilige Aufgabe auszuführen.A client application may need the data to perform its task.

Entitäten müssen für alle Trainingsäußerungen jeder Absicht eines Modells bezeichnet werden.Entities need to be labeled consistently across all training utterances for each intent in a model.

Sie können eigene Entitäten definieren oder vorgefertigte Entitäten verwenden, um für gängige Konzepte, z. B. datetimeV2, ordinal, email und phone number, Zeit zu sparen.You can define your own entities or use prebuilt entities to save time for common concepts such as datetimeV2, ordinal, email, and phone number.

ÄußerungUtterance EntitätEntity DatenData
Kaufe 3 Tickets nach New YorkBuy 3 tickets to New York Vordefinierte AnzahlPrebuilt number
DestinationDestination
33
New YorkNew York

Absichten sind im Gegensatz zu Entitäten erforderlich.While intents are required, entities are optional. Entitäten müssen nicht für jedes Konzept in der App erstellt werden, sondern nur für jene, bei denen die Clientanwendung die Daten benötigt oder bei denen die Entität als Hinweis oder Signal für eine andere Entität oder Absicht fungiert.You do not need to create entities for every concept in your app, but only for those where the client application needs the data or the entity acts as a hint or signal to another entity or intent.

Wenn Ihre Anwendung weiterentwickelt wird und sich neue Datenanforderungen ergeben, können Sie Ihrem LUIS-Modell auch später noch weitere geeignete Entitäten hinzufügen.As your application develops and a new need for data is identified, you can add appropriate entities to your LUIS model later.

Entität stellt Datenextraktion darEntity represents data extraction

Die Entität stellt ein Datenkonzept innerhalb der Äußerung dar.The entity represents a data concept inside the utterance. Eine Absicht klassifiziert die gesamte Äußerung.An intent classifies the entire utterance.

Sehen Sie sich die folgenden vier Äußerungen an:Consider the following four utterances:

ÄußerungUtterance Vorhergesagte AbsichtIntent predicted Extrahierte EntitätenEntities extracted ErklärungExplanation
HilfeHelp helphelp - Nichts zu extrahieren.Nothing to extract.
Send somethingSend something sendSomethingsendSomething - Nichts zu extrahieren.Nothing to extract. Das Modell verfügt über kein erforderliches Feature, um something in diesem Kontext zu extrahieren, und es ist kein Empfänger angegeben.The model does not have a required feature to extract something in this context, and there is no recipient stated.
Send Bob a presentSend Bob a present sendSomethingsendSomething Bob, presentBob, present Das Modell extrahiert Bob durch Hinzufügen eines erforderlichen Features der vorgefertigten Entität personName.The model extracts Bob by adding a required feature of prebuilt entity personName. Eine durch maschinelles Lernen erworbene Entität wurde genutzt, um present zu extrahieren.A machine-learning entity has been used to extract present.
Send Bob a box of chocolatesSend Bob a box of chocolates sendSomethingsendSomething Bob, box of chocolatesBob, box of chocolates Die beiden wichtigen Datenelemente Bob und box of chocolates wurden von durch maschinelles Lernen erworbenen Entitäten extrahiert.The two important pieces of data, Bob and the box of chocolates, have been extracted by machine-learning entities.

Entitäten in allen Absichten bezeichnenLabel entities in all intents

Entitäten extrahieren Daten unabhängig von der vorhergesagten Absicht.Entities extract data regardless of the predicted intent. Stellen Sie sicher, dass Sie alle Beispieläußerungen in allen Absichten bezeichnen.Make sure you label all example utterances in all intents. Die None-Absicht mit fehlender Entitätsbezeichnung verursacht Verwirrung, auch wenn es weitaus mehr Trainingsäußerungen für die anderen Absichten gäbe.The None intent missing entity labeling causes confusion even if there were far more training utterances for the other intents.

Entwerfen von Entitäten zur AnalyseDesign entities for decomposition

Durch maschinelles Lernen erworbene Entitäten ermöglichen es Ihnen, das App-Schema so zu gestalten, dass sich ein umfangreiches Konzept in untergeordnete Entitäten aufteilen lässt.machine-learning entities allow you to design your app schema for decomposition, breaking a large concept into subentities.

Der Entwurf für die Analyse bietet LUIS eine genauere Aufschlüsselung der Entitäten für Ihre Clientanwendung.Designing for decomposition allows LUIS to return a deep degree of entity resolution to your client application. Hierdurch kann sich die Clientanwendung auf Geschäftsregeln konzentrieren und die Datenauflösung LUIS überlassen.This allows your client application to focus on business rules and leave data resolution to LUIS.

Eine durch maschinelles Lernen erworbene Entität wird basierend auf dem Kontext ausgelöst, der durch Beispieläußerungen erlernt wird.A machine-learning entity triggers based on the context learned through example utterances.

Durch maschinelles Lernen erworbene Entitäten sind die Extraktoren auf oberster Ebene.machine-learning entities are the top-level extractors. Bei untergeordneten Entitäten handelt es sich um untergeordnete Elemente von durch maschinelles Lernen erworbenen Entitäten.Subentities are child entities of machine-learning entities.

Effektive durch maschinelles Lernen erworbene EntitätenEffective machine learned entities

So erstellen Sie durch maschinelles Lernen erworbene Entitäten effektiv:To build the machine learned entities effectively:

  • Ihre Bezeichnungen sollten für alle Absichten einheitlich sein.Your labeling should be consistent across the intents. Dazu gehören auch Äußerungen, die Sie in der Absicht None (Keine) angeben, die diese Entität enthält.This includes even utterances you provide in the None intent that include this entity. Andernfalls kann das Modell die Sequenz nicht effektiv bestimmen.Otherwise the model will not be able to determine the sequences effectively.
  • Wenn Sie eine durch maschinelles Lernen erworbene Entität mit untergeordneten Entitäten besitzen, sollten Sie sicherstellen, dass die verschiedenen Reihenfolgen und Varianten der Entität und der untergeordneten Entitäten in dem bezeichneten Äußerungen dargestellt werden.If you have a machine learned entity with subentities, make sure that the different orders and variants of the entity and subentities are presented in the labeled utterances. Beispieläußerungen mit Bezeichnungen sollten alle gültigen Formen sowie die Entitäten enthalten, die angezeigt werden, fehlen oder innerhalb der Äußerung neu angeordnet werden.Labeled example utterances should include all valid forms, and include entities that appear and are absent and also reordered within the utterance.
  • Sie sollten eine Überanpassung der Entitäten an eine feste Gruppe vermeiden.You should avoid overfitting the entities to a very fixed set. Eine Überanpassung tritt auf, wenn das Modell nicht gut generalisiert wird. Dies ist ein gängiges Problem bei Machine Learning-Modellen.Overfitting happens when the model doesn't generalize well, and is a common problem in machine learning models. Sie impliziert, dass die App mit neuen Daten nicht richtig funktioniert.This implies the app would not work on new data adequately. Daher sollten Sie die bezeichneten Beispieläußerungen variieren, damit die App über die von Ihnen angegebenen Beispiele hinaus generalisiert werden kann.In turn, you should vary the labeled example utterances so the app is able to generalize beyond the limited examples you provide. Sie sollten die verschiedenen untergeordneten Entitäten mit ausreichend Änderungen für das Modell variieren, damit das Konzept im Mittelpunkt steht, und nicht nur die gezeigten Beispiele.You should vary the different subentities with enough change for the model to think more of the concept instead of just the examples shown.

Effektive vordefinierte EntitätenEffective prebuilt entities

Für die Erstellung effektiver Entitäten, die gemeinsame Daten extrahieren, wie sie z. B. von den vordefinierten Entitäten bereitgestellt werden, empfehlen wir das folgende Verfahren.To build effective entities that extract common data, such as those provided by the prebuilt entities, we recommend the following process.

Verbessern Sie die Extraktion von Daten, indem Sie Ihre eigenen Daten als Feature in eine Entität einbringen.Improve the extraction of data by bringing your own data to an entity as a feature. Auf diese Weise lernen alle zusätzlichen Bezeichnungen in den Daten den Kontext, in dem Personennamen in Ihrer Anwendung existieren.That way all the additional labels from your data will learn the context of where person names exist in your application.

Typen von EntitätenTypes of entities

Eine untergeordnete Entität einer übergeordneten Entität sollte eine durch maschinelles Lernen erworbene Entität sein.A subentity to a parent should be a machine-learning entity. Die untergeordnete Entität kann eine nicht durch maschinelles Lernen erworbene Entität als Feature verwenden.The subentity can use a non-machine-learning entity as a feature.

Wählen Sie die Entität basierend darauf aus, wie die Daten extrahiert und nach der Extraktion dargestellt werden sollen.Choose the entity based on how the data should be extracted and how it should be represented after it is extracted.

EntitätstypEntity type ZweckPurpose
Durch maschinelles Lernen erworbenMachine-learned Extrahieren geschachtelter, komplexer Daten, die anhand von beschrifteten Beispielen gelernt wurdenExtract nested, complex data learned from labeled examples.
ListeList Liste mit Elementen und den zugehörigen Synonymen, die per genauer Textübereinstimmung extrahiert werden.List of items and their synonyms extracted with exact text match.
Pattern.anyPattern.any Entität, bei der das Entitätsende schwierig zu bestimmen ist, da es sich um eine Freiformentität handelt.Entity where finding the end of entity is difficult to determine because the entity is free-form. Nur in Mustern verfügbar.Only available in patterns.
VordefiniertPrebuilt Bereits trainierte oder extrahierte spezielle Daten URLs oder E-Mail-Adressen.Already trained to extract specific kind of data such as URL or email. Einige dieser vordefinierten Entitäten werden im Open-Source-Projekt Recognizers-Text definiert.Some of these prebuilt entities are defined in the open-source Recognizers-Text project. Wenn Ihre Kultur oder Entität derzeit nicht unterstützt wird, können Sie sich am Projekt beteiligen.If your specific culture or entity isn't currently supported, contribute to the project.
Regulärer AusdruckRegular Expression Verwendet einen regulären Ausdruck für genaue Textübereinstimmungen.Uses regular expression for exact text match.

Extraktion und Auflösung im VergleichExtraction versus resolution

Entitäten extrahieren Daten so, wie sie in der Äußerung dargestellt werden.Entities extract data as the data appears in the utterance. Entitäten nehmen keine Änderungen an Daten vor oder lösen diese auf.Entities do not change or resolve the data. Die Entität gibt keine Auflösung an, wenn es sich bei dem Text um einen gültigen Wert handelt oder nicht.The entity won't provide any resolution if the text is a valid value for the entity or not.

Es gibt Möglichkeiten, die Auflösung in die Extraktion zu integrieren, jedoch sollten Sie beachten, dass dadurch die Fähigkeit der App eingeschränkt wird, immun gegen Variationen und Fehler zu sein.There are ways to bring resolution into the extraction, but you should be aware that this limits the ability of the app to be immune against variations and mistakes.

Listenentitäten und Entitäten für reguläre Ausdrücke (Textübereinstimmung) können als erforderliche Features für eine untergeordnete Entität verwendet werden, die als Filter für die Extraktion fungiert.List entities and regular expression (text-matching) entities can be used as required features to a subentity and that acts as a filter to the extraction. Sie sollten dies sorgfältig verwenden, um nicht die Vorhersagen der App zu beeinträchtigen.You should use this carefully as not to hinder the ability of the app to predict.

Eine Äußerung kann zwei oder mehr Vorkommen einer Entität enthalten, wobei die Bedeutung der Daten auf dem Kontext in der Äußerung basiert.An utterance may contain two or more occurrences of an entity where the meaning of the data is based on context within the utterance. Ein Beispiel ist eine Äußerung zum Buchen eines Flugs mit zwei geografischen Orten: Abflugs- und Ankunftsort.An example is an utterance for booking a flight that has two geographical locations, origin and destination.

Book a flight from Seattle to Cairo

Die beiden Orte müssen so extrahiert werden, dass der Clientanwendung jeweils die Art des Orts bekannt ist, um den Ticketkauf abwickeln zu können.The two locations need to be extracted in a way that the client-application knows the type of each location in order to complete the ticket purchase.

Erstellen Sie zum Extrahieren von Abflug- und Ankunftsort im Rahmen der durch maschinelles Lernen erworbenen Entität für die Ticketbestellung zwei untergeordnete Entitäten.To extract the origin and destination, create two subentities as part of the ticket order machine-learning entity. Erstellen Sie für jede der untergeordneten Entitäten ein erforderliches Feature mit „geographyV2“.For each of the subentities, create a required feature that uses geographyV2.

Verwenden erforderlicher Features zum Einschränken von EntitätenUsing required features to constrain entities

Weitere Informationen zu erforderlichen Features finden Sie hier.Learn more about required features

Entität „Pattern.any“Pattern.any entity

Eine Entität vom Typ „Pattern.any“ ist nur in einem Muster verfügbar.A Pattern.any is only available in a Pattern.

Überschreiten von App-Grenzwerten für EntitätenExceeding app limits for entities

Sollte das Limit nicht ausreichen, wenden Sie sich an den Support.If you need more than the limit, contact support. Sammeln Sie dazu ausführliche Informationen über Ihr System, navigieren Sie zur LUIS-Website, und wählen Sie dann Support aus.To do so, gather detailed information about your system, go to the LUIS website, and then select Support. Wenn Ihr Azure-Abonnement Supportdienste umfasst, wenden Sie sich an den technischen Support von Azure.If your Azure subscription includes support services, contact Azure technical support.

Status der Entitätsvorhersage und FehlerEntity prediction status and errors

Im LUIS-Portal sehen Sie, ob die Entität in einer Beispieläußerung eine andere Entitätsvorhersage aufweist als die Entität, die Sie für eine Beispieläußerung ausgewählt haben.The LUIS portal shows when the entity has a different entity prediction than the entity you selected for an example utterance. Der Unterschied beim Score kommt vom aktuellen trainierten Modell.This different score is based on the current trained model.

Im LUIS-Portal sehen Sie, ob die Entität in einer Beispieläußerung eine andere Entitätsvorhersage aufweist als die Entität, die Sie für eine Beispieläußerung ausgewählt haben.

Der Fehlermeldungstext wird in der Beispieläußerung hervorgehoben, und die Beispieläußerungszeile weist rechts einen Fehlerindikator in Form eines roten Dreiecks auf.The erroring text is highlighted within the example utterance, and the example utterance line has an error indicator to the right, shown as a red triangle.

Verwenden Sie diese Informationen, um Entitätsfehler mithilfe einer oder mehrerer der folgenden Maßnahmen zu beheben:Use this information to resolve entity errors using one or more of the following:

  • Der markierte Text ist falsch bezeichnet.The highlighted text is mislabeled. So beheben Sie Fehler, überprüfen, korrigieren und trainieren erneut.To fix, review, correct, and retrain.
  • Erstellen eines Features für die Entität, um die Ermittlung des Konzepts der Entität zu erleichternCreate a feature for the entity to help identify the entity's concept
  • Hinzufügen weiterer Beispieläußerungen und Beschriften mit der EntitätAdd more example utterances and label with the entity
  • Überprüfen von Vorschlägen für aktives Lernen für Äußerungen, die vom Vorhersageendpunkt empfangen werden und zur Ermittlung des Konzepts der Entität beitragen könnenReview active learning suggestions for any utterances received at the prediction endpoint that can help identify the entity's concept.

Nächste SchritteNext steps

Erfahren Sie mehr über die Konzepte für gute Äußerungen.Learn concepts about good utterances.

Weitere Informationen zum Hinzufügen von Entitäten zu LUIS-Apps finden Sie unter Hinzufügen von Entitäten.See Add entities to learn more about how to add entities to your LUIS app.

Siehe Tutorial: Extrahieren strukturierter Daten aus Benutzeräußerungen mithilfe der durch maschinelles Lernen erworbenen Entitäten in Language Understanding (LUIS). Darin wird beschrieben, wie Sie strukturierte Daten mithilfe der durch maschinelles Lernen erworbenen Entität aus einer Äußerung extrahieren.See Tutorial: Extract structured data from user utterance with machine-learning entities in Language Understanding (LUIS) to learn how to extract structured data from an utterance using the machine-learning entity.