Grundlegendes zu geeigneten Äußerungen für Ihre LUIS-AppUnderstand what good utterances are for your LUIS app

Äußerungen sind Eingaben vom Benutzer, die Ihre App interpretieren muss.Utterances are input from the user that your app needs to interpret. Es ist wichtig, eine Vielzahl verschiedener Beispieläußerungen für jede Absicht zu erfassen, um LUIS für die Extrahierung von Absichten und Entitäten zu trainieren.To train LUIS to extract intents and entities from them, it's important to capture a variety of different example utterances for each intent. Das aktive Lernen bzw. der Prozess des kontinuierlichen Trainierens neuer Äußerungen ist ein grundlegender Bestandteil der Intelligenz durch Machine Learning, die LUIS bereitstellt.Active learning, or the process of continuing to train on new utterances, is essential to machine-learned intelligence that LUIS provides.

Sammeln Sie Äußerungen, die Benutzer möglicherweise eingeben.Collect utterances that you think users will enter. Schließen Sie Äußerungen mit ein, die zwar die gleiche Bedeutung haben, aber unterschiedlich konstruiert sind:Include utterances, which mean the same thing but are constructed in a variety of different ways:

  • Äußerungslänge (kurz, mittel und lang für Ihre Clientanwendung)Utterance length - short, medium, and long for your client-application
  • Wort- und AusdruckslängeWord and phrase length
  • Wortposition (Entität am Anfang, in der Mitte und am Ende der Äußerung)Word placement - entity at beginning, middle, and end of utterance
  • GrammatikGrammar
  • PluralisierungPluralization
  • WortstammerkennungStemming
  • Nomen und VerbNoun and verb choice
  • Interpunktion (Varianten mit korrekter und falscher Grammatik sowie ohne Grammatik)Punctuation - a good variety using correct, incorrect, and no grammar

Auswählen verschiedener ÄußerungenHow to choose varied utterances

Wenn Sie mit Ihrem LUIS-Modell einsteigen, indem Sie Beispieläußerungen hinzufügen, finden Sie im Folgenden einige wichtige Prinzipien.When you first get started by adding example utterances to your LUIS model, here are some principles to keep in mind.

Äußerungen sind nicht immer ordnungsgemäß formatiertUtterances aren't always well formed

Dabei kann es sich um einen Satz (z.B. „Ein Ticket nach Paris für mich buchen“) oder um einen Teil eines Satzes (z.B. „Buchen“ oder „Flug nach Paris“) handeln.It may be a sentence, like "Book a ticket to Paris for me", or a fragment of a sentence, like "Booking" or "Paris flight." Benutzer machen oft Rechtschreibfehler.Users often make spelling mistakes. Überlegen Sie sich daher bei der Planung Ihrer App, ob Sie Benutzereingaben mithilfe der Bing-Rechtschreibprüfung korrigieren möchten, bevor Sie sie an LUIS übergeben.When planning your app, consider whether or not you use Bing Spell Check to correct user input before passing it to LUIS.

Wenn Sie keine Rechtschreibprüfung auf die Äußerungen Ihrer Benutzer anwenden, sollten Sie LUIS auf Äußerungen trainieren, die Tipp- und Schreibfehler enthalten.If you do not spell check user utterances, you should train LUIS on utterances that include typos and misspellings.

Verwenden Sie Sprache, die den Benutzern entsprichtUse the representative language of the user

Beachten Sie bei der Wahl der Äußerungen, dass das, was Sie als allgemeinen Begriff oder Ausdruck kennen, unter Umständen für typische Benutzer Ihrer Clientanwendung nicht geeignet ist.When choosing utterances, be aware that what you think is a common term or phrase might not be correct for the typical user of your client application. Möglicherweise fehlt den Benutzern das Fachwissen.They may not have domain experience. Seien Sie daher vorsichtig mit Begriffen oder Ausdrücken, die ein Benutzer nur verwenden würde, wenn er bestens mit der Thematik vertraut ist.Be careful when using terms or phrases that a user would only say if they were an expert.

Auswählen variierender Terminologie und AusdrückeChoose varied terminology as well as phrasing

Auch wenn Sie sich bemühen, variierende Satzstrukturen zu verwenden, werden Sie feststellen, dass Sie einiges an Vokabular wiederholen müssen.You will find that even if you make efforts to create varied sentence patterns, you will still repeat some vocabulary.

Sehen Sie sich diese Beispieläußerungen an:Take these example utterances:

Beispiele für ÄußerungenExample utterances
Wie bekomme ich einen Computer?how do I get a computer?
Wo bekomme ich einen Computer?Where do I get a computer?
Ich möchte einen Computer bekommen, wie gehe ich dazu vor?I want to get a computer, how do I go about it?
Wann kann ich einen Computer bekommen?When can I have a computer?

Für den zentralen Begriff (Computer) sind keine Varianten vorhanden.The core term here, "computer", isn't varied. Verwenden Sie Alternativen wie „Desktopcomputer“, „Laptop“, „Arbeitsstation“ oder sogar nur „Maschine“.Use alternatives such as desktop computer, laptop, workstation, or even just machine. LUIS kann diese Synonyme auf intelligente Weise vom Kontext ableiten. Wenn Sie jedoch Äußerungen zum Trainieren erstellen, ist es besser, diese zu variieren.LUIS intelligently infers synonyms from context, but when you create utterances for training, it's still better to vary them.

Beispieläußerungen mit jeder AbsichtExample utterances in each intent

Jede Absicht benötigt mindestens 15 Beispieläußerungen.Each intent needs to have example utterances, at least 15. Wenn Sie jedoch über eine Absicht verfügen, die keine Beispieläußerungen aufweist, können Sie LUIS nicht trainieren.If you have an intent that does not have any example utterances, you will not be able to train LUIS. Wenn Sie über eine Absicht mit nur einer oder sehr wenigen Beispieläußerungen verfügen, kann LUIS die Absicht nicht genau vorhersagen.If you have an intent with one or very few example utterances, LUIS will not accurately predict the intent.

Hinzufügen kleiner Gruppen mit 15 Äußerungen pro ErstellungsiterationAdd small groups of 15 utterances for each authoring iteration

Fügen Sie nicht jeder Iteration des Modells große Mengen von Äußerungen hinzu.In each iteration of the model, do not add a large quantity of utterances. Fügen Sie Äußerungen in 15er Gruppen hinzu.Add utterances in quantities of 15. Trainieren, veröffentlichen und testen Sie anschließend erneut.Train, publish, and test again.

LUIS erstellt effektive Modelle mit sorgfältig vom LUIS-Modellersteller ausgewählten Äußerungen.LUIS builds effective models with utterances that are carefully selected by the LUIS model author. Das Hinzufügen zu vieler Äußerungen ist nicht nützlich, da es zu Verwechslungen führen kann.Adding too many utterances isn't valuable because it introduces confusion.

Es ist besser, mit nur wenigen Äußerungen anzufangen und anschließend die Endpunktäußerungen zu überprüfen, um die richtige Vorhersage der Absicht und Extraktion der Entität zu gewährleisten.It is better to start with a few utterances, then review endpoint utterances for correct intent prediction and entity extraction.

ÄußerungsnormalisierungUtterance normalization

Äußerungsnormalisierung ist der Prozess, bei dem der Einfluss von Interpunktion und diakritischen Zeichen während des Trainings und Vorhersagen außer Kraft gesetzt wird.Utterance normalization is the process of ignoring the effects of punctuation and diacritics during training and prediction.

Äußerungsnormalisierung für diakritische Zeichen und InterpunktionUtterance normalization for diacritics and punctuation

Die Äußerungsnormalisierung wird definiert, wenn Sie die App erstellen oder importieren, da es sich um eine Einstellung in der JSON-Datei der App handelt.Utterance normalization is defined when you create or import the app because it is a setting in the app JSON file. Standardmäßig sind die Äußerungsnormalisierungseinstellungen deaktiviert.The utterance normalization settings are turned off by default.

Diakritische Zeichen sind Markierungen oder Kennzeichnungen innerhalb des Texts, z. B.:Diacritics are marks or signs within the text, such as:

İ ı Ş Ğ ş ğ ö ü

Wenn die Normalisierung für Ihre App aktiviert ist, ändern sich Bewertungen im Bereich Test, Batchtests und Endpunktabfragen für alle Äußerungen, die diakritische Zeichen oder Interpunktion verwenden.If your app turns normalization on, scores in the Test pane, batch tests, and endpoint queries will change for all utterances using diacritics or punctuation.

Aktivieren Sie die Äußerungsnormalisierung für diakritische Zeichen oder Interpunktion für Ihre LUIS-JSON-App-Datei im settings-Parameter.Turn on utterance normalization for diacritics or punctuation to your LUIS JSON app file in the settings parameter.

"settings": [
    {"name": "NormalizePunctuation", "value": "true"},
    {"name": "NormalizeDiacritics", "value": "true"}
] 

Interpunktion zu normalisieren bedeutet, dass die Interpunktionszeichen aus den Äußerungen entfernt werden, bevor Ihre Modelle trainiert und bevor Ihre Endpunktabfragen vorhergesagt werden.Normalizing punctuation means that before your models get trained and before your endpoint queries get predicted, punctuation will be removed from the utterances.

Bei der Normalisierung von diakritischen Zeichen werden die Elemente mit diakritischen Zeichen in Äußerungen durch reguläre Elemente ersetzt.Normalizing diacritics replaces the characters with diacritics in utterances with regular characters. Ein Beispiel: Je parle français wird zu Je parle francais.For example: Je parle français becomes Je parle francais.

Normalisierung bedeutet nicht, dass in Ihren Beispieläußerungen oder Vorhersageantworten keine Interpunktion oder diakritische Zeichen angezeigt werden, sondern nur, dass sie während des Trainings und Vorhersagen ignoriert werden.Normalization doesn’t mean you will not see punctuation and diacritics in your example utterances or prediction responses, merely that they will be ignored during training and prediction.

InterpunktionPunctuation marks

Interpunktion ist ein separates Token in LUIS.Punctuation is a separate token in LUIS. Eine Äußerung mit einem Punkt am Ende und eine Äußerung, in der dies nicht der Fall ist, sind zwei separate Äußerungen und erhalten möglicherweise zwei unterschiedliche Vorhersagen.An utterance that contains a period at the end versus an utterance that does not contain a period at the end are two separate utterances and may get two different predictions.

Wenn die Interpunktion nicht normalisiert wird, ignoriert LUIS Satzzeichen standardmäßig nicht, da diese für einige Clientanwendungen unter Umständen wichtig sind.If punctuation is not normalized, LUIS doesn't ignore punctuation marks, by default, because some client applications may place significance on these marks. Stellen Sie sicher, dass Sie Beispieläußerungen mit und ohne Satzzeichen verwenden, damit beide Formate die gleichen relativen Ergebnisse zurückgeben.Make sure your example utterances use both punctuation and no punctuation in order for both styles to return the same relative scores.

Stellen Sie sicher, dass das Modell die Interpunktion entweder in den Beispieläußerungen (mit und ohne Interpunktion) oder in den Mustern behandelt, wo es mit der speziellen Syntax einfacher ist, die Interpunktion zu ignorieren: I am applying for the {Job} position[.]Make sure the model handles punctuation either in the example utterances (having and not having punctuation) or in the patterns where it is easier to ignore punctuation with the special syntax: I am applying for the {Job} position[.]

Wenn die Interpunktion in Ihrer Clientanwendung keine besondere Bedeutung hat, sollten Sie erwägen, Satzzeichen zu ignorieren, indem Sie die Interpunktion normalisieren.If punctuation has no specific meaning in your client application, consider ignoring punctuation by normalizing punctuation.

Ignorieren von Wörtern und InterpunktionIgnoring words and punctuation

Wenn Sie bestimme Wörter oder Satzzeichen ignorieren möchten, können Sie Muster verwenden. Verwenden Sie in diesen zum Ignorieren von Wörtern und Satzzeichen eine Syntax mit eckigen Klammern ([]).If you want to ignore specific words or punctuation in patterns, use a pattern with the ignore syntax of square brackets, [].

Trainieren von ÄußerungenTraining utterances

Das Training ist im Allgemeinen nicht deterministisch: Die Vorhersage von Äußerungen kann über verschiedene Versionen oder Apps hinweg variieren.Training is generally non-deterministic: the utterance prediction could vary slightly across versions or apps. Sie können nicht deterministisches Training entfernen, indem Sie die API für die Versionseinstellungen mit dem UseAllTrainingData-Name-Wert-Paar aktualisieren, um alle Trainingsdaten zu verwenden.You can remove non-deterministic training by updating the version settings API with the UseAllTrainingData name/value pair to use all training data.

Testen von ÄußerungenTesting utterances

Entwickler sollten damit beginnen, ihre LUIS-Anwendung mit echtem Datenverkehr zu testen, indem sie Äußerungen an die URL des Vorhersageendpunkts senden.Developers should start testing their LUIS application with real traffic by sending utterances to the prediction endpoint URL. Diese Äußerungen werden verwendet, um die Leistung der Absichten und Entitäten mit Überprüfungsäußerungen zu verbessern.These utterances are used to improve the performance of the intents and entities with Review utterances. Tests, die über den Testbereich der LUIS-Website eingesendet werden, werden nicht über den Endpunkt gesendet und tragen daher nicht zum aktiven Lernen bei.Tests submitted with the LUIS website testing pane are not sent through the endpoint, and so do not contribute to active learning.

Überprüfen von ÄußerungenReview utterances

Nachdem Ihr Modell trainiert sowie veröffentlicht ist und Endpunktabfragen empfängt, überprüfen Sie die Äußerungen, die LUIS vorschlägt.After your model is trained, published, and receiving endpoint queries, review the utterances suggested by LUIS. LUIS wählt Endpunktäußerungen aus, die niedrige Bewertungen für die Absicht oder Entität aufweisen.LUIS selects endpoint utterances that have low scores for either the intent or entity.

Bewährte MethodenBest practices

Machen Sie sich mit den bewährten Methoden vertraut, und integrieren Sie sie in Ihren Erstellungszyklus.Review best practices and apply them as part of your regular authoring cycle.

Bezeichnungen für WortbedeutungenLabel for word meaning

Wenn die Wortauswahl oder die Anordnung der Wörter identisch ist, sie aber nicht dieselbe Bedeutung haben, sollten Sie sie nicht mit der Entität bezeichnen.If the word choice or word arrangement is the same, but doesn't mean the same thing, do not label it with the entity.

In den folgenden Äußerungen ist das Wort fair ein Homograph.The following utterances, the word fair is a homograph. Die Schreibweise ist identisch, aber die Bedeutung ist eine andere:It is spelled the same but has a different meaning:

ÄußerungUtterance
Welche Arten von Jahrmärkten finden in diesem Sommer in der Region Seattle statt?What kind of county fairs are happening in the Seattle area this summer?
Ist die aktuelle Bewertung für die Seattle-Rezension fair?Is the current rating for the Seattle review fair?

Wenn Sie mit einer Veranstaltungsentität alle Veranstaltungsdaten suchen möchten, bezeichnen Sie das Wort fair in der ersten Äußerung, aber nicht in der zweiten.If you wanted an event entity to find all event data, label the word fair in the first utterance, but not in the second.

Nächste SchritteNext steps

Informationen zum Trainieren einer LUIS-App, damit sie Benutzeräußerungen versteht, finden Sie unter Hinzufügen von Beispieläußerungen und -beschriftungen bei Entitäten.See Add example utterances for information on training a LUIS app to understand user utterances.