Förstå vilka bra yttranden är för din LUIS-appUnderstand what good utterances are for your LUIS app

Yttranden är indata från användaren som appen behöver tolka.Utterances are input from the user that your app needs to interpret. För att träna LUIS att extrahera avsikter och entiteter från dem är det viktigt att samla in en mängd olika exempel yttranden för varje avsikt.To train LUIS to extract intents and entities from them, it's important to capture a variety of different example utterances for each intent. Active Learning eller processen att fortsätta träna på nya yttranden är viktigt för att kunna registrera information som LUIS tillhandahåller.Active learning, or the process of continuing to train on new utterances, is essential to machine-learned intelligence that LUIS provides.

Samla in yttranden som du tror att användarna kommer att ange.Collect utterances that you think users will enter. Ta med yttranden, vilket innebär att samma sak är konstruerad på olika sätt:Include utterances, which mean the same thing but are constructed in a variety of different ways:

  • Uttryck length – Short, medium och Long för ditt klient programUtterance length - short, medium, and long for your client-application
  • Ord och fras längdWord and phrase length
  • Ord placering – entitet i början, mitten och slutet av uttryckWord placement - entity at beginning, middle, and end of utterance
  • GrammatikfelGrammar
  • PluralizationPluralization
  • FöljdStemming
  • Val av Substantiv och verbNoun and verb choice
  • Interpunktion – en lämplig mängd som använder korrekt, felaktig och ingen grammatikPunctuation - a good variety using correct, incorrect, and no grammar

Så här väljer du varierande yttrandenHow to choose varied utterances

När du först börjar med att lägga till exempel yttranden i din Luis-modell finns det några principer som du bör tänka på.When you first get started by adding example utterances to your LUIS model, here are some principles to keep in mind.

Yttranden är inte alltid korrekt utformadeUtterances aren't always well formed

Det kan vara en mening, t. ex. "boka en biljett till Paris för mig" eller ett fragment i en mening, t. ex. "bokning" eller "Paris flygning".It may be a sentence, like "Book a ticket to Paris for me", or a fragment of a sentence, like "Booking" or "Paris flight." Användare gör ofta stavfel.Users often make spelling mistakes. När du planerar din app bör du överväga om du använder stavningskontroll i Bing för att korrigera användarindata innan du skickar den till Luis.When planning your app, consider whether or not you use Bing Spell Check to correct user input before passing it to LUIS.

Om du inte stavningskontrollerar användar yttranden bör du träna LUIS på yttranden som innehåller skrivfel och fel stavningar.If you do not spell check user utterances, you should train LUIS on utterances that include typos and misspellings.

Använd användarens representativa språkUse the representative language of the user

När du väljer yttranden bör du tänka på att vad du tycker är en vanlig term eller fras kanske inte är korrekt för den typiska användaren av klient programmet.When choosing utterances, be aware that what you think is a common term or phrase might not be correct for the typical user of your client application. De har kanske inte domän erfarenhet.They may not have domain experience. Var försiktig när du använder termer eller fraser som en användare bara skulle säga om de vore en expert.Be careful when using terms or phrases that a user would only say if they were an expert.

Välj varierande terminologi och formuleringenChoose varied terminology as well as phrasing

Du kommer att se att även om du gör ansträngningar för att skapa olika menings mönster, kommer du fortfarande att upprepa vissa ord listor.You will find that even if you make efforts to create varied sentence patterns, you will still repeat some vocabulary.

Gör följande exempel yttranden:Take these example utterances:

Exempel på yttrandenExample utterances
Hur får jag en dator?how do I get a computer?
Var får jag en dator?Where do I get a computer?
Jag vill skaffa en dator, hur gör jag?I want to get a computer, how do I go about it?
När kan jag ha en dator?When can I have a computer?

Kärn termen här, "dator", är inte varierande.The core term here, "computer," isn't varied. Använd alternativ som stationär dator, bärbar dator, arbets Station eller till och med bara dator.Use alternatives such as desktop computer, laptop, workstation, or even just machine. LUIS kan på ett intelligent sätt härleda synonymer från kontexten, men när du skapar yttranden för utbildning är det alltid bättre att variera dem.LUIS can intelligently infer synonyms from context, but when you create utterances for training, it's always better to vary them.

Exempel på yttranden i varje avsiktExample utterances in each intent

Varje avsikt måste ha exempel yttranden, minst 15.Each intent needs to have example utterances, at least 15. Om du har en avsikt som inte har något exempel yttranden, kan du inte träna LUIS.If you have an intent that does not have any example utterances, you will not be able to train LUIS. Om du har en avsikt med ett eller väldigt få exempel yttranden kan LUIS inte förutse avsikten korrekt.If you have an intent with one or very few example utterances, LUIS may not accurately predict the intent.

Lägg till små grupper på 15 yttranden för varje redigering av iterationerAdd small groups of 15 utterances for each authoring iteration

I varje iteration av modellen ska du inte lägga till en stor mängd yttranden.In each iteration of the model, do not add a large quantity of utterances. Lägg till yttranden i kvantiteter på 15.Add utterances in quantities of 15. Träna, publiceraoch testa igen.Train, publish, and test again.

LUIS skapar effektiva modeller med yttranden som väljs noggrant av LUIS Model-författaren.LUIS builds effective models with utterances that are carefully selected by the LUIS model author. Att lägga till för många yttranden är inte värdefullt eftersom det introducerar förvirring.Adding too many utterances isn't valuable because it introduces confusion.

Det är bättre att börja med några få yttranden och sedan Granska slut punkts yttranden för korrekt matchning av avsikts förutsägelse och enhets extrahering.It is better to start with a few utterances, then review endpoint utterances for correct intent prediction and entity extraction.

Uttryck-normaliseringUtterance normalization

Uttryck normalisering är processen att ignorera effekterna av interpunktion och dia kritiska tecken under utbildning och förutsägelse.Utterance normalization is the process of ignoring the effects of punctuation and diacritics during training and prediction.

Uttryck-normalisering för dia kritiska tecken och interpunktionUtterance normalization for diacritics and punctuation

Uttryck-normalisering definieras när du skapar eller importerar appen eftersom den är en inställning i appens JSON-fil.Utterance normalization is defined when you create or import the app because it is a setting in the app JSON file. Inställningarna för uttryck-normalisering är inaktiverade som standard.The utterance normalization settings are turned off by default.

Dia kritiska tecken markeras eller signeras i texten, t. ex.:Diacritics are marks or signs within the text, such as:

İ ı Ş Ğ ş ğ ö ü

Om din app aktiverar normalisering på, kommer resultat i test fönstret, batch-test och slut punkts frågor att ändras för alla yttranden med dia kritiska tecken eller skiljetecken.If your app turns normalization on, scores in the Test pane, batch tests, and endpoint queries will change for all utterances using diacritics or punctuation.

Aktivera uttryck-normalisering för dia kritiska tecken eller skiljetecken till din LUIS JSON-app-fil i settings-parametern.Turn on utterance normalization for diacritics or punctuation to your LUIS JSON app file in the settings parameter.

"settings": [
    {"name": "NormalizePunctuation", "value": "true"},
    {"name": "NormalizeDiacritics", "value": "true"}
] 

Normalisera interpunktion innebär att innan dina modeller blir utbildade och innan dina slut punkts frågor hämtas, tas skiljetecken bort från yttranden.Normalizing punctuation means that before your models get trained and before your endpoint queries get predicted, punctuation will be removed from the utterances.

Normaliserar dia kritiska tecken ersätter tecknen med dia kritiska tecken i yttranden med vanliga tecken.Normalizing diacritics replaces the characters with diacritics in utterances with regular characters. Exempel: Je parle français blir Je parle francais.For example: Je parle français becomes Je parle francais.

Normalisering innebär inte att du inte ser interpunktion och dia kritiska tecken i dina exempel yttranden eller förutsägelse svar, bara att de kommer att ignoreras vid inlärning och förutsägelse.Normalization doesn’t mean you will not see punctuation and diacritics in your example utterances or prediction responses, merely that they will be ignored during training and prediction.

SkiljeteckenPunctuation marks

Skiljetecken är en separat token i LUIS.Punctuation is a separate token in LUIS. En uttryck som innehåller en period i slutet jämfört med en uttryck som inte innehåller en period i slutet är två separata yttranden och kan få två olika förutsägelser.An utterance that contains a period at the end versus an utterance that does not contain a period at the end are two separate utterances and may get two different predictions.

Om interpunktion inte är normaliserad ignorerar LUIS inte skiljetecken som standard eftersom vissa klient program kan placera signifikans på dessa märken.If punctuation is not normalized, LUIS doesn't ignore punctuation marks, by default, because some client applications may place significance on these marks. Se till att ditt exempel yttranden använder både skiljetecken och ingen interpunktion för att båda formaten ska returnera samma relativa resultat.Make sure your example utterances use both punctuation and no punctuation in order for both styles to return the same relative scores.

Se till att modellen hanterar skiljetecken antingen i exemplet yttranden (med och utan interpunktion) eller i mönstren där det är enklare att ignorera interpunktion med den särskilda syntaxen: I am applying for the {Job} position[.]Make sure the model handles punctuation either in the example utterances (having and not having punctuation) or in the patterns where it is easier to ignore punctuation with the special syntax: I am applying for the {Job} position[.]

Om interpunktionen inte har någon specifik betydelse i klient programmet, bör du överväga att Ignorera interpunktion genom normalisera interpunktion.If punctuation has no specific meaning in your client application, consider ignoring punctuation by normalizing punctuation.

Ignorerar ord och interpunktionIgnoring words and punctuation

Om du vill ignorera vissa ord eller interpunktion i mönster, använder du ett mönster med syntaxen för hakparenteser, [].If you want to ignore specific words or punctuation in patterns, use a pattern with the ignore syntax of square brackets, [].

Utbildning yttrandenTraining utterances

Träning är vanligt vis icke-deterministiskt: uttryck förutsägelse kan variera något mellan versioner eller appar.Training is generally non-deterministic: the utterance prediction could vary slightly across versions or apps. Du kan ta bort icke-deterministisk utbildning genom att uppdatera API för versions inställningar med UseAllTrainingData namn/värde-par för att använda alla tränings data.You can remove non-deterministic training by updating the version settings API with the UseAllTrainingData name/value pair to use all training data.

Testa yttrandenTesting utterances

Utvecklare bör börja testa sitt LUIS-program med verklig trafik genom att skicka yttranden till förutsägelse slut punktens URL.Developers should start testing their LUIS application with real traffic by sending utterances to the prediction endpoint URL. Dessa yttranden används för att förbättra prestanda för avsikter och entiteter med gransknings yttranden.These utterances are used to improve the performance of the intents and entities with Review utterances. Tester som skickats med LUIS webbplats test panel skickas inte via slut punkten och bidrar därför inte till aktiv inlärning.Tests submitted with the LUIS website testing pane are not sent through the endpoint, and so do not contribute to active learning.

Granska yttrandenReview utterances

När din modell har tränat, publicerat och tagit emot slut punkts frågor, granskar du yttranden som föreslås av Luis.After your model is trained, published, and receiving endpoint queries, review the utterances suggested by LUIS. LUIS väljer slut punkts yttranden som har låga Poäng för antingen avsikten eller entiteten.LUIS selects endpoint utterances that have low scores for either the intent or entity.

Bästa praxisBest practices

Granska metod tips och Använd dem som en del av din vanliga redigerings cykel.Review best practices and apply them as part of your regular authoring cycle.

Etikett för word betydelseLabel for word meaning

Om word val eller word placering är samma, men inte betyda samma sak, du inte märker den med entiteten.If the word choice or word arrangement is the same, but doesn't mean the same thing, do not label it with the entity.

Följande yttranden är ordet fair ett homograph.The following utterances, the word fair is a homograph. Det har stavats samma, men har en annan betydelse:It is spelled the same but has a different meaning:

YttrandeUtterance
Vilken typ av region mässor sker i Seattle-området den här sommaren?What kind of county fairs are happening in the Seattle area this summer?
Är den aktuella klassificeringen för Seattle-granskning fair?Is the current rating for the Seattle review fair?

Om du vill att en händelse entitet ska hitta alla händelse data kan du märka ordet fair i den första uttryck, men inte i den andra.If you wanted an event entity to find all event data, label the word fair in the first utterance, but not in the second.

Nästa stegNext steps

Se Lägg till exempel yttranden för information om hur du tränar en Luis-app för att förstå användar yttranden.See Add example utterances for information on training a LUIS app to understand user utterances.