Ismerje meg, hogy a LUIS-alkalmazás milyen jó hosszúságú kimondott szövegUnderstand what good utterances are for your LUIS app

A hosszúságú kimondott szöveg olyan adatokat kapnak a felhasználótól, akiket az alkalmazásnak kell értelmezni.Utterances are input from the user that your app needs to interpret. A LUIS betanításához, hogy kinyerje a szándékait és az entitásokat, fontos, hogy az egyes szándékok különböző példáit hosszúságú kimondott szöveg.To train LUIS to extract intents and entities from them, it's important to capture a variety of different example utterances for each intent. Az aktív tanulás, illetve az új hosszúságú kimondott szöveg való folyamatos betanítás folyamata elengedhetetlen a gépi tanulási intelligenciához, amelyet a LUIS biztosít.Active learning, or the process of continuing to train on new utterances, is essential to machine-learning intelligence that LUIS provides.

Gyűjtse össze azokat a hosszúságú kimondott szöveg, amelyeket a felhasználók meg fognak adni.Collect utterances that you think users will enter. Vegyen fel hosszúságú kimondott szöveg, ami ugyanazt jelenti, de különböző módokon vannak kiépítve:Include utterances, which mean the same thing but are constructed in a variety of different ways:

  • Teljes hossz – rövid, közepes és hosszú az ügyfél-alkalmazáshozUtterance length - short, medium, and long for your client-application
  • Szó és kifejezés hosszaWord and phrase length
  • Szó elhelyezése – entitás elején, közepén és végénWord placement - entity at beginning, middle, and end of utterance
  • NyelvtanGrammar
  • PluralizationPluralization
  • EredőStemming
  • Főnév és ige választásaNoun and verb choice
  • Írásjelek – a helyes, helytelen és nem nyelvtant használó számos fajtaPunctuation - a good variety using correct, incorrect, and no grammar

Változatos hosszúságú kimondott szöveg kiválasztásaHow to choose varied utterances

Első lépésként vegyen fel például hosszúságú kimondott szöveg a Luis-modellbe, és tekintse meg az alábbi alapelveket.When you first get started by adding example utterances to your LUIS model, here are some principles to keep in mind.

A hosszúságú kimondott szöveg nem mindig megfelelően formázottUtterances aren't always well formed

Ez lehet egy mondat, például: "jegy befoglalása Párizsba", vagy egy mondat töredéke, például "foglalás" vagy "Párizs Flight".It may be a sentence, like "Book a ticket to Paris for me", or a fragment of a sentence, like "Booking" or "Paris flight." A felhasználók gyakran végeznek helyesírási hibákat.Users often make spelling mistakes. Az alkalmazás megtervezése során érdemes megfontolni, hogy az Bing Spell Check használatával javítsa ki a felhasználói adatokat, mielőtt elkezdené a Luis-nek.When planning your app, consider whether or not you use Bing Spell Check to correct user input before passing it to LUIS.

Ha nem jelöli be a felhasználó hosszúságú kimondott szöveg, akkor a LUIS-t a hosszúságú kimondott szöveg kell betanítania, amely tartalmazza az elírásokat és a hibákat.If you do not spell check user utterances, you should train LUIS on utterances that include typos and misspellings.

A felhasználó reprezentatív nyelvének használataUse the representative language of the user

A hosszúságú kimondott szöveg kiválasztásakor vegye figyelembe, hogy a leggyakoribb kifejezés vagy kifejezés nem megfelelő az ügyfélalkalmazás jellemző felhasználója számára.When choosing utterances, be aware that what you think is a common term or phrase might not be correct for the typical user of your client application. Előfordulhat, hogy nem rendelkeznek tartományi tapasztalattal.They may not have domain experience. Legyen körültekintő, ha olyan kifejezéseket vagy kifejezéseket használ, amelyeket a felhasználó csak szakértőnek mond.Be careful when using terms or phrases that a user would only say if they were an expert.

Válassza a különböző terminológiát és a beszédmódChoose varied terminology as well as phrasing

Azt tapasztalhatja, hogy még akkor is, ha a különböző mondatok létrehozásához tett erőfeszítéseket, továbbra is meg kell ismételnie néhány szókincset.You will find that even if you make efforts to create varied sentence patterns, you will still repeat some vocabulary.

Végezze el az alábbi példát a hosszúságú kimondott szöveg:Take these example utterances:

Példák kimondott szövegekreExample utterances
Hogyan szerezhetek be számítógépet?how do I get a computer?
Hol szerezhetek be számítógépet?Where do I get a computer?
Szeretnék beolvasni egy számítógépet, hogyan tudok?I want to get a computer, how do I go about it?
Mikor lehet a számítógépem?When can I have a computer?

A "számítógép" alapvető kifejezés nem változtatható meg.The core term here, "computer," isn't varied. Használjon olyan alternatívákat, mint az asztali számítógép, a laptop, a munkaállomás vagy akár a gép.Use alternatives such as desktop computer, laptop, workstation, or even just machine. A LUIS intelligens módon kikövetkeztetheti a szinonimákat a kontextusból, de ha hosszúságú kimondott szöveg hoz létre a betanításhoz, mindig érdemes megváltoznia.LUIS can intelligently infer synonyms from context, but when you create utterances for training, it's always better to vary them.

Példa hosszúságú kimondott szöveg az egyes leképezésekbenExample utterances in each intent

Minden leképezésnek legalább 15 hosszúságú kimondott szöveg kell lennie.Each intent needs to have example utterances, at least 15. Ha olyan szándékkal rendelkezik, amely nem rendelkezik például hosszúságú kimondott szöveg, nem fogja tudni betanítani a LUIS-t.If you have an intent that does not have any example utterances, you will not be able to train LUIS. Ha a hosszúságú kimondott szöveg egy vagy nagyon kevés példával rendelkezik, akkor a LUIS nem tudja pontosan megjósolni a szándékot.If you have an intent with one or very few example utterances, LUIS may not accurately predict the intent.

15 hosszúságú kimondott szöveg kisebb csoportjainak hozzáadása minden szerzői iterációhozAdd small groups of 15 utterances for each authoring iteration

A modell minden egyes iterációjában ne adjon hozzá nagy mennyiségű hosszúságú kimondott szöveg.In each iteration of the model, do not add a large quantity of utterances. Adja hozzá a hosszúságú kimondott szöveg a 15. számú mennyiséghez.Add utterances in quantities of 15. A betanítás, Közzétételés tesztelés .Train, publish, and test again.

LUIS olyan hatékony modelleket épít be a hosszúságú kimondott szöveg, amelyeket a LUIS Model szerzője körültekintően választ ki.LUIS builds effective models with utterances that are carefully selected by the LUIS model author. Túl sok hosszúságú kimondott szöveg hozzáadása nem értékes, mert zavart okoz.Adding too many utterances isn't valuable because it introduces confusion.

Érdemes kezdeni néhány hosszúságú kimondott szöveg, majd tekintse át a végpontok hosszúságú kimondott szöveg a megfelelő szándék-előrejelzés és az entitások kinyerése érdekében.It is better to start with a few utterances, then review endpoint utterances for correct intent prediction and entity extraction.

Kimondás normalizálásaUtterance normalization

A kizáró normalizálás az a folyamat, amelynek során figyelmen kívül hagyja a különböző típusú szövegeket, például a központozás és a Mellékjelek hatását a képzés és az előrejelzés során.Utterance normalization is the process of ignoring the effects of types of text, such as punctuation and diacritics, during training and prediction.

Alapértelmezés szerint a teljes normalizálás beállításai ki vannak kapcsolva.The utterance normalization settings are turned off by default. Ezek a beállítások többek között:These settings include:

  • Word-űrlapokWord forms
  • MellékjelekDiacritics
  • KözpontozásiPunctuation

Ha bekapcsolja a normalizálás beállítást, a teszt ablaktáblán a pontszámok, a Batch-tesztek és a végpont-lekérdezések a normalizálás beállítás összes hosszúságú kimondott szöveg változnak.If you turn on a normalization setting, scores in the Test pane, batch tests, and endpoint queries will change for all utterances for that normalization setting.

Ha a LUIS-portálon egy verziót klónozott, a verzió beállításai továbbra is az új klónozott verzióra kerülnek.When you clone a version in the LUIS portal, the version settings continue to the new cloned version.

A verzió beállításait a LUIS portálon, a kezelés szakaszban, az Alkalmazásbeállítások lapon, vagy a frissítési verzió beállításai API-n keresztül állíthatja be.Set the version settings via the LUIS portal, on the Manage section, on the Application Settings page, or the Update Version Settings API. További információ ezekről a normalizálás változásairól a hivatkozásban.Learn more about these normalization changes in the Reference.

Word-űrlapokWord forms

A Word-űrlapok normalizálása figyelmen kívül hagyja a gyökéren túlmutató szavak különbségeit.Normalizing word forms ignores the differences in words that expand beyond the root.

MellékjelekDiacritics

A Mellékjelek a szövegben lévő jelek vagy jelek, például:Diacritics are marks or signs within the text, such as:

İ ı Ş Ğ ş ğ ö ü

Központozás jeleiPunctuation marks

A központozás normalizálása azt jelenti, hogy a modellek betanítása előtt és a végponti lekérdezések megkezdése előtt az írásjelek el lesznek távolítva a hosszúságú kimondott szöveg.Normalizing punctuation means that before your models get trained and before your endpoint queries get predicted, punctuation will be removed from the utterances.

A központozás egy különálló jogkivonat a LUIS-ben.Punctuation is a separate token in LUIS. Egy teljes időszakot, amely a végén található pontot és egy teljes időszakot tartalmaz, és nem tartalmaz két különálló hosszúságú kimondott szöveg, és két különböző előrejelzést kaphat.An utterance that contains a period at the end versus an utterance that does not contain a period at the end are two separate utterances and may get two different predictions.

Ha a központozás nem normalizált, akkor a LUIS alapértelmezés szerint nem hagyja figyelmen kívül a központozás jelét, mert egyes ügyfélalkalmazások fontosnak helyezhetik el ezeket a jeleket.If punctuation is not normalized, LUIS doesn't ignore punctuation marks, by default, because some client applications may place significance on these marks. Győződjön meg arról, hogy a példa hosszúságú kimondott szöveg mindkét írásjelet használja, és nincs írásjel, hogy mindkét stílus ugyanazt a relatív pontszámot adja vissza.Make sure your example utterances use both punctuation and no punctuation in order for both styles to return the same relative scores.

Győződjön meg arról, hogy a modell kezeli a központozást a példában szereplő hosszúságú kimondott szöveg (és nem rendelkezik írásjelekkel), vagy azokban a mintázatokban , amelyekben a speciális szintaxissal egyszerűbb a központozás figyelmen kívül hagyása: I am applying for the {Job} position[.]Make sure the model handles punctuation either in the example utterances (having and not having punctuation) or in the patterns where it is easier to ignore punctuation with the special syntax: I am applying for the {Job} position[.]

Ha a központozás nem rendelkezik konkrét jelentéssel az ügyfélalkalmazás számára, akkor az írásjelek normalizálása révén érdemes figyelmen kívül hagyni a központozást.If punctuation has no specific meaning in your client application, consider ignoring punctuation by normalizing punctuation.

Szavak és írásjelek figyelmen kívül hagyásaIgnoring words and punctuation

Ha nem szeretné figyelmen kívül hagyni a konkrét szavakat vagy írásjeleket a mintázatokban, használjon mintázatot a szögletes zárójelek szintaxisának figyelmen kívül hagyásával [] .If you want to ignore specific words or punctuation in patterns, use a pattern with the ignore syntax of square brackets, [].

Képzés minden hosszúságú kimondott szövegTraining with all utterances

A képzés általában nem determinisztikus: a Kimondás előrejelzése némileg változhat a verziók és az alkalmazások között.Training is generally non-deterministic: the utterance prediction could vary slightly across versions or apps. A nem determinisztikus-képzések eltávolításához frissítse a Version Settings API-t a UseAllTrainingData név/érték párokkal, és használja az összes betanítási adatforrást.You can remove non-deterministic training by updating the version settings API with the UseAllTrainingData name/value pair to use all training data.

Hosszúságú kimondott szöveg teszteléseTesting utterances

A fejlesztőknek meg kell kezdeniük a LUIS-alkalmazás valós forgalmú tesztelését, ha hosszúságú kimondott szöveg küldenek az előrejelzési végpont URL-címére.Developers should start testing their LUIS application with real traffic by sending utterances to the prediction endpoint URL. Ezek a hosszúságú kimondott szöveg a leképezések és entitások teljesítményének növelésére szolgálnak a felülvizsgálati hosszúságú kimondott szöveg.These utterances are used to improve the performance of the intents and entities with Review utterances. A LUIS webhely tesztelési paneljén elküldött tesztek nem jutnak el a végponton keresztül, így nem járulnak hozzá az aktív tanuláshoz.Tests submitted with the LUIS website testing pane are not sent through the endpoint, and so do not contribute to active learning.

Hosszúságú kimondott szöveg áttekintéseReview utterances

A modell kiképzése, közzététele és a végponti lekérdezések fogadása után tekintse át a Luis által javasolt hosszúságú kimondott szöveg.After your model is trained, published, and receiving endpoint queries, review the utterances suggested by LUIS. LUIS kijelöli a végpontok hosszúságú kimondott szöveg, amelyekben a szándék vagy az entitás számára alacsony pontszám van.LUIS selects endpoint utterances that have low scores for either the intent or entity.

Ajánlott eljárásokBest practices

Tekintse át az ajánlott eljárásokat , és alkalmazza őket a szokásos szerzői ciklus részeként.Review best practices and apply them as part of your regular authoring cycle.

Felirat a szó jelentéséhezLabel for word meaning

Ha a Word Choice vagy a Word megállapodás megegyezik, de nem ugyanazt a dolgot jelenti, ne címkézze fel az entitással.If the word choice or word arrangement is the same, but doesn't mean the same thing, do not label it with the entity.

A következő hosszúságú kimondott szöveg a szó fair egy homográfia.The following utterances, the word fair is a homograph. A helyesírása ugyanaz, de a jelentése eltérő:It is spelled the same but has a different meaning:

Kimondott szövegUtterance
Milyen megyei vásárok történnek a Seattle területén ezen a nyáron?What kind of county fairs are happening in the Seattle area this summer?
A Seattle felülvizsgálati vásár jelenlegi minősítése?Is the current rating for the Seattle review fair?

Ha azt szeretné, hogy az esemény entitása az összes eseményt megkeresse, címkézze meg a szót az első szövegben fair , de ne a másodikban.If you wanted an event entity to find all event data, label the word fair in the first utterance, but not in the second.

Következő lépésekNext steps

A felhasználói hosszúságú kimondott szöveg megismeréséhez lásd: példa hosszúságú kimondott szöveg hozzáadása a Luis-alkalmazások betanításához.See Add example utterances for information on training a LUIS app to understand user utterances.