Beszédelemek

Fontos

A LUIS 2025. október 1-jén megszűnik, és 2023. április 1-től nem hozhat létre új LUIS-erőforrásokat. Javasoljuk, hogy a LUIS-alkalmazásokat a beszélgetési nyelv megértésére migrálja, hogy kihasználhassa a terméktámogatás és a többnyelvű képességek előnyeit.

A kimondott szövegek olyan bemenetek a felhasználóktól, amelyeket az alkalmazásnak értelmeznie kell. Ahhoz, hogy betanítsa a LUIS-t, hogy szándékokat és entitásokat nyerjen ki ezekből a bemenetekből, fontos, hogy az egyes szándékokhoz különböző példaszövegeket rögzítsen. Az aktív tanulás, vagy az új kimondott szövegek betanításának folyamata elengedhetetlen a LUIS által biztosított gépi tanulási intelligencia szempontjából.

Gyűjtse össze a felhasználók által beírt kimondott szövegeket. Tartalmazzon kimondott szövegeket, amelyek ugyanazt jelentik, de többféleképpen vannak felépítve:

  • Kimondott szöveg hossza – rövid, közepes és hosszú az ügyfélalkalmazáshoz
  • Szó- és kifejezéshossz
  • Szóelhelyezés – entitás a kimondott szöveg elején, közepén és végén
  • Nyelvtan
  • Pluralizálás
  • Szárítás
  • Főnév és igeválasztás
  • Írásjelek – helyes és helytelen nyelvtan használata

Változatos kimondott szövegek kiválasztása

Amikor elkezd példaszövegeket hozzáadni a LUIS-modellhez, több alapelvet is szem előtt kell tartania:

A kimondott szövegek nem mindig jól formázottak

Előfordulhat, hogy az alkalmazásnak olyan mondatokat kell feldolgoznia, mint a "Jegy lefoglalása Párizsba nekem", vagy egy mondat töredékének( például "Booking" vagy "Paris flight" – A felhasználók gyakran helyesírási hibákat követnek el. Az alkalmazás tervezésekor fontolja meg, hogy a Bing Spell Check használatával szeretné-e kijavítani a felhasználói bemenetet, mielőtt továbbadja azt a LUIS-nak.

Ha nem írja be a felhasználói kimondott szövegek ellenőrzését, be kell tanítania a LUIS-t olyan kimondott szövegekre, amelyek elírásokat és elírásokat tartalmaznak.

A felhasználó reprezentatív nyelvének használata

A kimondott szövegek kiválasztásakor vegye figyelembe, hogy az ügyfélalkalmazás tipikus felhasználója esetében előfordulhat, hogy a gyakran használt kifejezések vagy kifejezések nem gyakoriak. Előfordulhat, hogy nem rendelkeznek tartományi tapasztalattal, és nem használnak más terminológiát. Ügyeljen arra, hogy olyan kifejezéseket vagy kifejezéseket használjon, amelyeket a felhasználó csak akkor mondana, ha szakértő lenne.

Válasszon változatos terminológiát és kifejezéseket

Azt fogja tapasztalni, hogy még ha változatos mondatminták létrehozására is törekszik, akkor is megismétli a szókincset. A következő kimondott szövegek például hasonló jelentéssel rendelkeznek, de más terminológiával és kifejezéssel rendelkeznek:

  • "Hogyan kap egy számítógépet?"
  • "Hol szerezhetek be számítógépet?"
  • "Szeretnék egy számítógépet, hogyan csináljam?"
  • "Mikor lehet számítógépem?"

Az alapvető kifejezés itt, számítógép, nem változatos. Használjon olyan alternatívákat, mint az asztali számítógép, a laptop, a munkaállomás vagy akár csak a gép. A LUIS intelligensen kikövetkezheti a kontextus szinonimáit, de amikor kimondott szövegeket hoz létre a betanításhoz, mindig jobb, ha változtatja őket.

Példa kimondott szövegekre az egyes szándékokban

Minden szándéknak legalább 15 kimondott példával kell rendelkeznie. Ha olyan szándéka van, amely nem rendelkezik példaszövegekkel, nem fogja tudni betaníteni a LUIS-t. Ha van egy szándéka egy vagy néhány példa kimondott szöveggel, előfordulhat, hogy a LUIS nem tudja pontosan előrejelezni a szándékot.

Kis kimondott szövegek csoportjainak hozzáadása

Minden alkalommal, amikor a modellen iterál, ne adjon hozzá nagy mennyiségű kimondott szöveget. Fontolja meg a kimondott szövegek 15-ös mennyiségben való hozzáadását. Ezután betanítsa, közzétegye és tesztelje újra.

A LUIS hatékony modelleket készít kimondott szövegekkel, amelyeket a LUIS-modell szerzője gondosan kiválaszt. Túl sok kimondott szöveg hozzáadása nem értékes, mert zavart okoz.

Érdemes néhány kimondott szöveggel kezdeni, majd áttekinteni a végpont kimondott szövegeit a helyes szándék-előrejelzéshez és az entitások kinyeréséhez.

Kimondott szöveg normalizálása

A kimondott szöveg normalizálása a szövegtípusok, például az írásjelek és a mellékjelek hatásainak figyelmen kívül hagyásának folyamata a betanítás és az előrejelzés során.

A kimondott szöveg normalizálási beállításai alapértelmezés szerint ki vannak kapcsolva. Ezek a beállítások többek között:

  • Word-űrlapok
  • Mellékjelek
  • Központozás

Ha bekapcsol egy normalizálási beállítást, a Teszt panelen, a kötegtesztekben és a végpontlekérdezésekben lévő pontszámok módosulnak az adott normalizálási beállítás összes kimondott szövegére vonatkozóan.

Amikor klónozza a verziót a LUIS-portálon, a verzióbeállítások az új klónozott verzióban maradnak.

Állítsa be az alkalmazás verzióbeállításait a LUIS-portálon az Alkalmazás Gépház lap felső navigációs menüjében a Kezelés gombra kattintva. A Frissítési verzió Gépház API-t is használhatja. További információért tekintse meg a referenciadokumentációt .

Word-űrlapok

A szóalakok normalizálása figyelmen kívül hagyja a szavak gyökerét meghaladó különbségeket.

Mellékjelek

A mellékjelek a szövegen belüli jelek vagy jelek, például:

İ ı Ş Ğ ş ğ ö ü

Írásjelek

Az írásjelek normalizálása azt jelenti, hogy a modellek betanítása és a végpontlekérdezések előrejelzése előtt az írásjelek törlődnek a kimondott szövegekből.

Az írásjelezés egy külön jogkivonat a LUIS-ban. Egy olyan kimondott szöveg, amely a végén egy pontot tartalmaz, különálló kimondott szöveg, mint egy olyan, amely nem tartalmaz pontot a végén, és két különböző előrejelzést kaphat.

Ha az írásjelek nem normalizálva vannak, a LUIS alapértelmezés szerint nem hagyja figyelmen kívül az írásjeleket, mert egyes ügyfélalkalmazások jelentőséggel bírhatnak ezeken a jeleken. Ügyeljen arra, hogy írásjeleket használó kimondott szövegeket is tartalmazzon, illetve olyanokat is, amelyek nem, hogy mindkét stílus ugyanazt a relatív pontszámot adja vissza.

Győződjön meg arról, hogy a modell kezeli az írásjeleket a példa kimondott szövegekben (amelyek írásjelekkel rendelkeznek és nem is rendelkeznek írásjelekkel), vagy olyan mintákat, amelyekben könnyebb figyelmen kívül hagyni az írásjeleket. Például: {Job} pozícióra[.] jelentkezem.

Ha az írásjelezésnek nincs konkrét jelentése az ügyfélalkalmazásban, fontolja meg az írásjelek figyelmen kívül hagyását az írásjelek normalizálásával.

Szavak és írásjelek figyelmen kívül hagyása

Ha figyelmen kívül szeretne hagyni bizonyos szavakat vagy írásjeleket a mintákban, használjon egy mintát a szögletes zárójelek figyelmen kívül hagyása szintaxisával. []

Betanítás az összes kimondott szöveggel

A betanítás nemdeterminista: a kimondott szöveg előrejelzése kissé eltérhet a verzióktól vagy alkalmazásoktól. A nemdeterminista betanítások eltávolításához frissítse a verzióbeállítások API-t a UseAllTrainingData név-érték párra az összes betanítási adat használatához.

Kimondott szövegek tesztelése

A fejlesztőknek valós adatokkal kell elkezdeniük a LUIS-alkalmazás tesztelését úgy, hogy kimondott szövegeket küldenek az előrejelzési végpont URL-címére. Ezek a kimondott szövegek a szándékok és entitások teljesítményének javítására szolgálnak a kimondott szövegek áttekintésével. A LUIS-portál tesztelési paneljén elküldött teszteket a rendszer nem küldi el a végponton keresztül, és nem járul hozzá az aktív tanuláshoz.

Kimondott szövegek áttekintése

A modell betanítása, közzététele és végpontlekérdezések fogadása után tekintse át a LUIS által javasolt kimondott szövegeket. A LUIS olyan végponti kimondott szövegeket választ ki, amelyek alacsony pontszámmal rendelkeznek a szándékhoz vagy az entitáshoz.

Ajánlott eljárások

Felirat a szó jelentéséhez

Ha a szóválasztás vagy a szóegyeztetés azonos, de nem ugyanazt jelenti, ne címkézze fel az entitással.

A következő kimondott szövegekben a fair szó egy homográf, ami azt jelenti, hogy ugyanazt írja, de más jelentése van:

  • "Milyen megyei vásárok történnek Seattle-ben ezen a nyáron?"
  • "A jelenlegi 2 csillagos értékelés az étterem vásár?

Ha azt szeretné, hogy egy eseményentitás megtalálja az összes eseményadatot, címkézze meg a fair szót az első kimondott szövegben, de a másodikban ne.

Ne hagyja figyelmen kívül a lehetséges kimondott szövegváltozatokat

A LUIS a szándék kimondott szövegében várható eltéréseket. A kimondott szövegek eltérőek lehetnek, miközben ugyanazt az általános jelentést jelentik. A változatok közé tartozhat a kimondott szöveg hossza, a szóválasztás és a szóelhelyezés.

Ne használja ugyanazt a formátumot Különböző formátumok használata
Jegy vásárlása Seattle-be 1 jegy vásárlása Seattle-be
Jegy vásárlása Párizsba Foglaljon le két jegyet a vörös szemű Párizsba jövő hétfőn
Jegy vásárlása Orlando-ba Szeretnék 3 jegyet foglalni Orlando-ba a tavaszi szünetre

A második oszlop különböző igéket (vásárlás, foglalás, könyv), különböző mennyiségeket (1, &"kettő", 3) és különböző szavakat használ, de mindegyiknek ugyanaz a szándéka, hogy repülőjegyet vásároljon utazásra.

Ne adjon hozzá túl sok kimondott példaszöveget a szándékokhoz

Az alkalmazás közzététele után csak az aktív tanulásból származó kimondott szövegeket adja hozzá a fejlesztési életciklus folyamatához. Ha a kimondott szövegek túl hasonlóak, adjon hozzá egy mintát.

Következő lépések