Szándékok, kimondott szövegek és entitások definiálása
A kimondott szövegek azok a kifejezések, amelyeket a felhasználó megadhat a nyelvi modellt használó alkalmazás használatakor. A szándék egy olyan feladatot vagy műveletet jelöl, amelyet a felhasználó el szeretne végezni, vagy inkább egy kimondott szöveg jelentését . Egy modellt úgy hozhat létre, hogy szándékokat határoz meg, és társítja őket egy vagy több kimondott szöveggel.
Vegyük például a szándékok és a kapcsolódó kimondott szövegek alábbi listáját:
- GetTime:
- "Mikor van?"
- "Mi az idő?"
- "Mondja el az időt"
- GetWeather:
- "Mi az időjárás-előrejelzés?"
- "Szükségem van egy esernyőre?"
- "Havazik?"
- TurnOnDevice
- "Kapcsolja be a villanyt."
- "Kapcsolja be a villanyt."
- "Kapcsolja be a ventilátort"
- Nincs:
- „Helló”
- "Viszlát"
A modellben meg kell határoznia azokat a szándékokat, amelyeket a modellnek ismernie kell, ezért szánjon egy kis időt annak a tartománynak a figyelembevételével, amelyet a modellnek támogatnia kell, valamint a felhasználók által kért műveletek vagy információk típusait. A definiált szándékok mellett minden modell tartalmaz egy None szándékot, amellyel explicit módon azonosíthatja a felhasználó által beküldött kimondott szövegeket, de amelyekhez nincs szükség konkrét műveletre (például beszélgetési üdvözlések, például "hello") vagy amelyek nem tartoznak a modell tartományának hatókörébe.
Miután azonosította azokat a szándékokat, amelyeket a modellnek támogatnia kell, fontos, hogy az egyes szándékokhoz különböző példaszövegeket rögzítsen. Gyűjtse össze a felhasználók által beírt kimondott szövegeket; beleértve a kimondott szövegeket is, amelyek ugyanazt a dolgot jelentik, de különböző módon vannak felépítve. Tartsa szem előtt az alábbi irányelveket:
- Több különböző példa vagy alternatív módszer rögzítése ugyanarra a dologra
- A kimondott szövegek hosszának változója a rövid, a közepes és a hosszú szöveg között
- A kimondott szöveg főnévénekvagy tárgyának helyének módosítása. Helyezze az elejére, a végére vagy valahol a kettő közé
- Helyes nyelvtan és helytelen nyelvtan használata különböző kimondott szövegekben jó betanítási adatpéldákhoz
- A címkézett adatok pontossága, konzisztenciája és teljessége kulcsfontosságú tényező a modell teljesítményének meghatározásában.
- Pontosan címkézzen: Minden entitást mindig a megfelelő típusra címkézzen. Csak a kinyerni kívánt adatokat vegye fel, kerülje a felesleges adatokat a címkékben.
- Egységes címkézés: Ugyanazon entitásnak minden kimondott szövegben ugyanazzal a címkével kell rendelkeznie.
- Teljes címke: Az entitás összes példányának címkézése az összes kimondott szövegben.
Az entitások adott környezetek szándékokhoz való hozzáadására szolgálnak. Definiálhat például egy TurnOnDevice szándékot, amely több eszközre is alkalmazható, és entitások használatával definiálja a különböző eszközöket.
Vegye figyelembe a következő kimondott szövegeket, szándékokat és entitásokat:
Beszédelem | Szándék | Entitások |
---|---|---|
Mi az idő? | GetTime | |
Mikor van Londonban? | GetTime | Hely (London) |
Mi az időjárás-előrejelzés Párizsra? | GetWeather | Hely (Párizs) |
Szükségem lesz ma este egy esernyőre? | GetWeather | Időpont (ma este) |
Mi az előrejelzés Seattle-be holnap? | GetWeather | Hely (Seattle), Idő (holnap) |
Kapcsolja be a lámpát . | TurnOnDevice | Eszköz (világos) |
Kapcsolja be a ventilátort. | TurnOnDevice | Eszköz (ventilátor) |
Az entitásokat feloszthatja néhány különböző összetevőtípusra:
- A tanult entitások a legrugalmasabb entitások, amelyeket a legtöbb esetben érdemes használni. Egy tanult összetevőt megfelelő névvel definiálhat, majd szavakat vagy kifejezéseket társíthat hozzá a kimondott szövegek betanításában. A modell betanítása során megtanulja, hogy a kimondott szövegek megfelelő elemeinek egyeznie kell az entitással.
- A listaentitások akkor hasznosak, ha olyan entitásra van szüksége, amely egy adott lehetséges értékkészlettel rendelkezik – például a hét napjaival. Szinonimákat is felvehet a lista entitásdefinícióiba, így meghatározhat egy DayOfWeek entitást, amely tartalmazza a "Vasárnap", a "Hétfő", a "Kedd" stb. értékeket; mindegyikhez szinonimák tartoznak: "Sun", "Mon", "Tue" stb.
- Az előre összeállított entitások olyan gyakori típusok esetén hasznosak, mint a számok, a dátumidők és a nevek. Ha például előre összeállított összetevőket ad hozzá, automatikusan észleli az olyan értékeket, mint a "6" vagy olyan szervezetek, mint a "Microsoft". Ez a cikk a támogatott előre összeállított entitások listáját tartalmazza.