Szándékok, kimondott szövegek és entitások definiálása

Befejeződött

A kimondott szövegek azok a kifejezések, amelyeket a felhasználó megadhat a nyelvi modellt használó alkalmazás használatakor. A szándék egy olyan feladatot vagy műveletet jelöl, amelyet a felhasználó el szeretne végezni, vagy inkább egy kimondott szöveg jelentését . Egy modellt úgy hozhat létre, hogy szándékokat határoz meg, és társítja őket egy vagy több kimondott szöveggel.

Vegyük például a szándékok és a kapcsolódó kimondott szövegek alábbi listáját:

  • GetTime:
    • "Mikor van?"
    • "Mi az idő?"
    • "Mondja el az időt"
  • GetWeather:
    • "Mi az időjárás-előrejelzés?"
    • "Szükségem van egy esernyőre?"
    • "Havazik?"
  • TurnOnDevice
    • "Kapcsolja be a villanyt."
    • "Kapcsolja be a villanyt."
    • "Kapcsolja be a ventilátort"
  • Nincs:
    • „Helló”
    • "Viszlát"

A modellben meg kell határoznia azokat a szándékokat, amelyeket a modellnek ismernie kell, ezért szánjon egy kis időt annak a tartománynak a figyelembevételével, amelyet a modellnek támogatnia kell, valamint a felhasználók által kért műveletek vagy információk típusait. A definiált szándékok mellett minden modell tartalmaz egy None szándékot, amellyel explicit módon azonosíthatja a felhasználó által beküldött kimondott szövegeket, de amelyekhez nincs szükség konkrét műveletre (például beszélgetési üdvözlések, például "hello") vagy amelyek nem tartoznak a modell tartományának hatókörébe.

Miután azonosította azokat a szándékokat, amelyeket a modellnek támogatnia kell, fontos, hogy az egyes szándékokhoz különböző példaszövegeket rögzítsen. Gyűjtse össze a felhasználók által beírt kimondott szövegeket; beleértve a kimondott szövegeket is, amelyek ugyanazt a dolgot jelentik, de különböző módon vannak felépítve. Tartsa szem előtt az alábbi irányelveket:

  • Több különböző példa vagy alternatív módszer rögzítése ugyanarra a dologra
  • A kimondott szövegek hosszának változója a rövid, a közepes és a hosszú szöveg között
  • A kimondott szöveg főnévénekvagy tárgyának helyének módosítása. Helyezze az elejére, a végére vagy valahol a kettő közé
  • Helyes nyelvtan és helytelen nyelvtan használata különböző kimondott szövegekben jó betanítási adatpéldákhoz
  • A címkézett adatok pontossága, konzisztenciája és teljessége kulcsfontosságú tényező a modell teljesítményének meghatározásában.
    • Pontosan címkézzen: Minden entitást mindig a megfelelő típusra címkézzen. Csak a kinyerni kívánt adatokat vegye fel, kerülje a felesleges adatokat a címkékben.
    • Egységes címkézés: Ugyanazon entitásnak minden kimondott szövegben ugyanazzal a címkével kell rendelkeznie.
    • Teljes címke: Az entitás összes példányának címkézése az összes kimondott szövegben.

Az entitások adott környezetek szándékokhoz való hozzáadására szolgálnak. Definiálhat például egy TurnOnDevice szándékot, amely több eszközre is alkalmazható, és entitások használatával definiálja a különböző eszközöket.

Vegye figyelembe a következő kimondott szövegeket, szándékokat és entitásokat:

Beszédelem Szándék Entitások
Mi az idő? GetTime
Mikor van Londonban? GetTime Hely (London)
Mi az időjárás-előrejelzés Párizsra? GetWeather Hely (Párizs)
Szükségem lesz ma este egy esernyőre? GetWeather Időpont (ma este)
Mi az előrejelzés Seattle-be holnap? GetWeather Hely (Seattle), Idő (holnap)
Kapcsolja be a lámpát . TurnOnDevice Eszköz (világos)
Kapcsolja be a ventilátort. TurnOnDevice Eszköz (ventilátor)

Az entitásokat feloszthatja néhány különböző összetevőtípusra:

  • A tanult entitások a legrugalmasabb entitások, amelyeket a legtöbb esetben érdemes használni. Egy tanult összetevőt megfelelő névvel definiálhat, majd szavakat vagy kifejezéseket társíthat hozzá a kimondott szövegek betanításában. A modell betanítása során megtanulja, hogy a kimondott szövegek megfelelő elemeinek egyeznie kell az entitással.
  • A listaentitások akkor hasznosak, ha olyan entitásra van szüksége, amely egy adott lehetséges értékkészlettel rendelkezik – például a hét napjaival. Szinonimákat is felvehet a lista entitásdefinícióiba, így meghatározhat egy DayOfWeek entitást, amely tartalmazza a "Vasárnap", a "Hétfő", a "Kedd" stb. értékeket; mindegyikhez szinonimák tartoznak: "Sun", "Mon", "Tue" stb.
  • Az előre összeállított entitások olyan gyakori típusok esetén hasznosak, mint a számok, a dátumidők és a nevek. Ha például előre összeállított összetevőket ad hozzá, automatikusan észleli az olyan értékeket, mint a "6" vagy olyan szervezetek, mint a "Microsoft". Ez a cikk a támogatott előre összeállított entitások listáját tartalmazza.