Glosář porozumění jazyku pro běžnou slovní zásobu a koncepty

Důležité

Služba LUIS bude vyřazena 1. října 2025 a od 1. dubna 2023 nebudete moct vytvářet nové prostředky LUIS. Doporučujeme migrovat aplikace LUIS do porozumění konverzačnímu jazyku, abyste mohli využívat další podporu produktů a vícejazyčné funkce.

Glosář služby LUIS (Language Understanding) vysvětluje termíny, se kterými se můžete setkat při práci se službou LUIS.

Aktivní verze

Aktivní verze je verze vaší aplikace, která se aktualizuje při provádění změn modelu pomocí portálu LUIS. Pokud chcete na portálu LUIS provést změny verze, která není aktivní verzí, musíte nejprve tuto verzi nastavit jako aktivní.

Aktivní učení

Aktivní učení je technika strojového učení, ve které se model strojového učení používá k identifikaci informativních nových příkladů popisků. Aktivní učení ve službě LUIS označuje přidání promluv z provozu koncového bodu, jehož aktuální předpovědi nejsou jasné, aby se váš model zlepšil. Výběrem možnosti zkontrolovat promluvy koncového bodu zobrazíte promluvy, které se mají označit.

Viz také:

Aplikace (aplikace)

Ve službě LUIS je vaše aplikace nebo aplikace kolekce strojově naučených modelů, která je založená na stejné sadě dat, která spolupracuje na předpovídání záměrů a entit pro konkrétní scénář. Každá aplikace má samostatný koncový bod předpovědi.

Pokud vytváříte robota personálního oddělení, můžete mít sadu záměrů, například "Naplánovat volno", "inquire about benefits" a "update personal information" (Aktualizovat osobní údaje) a entity pro každý z těchto záměrů, které seskupíte do jedné aplikace.

Vytváření obsahu

Vytváření obsahu je schopnost vytvářet, spravovat a nasazovat aplikaci LUIS pomocí portálu LUIS nebo rozhraní API pro vytváření.

Klíč pro tvorbu

Klíč pro vytváření obsahu se používá k vytvoření aplikace. Nepoužívá se pro dotazy koncových bodů na úrovni produkčního prostředí. Další informace najdete v tématu Omezení prostředků.

Zdroj pro vytváření obsahu

Prostředek pro vytváření luis je spravovatelná položka, která je k dispozici prostřednictvím Azure. Prostředek je váš přístup k přidruženým možnostem vytváření, trénování a publikování služby Azure. Prostředek zahrnuje informace o ověřování, autorizaci a zabezpečení, které potřebujete pro přístup k přidružené službě Azure.

Prostředek pro vytváření obsahu má "druh" LUIS-AuthoringAzure .

Dávkové testování

Dávkové testování je schopnost ověřit modely aktuální aplikace LUIS konzistentní a známou testovací sadou promluv uživatelů. Dávkový test je definován v souboru ve formátu JSON.

Viz také:

  • Koncepty
  • Postup spuštění dávkového testu
  • Kurz – vytvoření a spuštění dávkového testu

Míra F

V dávkovém testování je míra přesnosti testu.

Falešně negativní (FN)

V dávkovém testování datové body představují promluvy, ve kterých aplikace nesprávně predikovala nepřítomnost cílového záměru nebo entity.

Falešně pozitivní (FP)

V dávkovém testování datové body představují promluvy, ve kterých aplikace nesprávně předpověděla existenci cílového záměru nebo entity.

Počet deset. míst

V dávkovém testování je přesnost (označovaná také jako kladná prediktivní hodnota) zlomkem relevantních promluv mezi načtené promluvy.

Příkladem pro dávkové zkoušky zvířat je počet ovcí, které byly předpovězeny celkovým počtem zvířat (ovce a neovci).

Odvolat

Při dávkovém testování je úplnost (označovaná také jako citlivost) schopnost služby LUIS generalizovat.

Příkladem dávkové zkoušky zvířat je počet ovcí, které byly předpovězeny celkovým počtem dostupných ovcí.

Pravdivě negativní (TN)

Pravdivě negativní je, když aplikace správně predikuje žádnou shodu. Při dávkovém testování dojde k skutečnému negativnímu výskytu, když vaše aplikace predikuje záměr nebo entitu v příkladu, který nebyl označený tímto záměrem nebo entitou.

Pravdivě pozitivní (TP)

Pravdivě pozitivní (TP) Pravdivě pozitivní je, když vaše aplikace správně predikuje shodu. Při dávkovém testování dojde k pravdivě pozitivnímu výskytu, když vaše aplikace predikuje záměr nebo entitu pro příklad, který je označený tímto záměrem nebo entitou.

Klasifikátor

Klasifikátor je strojově naučený model, který předpovídá, do jaké kategorie nebo třídy vstup zapadá.

Záměr je příkladem klasifikátoru.

Spolupracovník

Spolupracovník je koncepčně stejný jako přispěvatel. Spolupracovník má udělený přístup, když vlastník přidá e-mailovou adresu spolupracovníka do aplikace, která není řízená pomocí řízení přístupu na základě role v Azure (Azure RBAC). Pokud stále používáte spolupracovníky, měli byste migrovat svůj účet LUIS a používat prostředky pro vytváření luis ke správě přispěvatelů pomocí Azure RBAC.

Přispěvatel

Přispěvatel není vlastníkem aplikace, ale má stejná oprávnění k přidávání, úpravám a odstraňování záměrů, entit, promluv. Přispěvatel poskytuje řízení přístupu na základě role v Azure (Azure RBAC) k aplikaci LUIS.

Viz také:

Popisovač

Popisovač je termín, který se dříve používal pro funkci strojového učení.

Doména

V kontextu služby LUIS je doména oblastí znalostí. Vaše doména je specifická pro váš scénář. Různé domény používají konkrétní jazyk a terminologii, které mají význam v kontextu domény. Pokud například vytváříte aplikaci pro přehrávání hudby, vaše aplikace by měla termíny a jazyk specifický pro hudbu – slova jako "skladba, skladba, album, texty, b-side, interpret". Příklady domén najdete v předem připravených doménách.

Koncový bod

Koncový bod vytváření

Adresa URL koncového bodu pro vytváření luis je místo, kde aplikaci vytvoříte, vytrénujete a publikujete. Adresa URL koncového bodu obsahuje oblast nebo vlastní subdoménu publikované aplikace i ID aplikace.

Další informace o vytváření aplikace prostřednictvím kódu programu najdete v referenčních informacích pro vývojáře.

Koncový bod předpovědi

Adresa URL koncového bodu předpovědi SLUŽBY LUIS je místo, kde odesíláte dotazy LUIS po vytvoření a publikování aplikace LUIS. Adresa URL koncového bodu obsahuje oblast nebo vlastní subdoménu publikované aplikace i ID aplikace. Koncový bod najdete na stránce prostředků Azure vaší aplikace nebo adresu URL koncového bodu získáte z rozhraní API Získat informace o aplikaci.

Váš přístup ke koncovému bodu předpovědi je autorizovaný pomocí prediktivního klíče služby LUIS.

Entity

Entity jsou slova v promluvách, které popisují informace používané k plnění nebo identifikaci záměru. Pokud je entita složitá a chcete, aby model identifikoval konkrétní části, můžete model rozdělit na dílčí části. Můžete například chtít, aby model předpověděl adresu, ale také subentity ulice, města, státu a PSČ. Entity lze také použít jako funkce pro modely. Vaše odpověď z aplikace LUIS zahrnuje predikované záměry i všechny entity.

Extrakce entit

Extraktor entit, který se někdy označuje jen jako extraktor, je typ strojově naučeného modelu, který luis používá k predikci entit.

Schéma entity

Schéma entity je struktura, kterou definujete pro entity strojového učení s dílčími položkami. Koncový bod předpovědi vrátí všechny extrahované entity a dílčí hodnoty definované ve schématu.

Subentita entity

Subentita je podřízená entita entity strojového učení.

Entita bez strojového učení

Entita, která k extrakci dat používá porovnávání textu:

  • Entita seznamu
  • Entiay regulárního výrazu

Entita seznamu

Entita seznamu představuje pevnou uzavřenou sadu souvisejících slov spolu s jejich synonymy. Entity seznamu jsou přesné shody, na rozdíl od strojově naučených entit.

Entita bude předpovězena, pokud je v seznamu zahrnuto slovo v entitě seznamu. Pokud máte například entitu seznamu s názvem "velikost" a v seznamu máte slova "malá, střední, velká", pak entita velikosti bude předpovězena pro všechny promluvy, ve kterých se slova "malá", "střední" nebo "velká" používají bez ohledu na kontext.

Regulární výraz

Entita regulárního výrazu představuje regulární výraz. Entity regulárních výrazů jsou přesné shody, na rozdíl od strojově naučených entit.

Předem připravená entita

Viz předem připravená položka modelu pro předem připravenou entitu.

Funkce

Ve strojovém učení je funkce charakteristickou vlastností, která modelu pomáhá rozpoznat konkrétní koncept. Jedná se o nápovědu, kterou může služba LUIS používat, ale není to těžké pravidlo.

Tento termín se také označuje jako funkce strojového učení.

Tyto rady se používají s popisky, abyste se naučili předpovídat nová data. Luis podporuje seznamy frází i použití jiných modelů jako funkcí.

Požadovaná funkce

Požadovaná funkce je způsob, jak omezit výstup modelu LUIS. Pokud je funkce entity označená jako povinná, musí být tato funkce v příkladu, aby byla entita předpovězena bez ohledu na to, co model strojového učení predikuje.

Představte si příklad, kdy máte předem připravenou funkci číslování, kterou jste označili jako povinnou v entitě množství pro robota pro řazení nabídek. Když se robot zobrazí I want a bajillion large pizzas?, bajillion se nepředpoví jako množství bez ohledu na kontext, ve kterém se zobrazí. Bajillion není platné číslo a předpovídají předem připravenou entitu čísla.

Záměr

Záměr představuje úkol nebo akci, kterou chce uživatel provést. Jedná se o účel nebo cíl vyjádřený ve vstupu uživatele, jako je rezervace letu nebo platba faktury. Ve službě LUIS se promluva jako celek klasifikuje jako záměr, ale části promluvy se extrahují jako entity.

Příklady popisků

Označení neboli označení je proces přidružení kladného nebo záporného příkladu k modelu.

Označování záměrů

Ve službě LUIS se záměry v rámci aplikace vzájemně vylučují. To znamená, že když do záměru přidáte promluvu, považuje se za pozitivní příklad tohoto záměru a negativní příklad pro všechny ostatní záměry. Negativní příklady by se neměly zaměňovat se záměrem None (Žádný), který představuje promluvy, které jsou mimo rozsah aplikace.

Označování entit

Ve službě LUIS označíte slovo nebo frázi v ukázkové promluvě záměru entitou jako pozitivní příklad. Označení ukazuje záměr, který by měl pro danou promluvu předpovědět. Popisované promluvy slouží k trénování záměru.

Aplikace LUIS

Podívejte se na definici aplikace (aplikace).

Model

Model (strojově naučený) je funkce, která vytváří predikci vstupních dat. Ve službě LUIS odkazujeme na klasifikátory záměru a extraktory entit obecně jako "modely" a odkazujeme na kolekci modelů, které jsou natrénované, publikované a dotazované společně jako "aplikace".

Normalizovaná hodnota

Do entit seznamu přidáte hodnoty. Každá z těchto hodnot může mít seznam jednoho nebo více synonym. V odpovědi se vrátí pouze normalizovaná hodnota.

Přeurčení

K přeurčení dojde, když je model opravený na konkrétních příkladech a není schopen dobře generalizovat.

Vlastník

Každá aplikace má jednoho vlastníka, který je osobou, která aplikaci vytvořila. Vlastník spravuje oprávnění k aplikaci na webu Azure Portal.

Seznam frází

Seznam frází je konkrétní typ funkce strojového učení, která obsahuje skupinu hodnot (slov nebo frází), která patří do stejné třídy a musí se s nimi zacházet podobně (například názvy měst nebo produktů).

Předem připravený model

Předem vytvořený model je záměr, entita nebo kolekce obojího spolu s označenými příklady. Tyto běžné předem vytvořené modely je možné do vaší aplikace přidat, aby se snížila práce na vývoji modelů potřebná pro vaši aplikaci.

Předem připravená doména

Předem připravená doména je aplikace LUIS nakonfigurovaná pro konkrétní doménu, jako je automatizace domů (HomeAutomation) nebo rezervace restaurací (RestaurantReservation). Záměry, promluvy a entity jsou pro tuto doménu nakonfigurované.

Předem připravená entita

Předem připravená entita je entita, která luis poskytuje běžné typy informací, jako je číslo, adresa URL a e-mail. Ty se vytvářejí na základě veřejných dat. Můžete se rozhodnout přidat předem připravenou entitu jako samostatnou entitu nebo jako funkci do entity.

Předem připravený záměr

Předem připravený záměr je záměr, který luis poskytuje běžné typy informací a obsahuje vlastní popisky ukázkových promluv.

Predikce

Predikce je požadavek REST na službu azure LUIS pro predikce, která přebírá nová data (promluvu uživatele) a použije na tato data natrénovanou a publikovanou aplikaci, která určí, jaké záměry a entity se najdou.

Prediktivní klíč

Prediktivní klíč je klíč přidružený ke službě LUIS, kterou jste vytvořili v Azure, která autorizuje vaše použití koncového bodu předpovědi.

Tento klíč není klíčem pro vytváření. Pokud máte klíč koncového bodu předpovědi, měl by se místo klíče pro vytváření použít pro všechny požadavky koncových bodů. Aktuální prediktivní klíč uvidíte v adrese URL koncového bodu v dolní části stránky prostředků Azure na webu LUIS. Jedná se o hodnotu páru název/hodnota klíče předplatného.

Prostředek predikce

Prostředek predikce služby LUIS je spravovatelná položka, která je k dispozici prostřednictvím Azure. Prostředek je váš přístup k přidružené predikci služby Azure. Prostředek obsahuje předpovědi.

Prostředek predikce má "druh" LUISAzure .

Skóre předpovědi

Skóre je číslo od 0 a 1, které je měřítkem toho, jak je systém jistý, že konkrétní vstupní promluva odpovídá určitému záměru. Skóre blížící se 1 znamená, že systém má velmi jistotu o jeho výstupu a skóre blíže 0 znamená, že systém si je jistý, že vstup neodpovídá konkrétnímu výstupu. Skóre uprostřed znamená, že systém si velmi nejste jisti, jak se rozhodnout.

Vezměte například model, který se používá k identifikaci, jestli nějaký text zákazníka obsahuje objednávku jídla. Může dát skóre 1 pro "Chci objednat jednu kávu" (systém je velmi přesvědčen, že to je objednávka) a skóre 0 pro "můj tým vyhrál hru včera noc" (systém je velmi přesvědčen, že to není objednávka). A může mít skóre 0,5 pro "pojďme si dát čaj" (není si jistý, jestli se jedná o objednávku nebo ne).

Programový klíč

Přejmenováno na klíč pro vytváření.

Publikovat

Publikování znamená zpřístupnění aktivní verze služby LUIS na přípravném nebo produkčním koncovém bodu.

Kvóta

Kvóta služby LUIS je omezení úrovně předplatného Azure. Kvótu služby LUIS můžou omezit jak požadavky za sekundu (stav HTTP 429), tak celkový počet požadavků za měsíc (stav HTTP 403).

Schéma

Vaše schéma zahrnuje vaše záměry a entity spolu s dílčími hodnotami. Schéma je původně naplánováno na iterated v průběhu času. Schéma nezahrnuje nastavení aplikace, funkce ani ukázkové promluvy.

Analýza postoje

Analýza mínění poskytuje kladné nebo záporné hodnoty promluv poskytovaných službou Jazyk.

Dočištění řeči

Naprimování řeči zlepšuje rozpoznávání mluvených slov a frází, které se ve vašem scénáři běžně používají se službami Speech. U aplikací s povoleným převodem řeči se všechny příklady označené službou LUIS používají ke zlepšení přesnosti rozpoznávání řeči vytvořením přizpůsobeného modelu řeči pro tuto konkrétní aplikaci. Například v šachové hře chcete mít jistotu, že když uživatel řekne "Přesunout rytíř", není interpretován jako "Přesunout noc". Aplikace LUIS by měla obsahovat příklady, ve kterých je "rytíř" označený jako entita.

Počáteční klávesa

Bezplatný klíč, který se použije při prvním spuštění služby LUIS.

Synonyma

V entitách seznamu LUIS můžete vytvořit normalizovanou hodnotu, která může mít seznam synonym. Pokud například vytvoříte entitu velikosti, která má normalizované hodnoty malých, středních, velkých a nadbytečných hodnot. Pro každou hodnotu můžete vytvořit synonyma takto:

Nomalized value Synonyma
Malá ten malý, 8 uncí
Střední pravidelné, 12 uncí
Velká velký, 16 uncí
Velký Xtra největší, 24 uncí

Model vrátí normalizovanou hodnotu pro entitu, když se ve vstupu zobrazí některá synonyma.

Test

Testování aplikace LUIS znamená zobrazení predikcí modelu.

Posun časového pásma

Koncový bod zahrnuje timezoneOffset. Toto je číslo v minutách, které chcete přidat nebo odebrat z předem připravené entity datetimeV2. Pokud je například promluva "what time is it now?", vrátí datetimeV2 aktuální čas požadavku klienta. Pokud váš požadavek klienta pochází z robota nebo jiné aplikace, která není stejná jako uživatel robota, měli byste předat posun mezi robotem a uživatelem.

Viz Změna časového pásma předem připravené entity datetimeV2.

Token

Token je nejmenší jednotka textu, kterou dokáže služba LUIS rozpoznat. To se mírně liší v různých jazycích.

V případě angličtiny je token souvislým rozsahem (bez mezer nebo interpunkce) písmen a číslic. Mezera není token.

Fráze Počet tokenů Vysvětlení
Dog 0 Jedno slovo bez interpunkce nebo mezer.
RMT33W 0 Číslo lokátoru záznamu. Může obsahovat číslice a písmena, ale neobsahuje žádnou interpunkci.
425-555-5555 5 Telefonní číslo. Každá interpunkční značka je jeden token, takže 425-555-5555 by to bylo 5 tokenů:
425
-
555
-
5555
https://luis.ai 7 https
:
/
/
luis
.
ai

Trénink

Trénování je proces výuky služby LUIS o všech změnách aktivní verze od posledního trénování.

Data pro trénink

Trénovací data jsou sada informací potřebných k trénování modelu. To zahrnuje schéma, popisované promluvy, funkce a nastavení aplikace.

Chyby trénování

Chyby trénování jsou předpovědi trénovacích dat, které neodpovídají jejich popiskům.

Výrok

Promluva je uživatelský vstup, který představuje krátký textový zástupce věty v konverzaci. Je to fráze přirozeného jazyka, jako je například "rezervovat 2 lístky do Seattlu příští úterý". Ukázkové promluvy se přidají k trénování modelu a model předpovídá na nové promluvě za běhu.

Verze

Verze LUIS je konkrétní instance aplikace LUIS přidružená k ID aplikace LUIS a publikovanému koncovému bodu. Každá aplikace LUIS má aspoň jednu verzi.