Podpora jazyků a oblastí pro službu LUIS
Důležité
Služba LUIS bude vyřazena 1. října 2025 a od 1. dubna 2023 nebudete moct vytvářet nové prostředky luis. Doporučujeme migrovat aplikace LUIS na konverzační jazyk, abyste mohli využívat výhod trvalé podpory produktů a možností více jazyků.
Služba LUIS obsahuje celou řadu funkcí. Ne všechny funkce jsou dostupné ve stejných jazycích. Ujistěte se, že funkce, o které máte zájem, jsou podporované v jazykové verzi, na kterou cílíte. Aplikace LUIS je specifická pro jazykovou verzi a po nastavení se nedá změnit.
Vícejazyčné aplikace LUIS
Pokud potřebujete vícejazyčnou klientskou aplikaci LUIS, jako je chatbot, máte několik možností. Pokud služba LUIS podporuje všechny jazyky, vytvoříte aplikaci LUIS pro každý jazyk. Každá aplikace LUIS má jedinečné ID aplikace a protokol koncového bodu. Pokud potřebujete poskytnout porozumění jazyku pro jazyk, který služba LUIS nepodporuje, můžete pomocí služby Translator přeložit promluvu do podporovaného jazyka, odeslat promluvu do koncového bodu služby LUIS a získat výsledné skóre.
Poznámka
V rámci jazyka Azure AI je teď k dispozici novější verze funkcí Language Understanding. Další informace najdete v dokumentaci k jazyku Azure AI. Informace o možnostech porozumění jazyku, které podporují více jazyků v rámci jazykové služby, najdete v tématu Konverzační Language Understanding.
Podporované jazyky
Služba LUIS rozumí promluvám v následujících jazycích:
Jazyk | Národní prostředí | Předem připravená doména | Předem připravená entita | Doporučení seznamu frází | **Analýza mínění a extrakce klíčových frází |
---|---|---|---|---|---|
Arabština (Preview – moderní standardní arabština) | ar-AR |
- | - | - | - |
*Čínština | zh-CN |
✔ | ✔ | ✔ | - |
Nizozemština | nl-NL |
✔ | - | - | ✔ |
Angličtina (Spojené státy) | en-US |
✔ | ✔ | ✔ | ✔ |
Angličtina (Uk) | en-GB |
✔ | ✔ | ✔ | ✔ |
Francouzština (Kanada) | fr-CA |
- | - | - | ✔ |
francouzština (Francie) | fr-FR |
✔ | ✔ | ✔ | ✔ |
Němčina | de-DE |
✔ | ✔ | ✔ | ✔ |
Gudžarátština (Preview) | gu-IN |
- | - | - | - |
Hindština (Preview) | hi-IN |
- | ✔ | - | - |
Italština | it-IT |
✔ | ✔ | ✔ | ✔ |
*Japonština | ja-JP |
✔ | ✔ | ✔ | Pouze klíčová fráze |
Korejština | ko-KR |
✔ | - | - | Pouze klíčová fráze |
Marathi (Preview) | mr-IN |
- | - | - | - |
Portugalština (Brazílie) | pt-BR |
✔ | ✔ | ✔ | ne všechny dílčí jazykové verze |
Španělština (Mexiko) | es-MX |
- | ✔ | ✔ | ✔ |
Španělština (Španělsko) | es-ES |
✔ | ✔ | ✔ | ✔ |
Tamilština (Preview) | ta-IN |
- | - | - | - |
Telugština (Preview) | te-IN |
- | - | - | - |
Turečtina | tr-TR |
✔ | ✔ | - | Pouze mínění |
Podpora jazyků se liší podle předem připravených entit a předem připravených domén.
*Poznámky k čínské podpoře
- V jazykové
zh-CN
verzi luis očekává místo tradiční znakové sady zjednodušenou čínštinu. - Názvy záměrů, entit, funkcí a regulárních výrazů můžou být čínské nebo římské znaky.
- Informace o tom, které předem připravené domény jsou v jazykové verzi podporované, najdete v referenčních informacích k předem připraveným
zh-CN
doménám.
*Japonské poznámky k podpoře
- Vzhledem k tomu, že služba LUIS neposkytuje syntaktickou analýzu a nerozuměla rozdílu mezi Keigo a neformální japonštinou, je nutné začlenit různé úrovně formalit jako příklady školení pro vaše aplikace.
- でございます není totéž jako です.
- です není totéž jako だ.
**Poznámky k podpoře jazykové služby
Služba Language zahrnuje předem připravenou entitu keyPhrase a analýzu mínění. Pro subkultury je podporována pouze portugalština: pt-PT
a pt-BR
. Všechny ostatní jazykové verze jsou podporovány na úrovni primární jazykové verze.
Podporované jazyky rozhraní Speech API
Viz Jazyky podporované řečí pro jazyky režimu diktování řeči.
Podporované jazyky kontroly pravopisu Bingu
Seznam podporovaných jazyků a stavu najdete v tématu Kontrola pravopisu Bingu Podporované jazyky .
Vzácná nebo cizí slova v aplikaci
V jazykové verzi en-us
se luis učí rozlišovat většinu anglických slov, včetně slangu. V jazykové verzi zh-cn
se luis naučí rozlišovat většinu čínských znaků. Pokud v souboru použijete vzácné slovo en-us
nebo znak zh-cn
a zjistíte, že služba LUIS zřejmě nedokáže rozpoznat dané slovo nebo znak, můžete toto slovo nebo znak přidat do funkce seznamu frází. Například slova mimo jazykovou verzi aplikace – to znamená cizí slova – by se měla přidat do funkce seznamu frází.
Hybridní jazyky
Hybridní jazyky kombinují slova ze dvou jazykových verzí, jako je angličtina a čínština. Tyto jazyky nejsou ve službě LUIS podporované, protože aplikace je založená na jedné jazykové verzi.
Tokenizace
Aby služba LUIS prováděla strojové učení, rozdělí promluvu na tokeny na základě jazykové verze.
Jazyk | každá mezera nebo speciální znak | úroveň znaku | složená slova |
---|---|---|---|
Arabština | ✔ | ||
Čínština | ✔ | ||
Nizozemština | ✔ | ✔ | |
Angličtina (en-us) | ✔ | ||
Angličtina (en-GB) | ✔ | ||
francouzština (fr-FR), | ✔ | ||
Francouzština (fr-CA) | ✔ | ||
Němčina | ✔ | ✔ | |
Gudžarátština | ✔ | ||
Hindština | ✔ | ||
Italština | ✔ | ||
Japonština | ✔ | ||
Korejština | ✔ | ||
Maráthština | ✔ | ||
Portugalština (Brazílie) | ✔ | ||
španělština (es-ES), | ✔ | ||
Španělština (es-MX) | ✔ | ||
Tamilština | ✔ | ||
Telugština | ✔ | ||
Turečtina | ✔ |
Vlastní verze tokenizátoru
Následující jazykové verze mají vlastní verze tokenizátoru:
Kultura | Verze | Účel |
---|---|---|
Němčinade-de |
1.0.0 | Tokenizuje slova jejich rozdělením pomocí tokenizátoru založeného na strojovém učení, který se pokouší rozdělit složená slova do jejich jednotlivých součástí. Pokud uživatel zadá Ich fahre einen krankenwagen jako promluvu, je převeden na Ich fahre einen kranken wagen . Umožňuje označení kranken a wagen nezávisle jako různých entit. |
Němčinade-de |
1.0.2 | Tokenizuje slova jejich rozdělením na mezery. Pokud uživatel zadá Ich fahre einen krankenwagen jako promluvu, zůstane jediným tokenem. Proto krankenwagen je označen jako jedna entita. |
Nizozemštinanl-nl |
1.0.0 | Tokenizuje slova jejich rozdělením pomocí tokenizátoru založeného na strojovém učení, který se pokouší rozdělit složená slova do jejich jednotlivých součástí. Pokud uživatel zadá Ik ga naar de kleuterschool jako promluvu, je převeden na Ik ga naar de kleuter school . Umožňuje označení kleuter a school nezávisle jako různých entit. |
Nizozemštinanl-nl |
1.0.1 | Tokenizuje slova jejich rozdělením na mezery. Pokud uživatel zadá Ik ga naar de kleuterschool jako promluvu, zůstane jediným tokenem. Proto kleuterschool je označen jako jedna entita. |
Migrace mezi verzemi tokenizátoru
Tokenizace probíhá na úrovni aplikace. Tokenizace na úrovni verze není podporována.
Importujte soubor jako novou aplikaci místo verze. Tato akce znamená, že nová aplikace má jiné ID aplikace, ale používá verzi tokenizátoru zadanou v souboru.