Podpora jazyků a oblastí pro službu LUIS

Důležité

Služba LUIS bude vyřazena 1. října 2025 a od 1. dubna 2023 nebudete moct vytvářet nové prostředky luis. Doporučujeme migrovat aplikace LUIS na konverzační jazyk, abyste mohli využívat výhod trvalé podpory produktů a možností více jazyků.

Služba LUIS obsahuje celou řadu funkcí. Ne všechny funkce jsou dostupné ve stejných jazycích. Ujistěte se, že funkce, o které máte zájem, jsou podporované v jazykové verzi, na kterou cílíte. Aplikace LUIS je specifická pro jazykovou verzi a po nastavení se nedá změnit.

Vícejazyčné aplikace LUIS

Pokud potřebujete vícejazyčnou klientskou aplikaci LUIS, jako je chatbot, máte několik možností. Pokud služba LUIS podporuje všechny jazyky, vytvoříte aplikaci LUIS pro každý jazyk. Každá aplikace LUIS má jedinečné ID aplikace a protokol koncového bodu. Pokud potřebujete poskytnout porozumění jazyku pro jazyk, který služba LUIS nepodporuje, můžete pomocí služby Translator přeložit promluvu do podporovaného jazyka, odeslat promluvu do koncového bodu služby LUIS a získat výsledné skóre.

Poznámka

V rámci jazyka Azure AI je teď k dispozici novější verze funkcí Language Understanding. Další informace najdete v dokumentaci k jazyku Azure AI. Informace o možnostech porozumění jazyku, které podporují více jazyků v rámci jazykové služby, najdete v tématu Konverzační Language Understanding.

Podporované jazyky

Služba LUIS rozumí promluvám v následujících jazycích:

Jazyk Národní prostředí Předem připravená doména Předem připravená entita Doporučení seznamu frází **Analýza mínění a extrakce klíčových frází
Arabština (Preview – moderní standardní arabština) ar-AR - - - -
*Čínština zh-CN -
Nizozemština nl-NL - -
Angličtina (Spojené státy) en-US
Angličtina (Uk) en-GB
Francouzština (Kanada) fr-CA - - -
francouzština (Francie) fr-FR
Němčina de-DE
Gudžarátština (Preview) gu-IN - - - -
Hindština (Preview) hi-IN - - -
Italština it-IT
*Japonština ja-JP Pouze klíčová fráze
Korejština ko-KR - - Pouze klíčová fráze
Marathi (Preview) mr-IN - - - -
Portugalština (Brazílie) pt-BR ne všechny dílčí jazykové verze
Španělština (Mexiko) es-MX -
Španělština (Španělsko) es-ES
Tamilština (Preview) ta-IN - - - -
Telugština (Preview) te-IN - - - -
Turečtina tr-TR - Pouze mínění

Podpora jazyků se liší podle předem připravených entit a předem připravených domén.

*Poznámky k čínské podpoře

  • V jazykové zh-CN verzi luis očekává místo tradiční znakové sady zjednodušenou čínštinu.
  • Názvy záměrů, entit, funkcí a regulárních výrazů můžou být čínské nebo římské znaky.
  • Informace o tom, které předem připravené domény jsou v jazykové verzi podporované, najdete v referenčních informacích k předem připraveným zh-CN doménám.

*Japonské poznámky k podpoře

  • Vzhledem k tomu, že služba LUIS neposkytuje syntaktickou analýzu a nerozuměla rozdílu mezi Keigo a neformální japonštinou, je nutné začlenit různé úrovně formalit jako příklady školení pro vaše aplikace.
    • でございます není totéž jako です.
    • です není totéž jako だ.

**Poznámky k podpoře jazykové služby

Služba Language zahrnuje předem připravenou entitu keyPhrase a analýzu mínění. Pro subkultury je podporována pouze portugalština: pt-PT a pt-BR. Všechny ostatní jazykové verze jsou podporovány na úrovni primární jazykové verze.

Podporované jazyky rozhraní Speech API

Viz Jazyky podporované řečí pro jazyky režimu diktování řeči.

Podporované jazyky kontroly pravopisu Bingu

Seznam podporovaných jazyků a stavu najdete v tématu Kontrola pravopisu Bingu Podporované jazyky .

Vzácná nebo cizí slova v aplikaci

V jazykové verzi en-us se luis učí rozlišovat většinu anglických slov, včetně slangu. V jazykové verzi zh-cn se luis naučí rozlišovat většinu čínských znaků. Pokud v souboru použijete vzácné slovo en-us nebo znak zh-cna zjistíte, že služba LUIS zřejmě nedokáže rozpoznat dané slovo nebo znak, můžete toto slovo nebo znak přidat do funkce seznamu frází. Například slova mimo jazykovou verzi aplikace – to znamená cizí slova – by se měla přidat do funkce seznamu frází.

Hybridní jazyky

Hybridní jazyky kombinují slova ze dvou jazykových verzí, jako je angličtina a čínština. Tyto jazyky nejsou ve službě LUIS podporované, protože aplikace je založená na jedné jazykové verzi.

Tokenizace

Aby služba LUIS prováděla strojové učení, rozdělí promluvu na tokeny na základě jazykové verze.

Jazyk každá mezera nebo speciální znak úroveň znaku složená slova
Arabština
Čínština
Nizozemština
Angličtina (en-us)
Angličtina (en-GB)
francouzština (fr-FR),
Francouzština (fr-CA)
Němčina
Gudžarátština
Hindština
Italština
Japonština
Korejština
Maráthština
Portugalština (Brazílie)
španělština (es-ES),
Španělština (es-MX)
Tamilština
Telugština
Turečtina

Vlastní verze tokenizátoru

Následující jazykové verze mají vlastní verze tokenizátoru:

Kultura Verze Účel
Němčina
de-de
1.0.0 Tokenizuje slova jejich rozdělením pomocí tokenizátoru založeného na strojovém učení, který se pokouší rozdělit složená slova do jejich jednotlivých součástí.
Pokud uživatel zadá Ich fahre einen krankenwagen jako promluvu, je převeden na Ich fahre einen kranken wagen. Umožňuje označení kranken a wagen nezávisle jako různých entit.
Němčina
de-de
1.0.2 Tokenizuje slova jejich rozdělením na mezery.
Pokud uživatel zadá Ich fahre einen krankenwagen jako promluvu, zůstane jediným tokenem. Proto krankenwagen je označen jako jedna entita.
Nizozemština
nl-nl
1.0.0 Tokenizuje slova jejich rozdělením pomocí tokenizátoru založeného na strojovém učení, který se pokouší rozdělit složená slova do jejich jednotlivých součástí.
Pokud uživatel zadá Ik ga naar de kleuterschool jako promluvu, je převeden na Ik ga naar de kleuter school. Umožňuje označení kleuter a school nezávisle jako různých entit.
Nizozemština
nl-nl
1.0.1 Tokenizuje slova jejich rozdělením na mezery.
Pokud uživatel zadá Ik ga naar de kleuterschool jako promluvu, zůstane jediným tokenem. Proto kleuterschool je označen jako jedna entita.

Migrace mezi verzemi tokenizátoru

Tokenizace probíhá na úrovni aplikace. Tokenizace na úrovni verze není podporována.

Importujte soubor jako novou aplikaci místo verze. Tato akce znamená, že nová aplikace má jiné ID aplikace, ale používá verzi tokenizátoru zadanou v souboru.