Språk-och region stöd för LUISLanguage and region support for LUIS

Det finns flera olika funktioner i tjänsten LUIS.LUIS has a variety of features within the service. Vilka funktioner som stöds varierar mellan olika språk.Not all features are at the same language parity. Kontrollera att de funktioner som du är intresserad av stöds i målspråkkulturen.Make sure the features you are interested in are supported in the language culture you are targeting. En LUIS-app är landsspecifika och kan inte ändras när den har angetts.A LUIS app is culture-specific and cannot be changed once it is set.

LUIS-appar med flera språkMulti-language LUIS apps

Om du behöver ett LUIS-klient program med flera språk, till exempel en chattrobot, har du några alternativ.If you need a multi-language LUIS client application such as a chatbot, you have a few options. Om LUIS har stöd för alla språk utvecklar du en LUIS-app för varje språk.If LUIS supports all the languages, you develop a LUIS app for each language. Varje LUIS-app har ett unikt app-ID och slut punkts logg.Each LUIS app has a unique app ID, and endpoint log. Om du behöver ange språk förståelse för ett språk LUIS inte stöder kan du använda Translator-tjänsten för att översätta uttryck till ett språk som stöds, skicka uttryck till Luis-slutpunkten och ta emot de resulterande poängen.If you need to provide language understanding for a language LUIS does not support, you can use the Translator service to translate the utterance into a supported language, submit the utterance to the LUIS endpoint, and receive the resulting scores.

Språk som stödsLanguages supported

LUIS förstår yttranden på följande språk:LUIS understands utterances in the following languages:

SpråkLanguage Nationell inställningLocale Fördefinierad domänPrebuilt domain Fördefinierad entitetPrebuilt entity Rekommendationer för fras listaPhrase list recommendations **Text analys**Text analytics
(Sentiment och(Sentiment and
ReserveradeKeywords)
Engelska (USA)English (United States) en-US
Arabiska (förhands granskning-modern standard arabisk)Arabic (preview - modern standard Arabic) ar-AR - - - -
*Kinesiska*Chinese zh-CN -
NederländskaDutch nl-NL - -
Franska (Frankrike)French (France) fr-FR
Franska (Kanada)French (Canada) fr-CA - - -
TyskaGerman de-DE
GujaratiGujarati gu-IN - - - -
HindiHindi hi-IN - - -
ItalienskaItalian it-IT
*Japanska*Japanese ja-JP Endast nyckel frasKey phrase only
KoreanskaKorean ko-KR - - Endast nyckel frasKey phrase only
MarathiMarathi mr-IN - - - -
Portugisiska (Brasilien)Portuguese (Brazil) pt-BR alla under kulturernot all sub-cultures
Spanska (Spanien)Spanish (Spain) es-ES
Spanska (Mexiko)Spanish (Mexico) es-MX - -
TamilskaTamil ta-IN - - - -
TeluguTelugu te-IN - - - -
TurkiskaTurkish tr-TR - Endast sentimentSentiment only

Språk stöd varierar för färdiga entiteter och fördefinierade domäner.Language support varies for prebuilt entities and prebuilt domains.

* Support anteckningar om kinesiska*Chinese support notes

  • I zh-CN kulturen förväntar Luis den förenklade kinesiska teckenuppsättningen i stället för den traditionella teckenuppsättningen.In the zh-CN culture, LUIS expects the simplified Chinese character set instead of the traditional character set.
  • Namnen på avsikter, entiteter, funktioner och reguljära uttryck kan vara på kinesiska eller latinska tecken.The names of intents, entities, features, and regular expressions may be in Chinese or Roman characters.
  • Se den fördefinierade domän referensen för information om vilka färdiga domäner som stöds i zh-CN kulturen.See the prebuilt domains reference for information on which prebuilt domains are supported in the zh-CN culture.

* Stöd anteckningar för japanska*Japanese support notes

  • Eftersom LUIS inte tillhandahåller syntaktisk analys och inte kommer att förstå skillnaden mellan Keigo och informell japanska, måste du inkludera de olika nivåerna av formaliteter som inlärnings exempel för dina program.Because LUIS does not provide syntactic analysis and will not understand the difference between Keigo and informal Japanese, you need to incorporate the different levels of formality as training examples for your applications.
    • でございます är inte samma som です.でございます is not the same as です.
    • です är inte samma som だ.です is not the same as だ.

* * Support anteckningar för text analys**Text analytics support notes

Text analys innehåller en fördefinierad entitet och sentiment analys.Text analytics includes keyPhrase prebuilt entity and sentiment analysis. Endast portugisiska stöds för subkulturer: pt-PT och pt-BR .Only Portuguese is supported for subcultures: pt-PT and pt-BR. Alla andra kulturer stöds på den primära kultur nivån.All other cultures are supported at the primary culture level. Läs mer om Textanalys språk som stöds.Learn more about Text Analytics supported languages.

Speech API språk som stödsSpeech API supported languages

Se språk som stöds av tal i tal för tallägen.See Speech Supported languages for Speech dictation mode languages.

Stavningskontroll i Bing språk som stödsBing Spell Check supported languages

Se Stavningskontroll i Bing språk som stöds för en lista över språk och status som stöds.See Bing Spell Check Supported languages for a list of supported languages and status.

Ovanliga eller främmande ord i ett programRare or foreign words in an application

I en-us kulturen lär sig Luis att skilja ut de flesta engelska ord, inklusive slang.In the en-us culture, LUIS learns to distinguish most English words, including slang. I zh-cn kulturen lär sig Luis att skilja på de flesta kinesiska tecknen.In the zh-cn culture, LUIS learns to distinguish most Chinese characters. Om du använder ett sällsynt ord i en-us eller en bokstav i zh-cn , och du ser att Luis inte verkar särskilja ordet eller specialtecknet, kan du lägga till ordet eller symbolen i en fras List funktion.If you use a rare word in en-us or character in zh-cn, and you see that LUIS seems unable to distinguish that word or character, you can add that word or character to a phrase-list feature. Till exempel ord utanför programmets kultur – det vill säga främmande ord – ska läggas till i en fras List funktion.For example, words outside of the culture of the application -- that is, foreign words -- should be added to a phrase-list feature.

Hybrid språkHybrid languages

Hybrid språk kombinerar ord från två kulturer, till exempel engelska och kinesiska.Hybrid languages combine words from two cultures such as English and Chinese. Dessa språk stöds inte i LUIS eftersom en app baseras på en enda kultur.These languages are not supported in LUIS because an app is based on a single culture.

TokeniseringTokenization

För att utföra maskin inlärning bryter LUIS en uttryck till token baserat på kulturen.To perform machine learning, LUIS breaks an utterance into tokens based on culture.

SpråkLanguage varje mellanslag eller specialteckenevery space or special character Character-nivåcharacter level sammansatta ordcompound words
ArabiskaArabic
KinesiskaChinese
NederländskaDutch
Engelska (en-us)English (en-us)
Franska (fr-FR)French (fr-FR)
Franska (fr-CA)French (fr-CA)
TyskaGerman
GujaratiGujarati
HindiHindi
ItalienskaItalian
JapanskaJapanese
KoreanskaKorean
MarathiMarathi
Portugisiska (Brasilien)Portuguese (Brazil)
Spanska (es-ES)Spanish (es-ES)
Spanska (ES-MX)Spanish (es-MX)
TamilskaTamil
TeluguTelugu
TurkiskaTurkish

Anpassade tokenizer-versionerCustom tokenizer versions

Följande kulturer har anpassade tokenizer-versioner:The following cultures have custom tokenizer versions:

KulturCulture VersionVersion SyftePurpose
TyskaGerman
de-de
1.0.01.0.0 Tokenizes ord genom att dela dem med hjälp av en Machine Learning-baserad tokenizer som försöker dela upp sammansatta ord i sina enskilda komponenter.Tokenizes words by splitting them using a machine learning-based tokenizer that tries to break down composite words into their single components.
Om en användare anger Ich fahre einen krankenwagen som en uttryck, aktive ras den Ich fahre einen kranken wagen .If a user enters Ich fahre einen krankenwagen as an utterance, it is turned to Ich fahre einen kranken wagen. Tillåta markering av kranken och wagen oberoende som olika entiteter.Allowing the marking of kranken and wagen independently as different entities.
TyskaGerman
de-de
1.0.21.0.2 Tokenizes ord genom att dela dem på blank steg.Tokenizes words by splitting them on spaces.
Om en användare anges Ich fahre einen krankenwagen som en uttryck, förblir den en enda token.If a user enters Ich fahre einen krankenwagen as an utterance, it remains a single token. krankenwagenMarkeras därför som en enskild entitet.Thus krankenwagen is marked as a single entity.
NederländskaDutch
nl-nl
1.0.01.0.0 Tokenizes ord genom att dela dem med hjälp av en Machine Learning-baserad tokenizer som försöker dela upp sammansatta ord i sina enskilda komponenter.Tokenizes words by splitting them using a machine learning-based tokenizer that tries to break down composite words into their single components.
Om en användare anger Ik ga naar de kleuterschool som en uttryck, aktive ras den Ik ga naar de kleuter school .If a user enters Ik ga naar de kleuterschool as an utterance, it is turned to Ik ga naar de kleuter school. Tillåta markering av kleuter och school oberoende som olika entiteter.Allowing the marking of kleuter and school independently as different entities.
NederländskaDutch
nl-nl
1.0.11.0.1 Tokenizes ord genom att dela dem på blank steg.Tokenizes words by splitting them on spaces.
Om en användare anges Ik ga naar de kleuterschool som en uttryck, förblir den en enda token.If a user enters Ik ga naar de kleuterschool as an utterance, it remains a single token. kleuterschoolMarkeras därför som en enskild entitet.Thus kleuterschool is marked as a single entity.

Migrera mellan tokenizer-versionerMigrating between tokenizer versions

Tokenisering sker på App-nivå.Tokenization happens at the app level. Det finns inget stöd för tokenisering på versions nivå.There is no support for version-level tokenization.

Importera filen som en ny appi stället för en version.Import the file as a new app, instead of a version. Den här åtgärden innebär att den nya appen har ett annat app-ID men använder den tokenizer-version som anges i filen.This action means the new app has a different app ID but uses the tokenizer version specified in the file.