Stöd för språk och regioner för LUIS

Viktigt

LUIS dras tillbaka den 1 oktober 2025 och från och med 1 april 2023 kommer du inte att kunna skapa nya LUIS-resurser. Vi rekommenderar att du migrerar dina LUIS-program till förståelse för konversationsspråk för att dra nytta av fortsatt produktsupport och flerspråkiga funktioner.

Det finns flera olika funktioner i tjänsten LUIS. Vilka funktioner som stöds varierar mellan olika språk. Kontrollera att de funktioner som du är intresserad av stöds i målspråkkulturen. En LUIS-app är kulturspecifik och kan inte ändras när den har angetts.

Flerspråkiga LUIS-appar

Om du behöver ett flerspråkigt LUIS-klientprogram, till exempel en chattrobot, har du några alternativ. Om LUIS stöder alla språk utvecklar du en LUIS-app för varje språk. Varje LUIS-app har ett unikt app-ID och en slutpunktslogg. Om du behöver ge språkförstålelse för ett språk som LUIS inte stöder kan du använda Translator-tjänsten för att översätta yttrandet till ett språk som stöds, skicka yttrandet till LUIS-slutpunkten och få resultatet.

Anteckning

En nyare version av Language Understanding funktioner är nu tillgänglig som en del av Azure AI Language. Mer information finns i Dokumentation om Azure AI-språk. Information om funktioner för språktolkning som stöder flera språk i språktjänsten finns i Konversationsbaserade Language Understanding.

Språk som stöds

LUIS förstår yttranden på följande språk:

Språk Nationell inställning Fördefinierad domän Fördefinierad entitet Rekommendationer för fraslista **Sentimentanalys och extrahering av diskussionsämne
Arabiska (förhandsversion – modern standard arabiska) ar-AR - - - -
*Kinesiska zh-CN -
Nederländska nl-NL - -
Engelska (USA) en-US
Engelska (Storbritannien) en-GB
Franska (Kanada) fr-CA - - -
Franska (Frankrike) fr-FR
Tyska de-DE
Gujarati (förhandsversion) gu-IN - - - -
Hindi (förhandsversion) hi-IN - - -
Italienska it-IT
*Japanska ja-JP Endast nyckelfras
Koreanska ko-KR - - Endast nyckelfras
Marathi (förhandsversion) mr-IN - - - -
Portugisiska (Brasilien) pt-BR inte alla underkulturer
Spanska (Mexiko) es-MX -
Spanska (Spanien) es-ES
Tamil (förhandsversion) ta-IN - - - -
Telugu (förhandsversion) te-IN - - - -
Turkiska tr-TR - Endast sentiment

Språkstöd varierar för fördefinierade entiteter och fördefinierade domäner.

*Kinesiska supportanteckningar

  • zh-CN I kulturen förväntar sig LUIS den förenklade kinesiska teckenuppsättningen i stället för den traditionella teckenuppsättningen.
  • Namnen på avsikter, entiteter, funktioner och reguljära uttryck kan innehålla kinesiska eller romerska tecken.
  • Se referensen för fördefinierade domäner för information om vilka fördefinierade domäner som stöds i zh-CN kulturen.

*Japanska supportanteckningar

  • Eftersom LUIS inte tillhandahåller syntaktisk analys och inte förstår skillnaden mellan Keigo och informell japanska, måste du införliva de olika formalitetsnivåerna som utbildningsexempel för dina program.
    • でございます är inte samma som です.
    • です är inte samma som だ.

**Supportanteckningar för språktjänsten

Språktjänsten innehåller keyPhrase-fördefinierad entitets- och attitydanalys. Endast portugisiska stöds för subkulturer: pt-PT och pt-BR. Alla andra kulturer stöds på den primära kulturnivån.

Språk som stöds av Speech API

Se Språk som stöds av tal för språk i taldikteringsläge.

Språk som stöds i stavningskontroll i Bing

En lista över språk och status som stöds finns i Språk som stöds av stavningskontroll i Bing.

Sällsynta eller främmande ord i ett program

en-us I kulturen lär sig LUIS att skilja de flesta engelska ord, inklusive slang. zh-cn I kulturen lär sig LUIS att skilja de flesta kinesiska tecken. Om du använder ett sällsynt ord i en-us eller tecken i zh-cn, och du ser att LUIS inte verkar kunna särskilja det ordet eller tecknet, kan du lägga till ordet eller tecknet i en fraslista. Till exempel bör ord utanför programmets kultur , det vill säga främmande ord, läggas till i en fraslista.

Hybridspråk

Hybridspråk kombinerar ord från två kulturer som engelska och kinesiska. Dessa språk stöds inte i LUIS eftersom en app baseras på en enda kultur.

Tokenisering

För att utföra maskininlärning delar LUIS in ett yttrande i token baserat på kultur.

Språk varje blanksteg eller specialtecken teckennivå sammansatta ord
Arabiska
Kinesiska
Nederländska
Engelska (en-us)
Engelska (en-GB)
Franska (fr-FR)
Franska (fr-CA)
Tyska
Gujarati
Hindi
Italienska
Japanska
Koreanska
Marathi
Portugisiska (Brasilien)
Spanska (es-ES)
Spanska (es-MX)
Tamilska
Telugu
Turkiska

Anpassade tokeniserarversioner

Följande kulturer har anpassade tokeniserarversioner:

Kultur Version Syfte
Tyska
de-de
1.0.0 Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter.
Om en användare anger som ett yttrande omvandlas Ich fahre einen krankenwagen den till Ich fahre einen kranken wagen. Tillåta märkning av och wagen oberoende som kranken olika entiteter.
Tyska
de-de
1.0.2 Tokeniserar ord genom att dela upp dem på blanksteg.
Om en användare anges Ich fahre einen krankenwagen som ett yttrande förblir det en enda token. Därför krankenwagen markeras som en enda entitet.
Nederländska
nl-nl
1.0.0 Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter.
Om en användare anger som ett yttrande omvandlas Ik ga naar de kleuterschool den till Ik ga naar de kleuter school. Tillåta märkning av och school oberoende som kleuter olika entiteter.
Nederländska
nl-nl
1.0.1 Tokeniserar ord genom att dela upp dem på blanksteg.
Om en användare anges Ik ga naar de kleuterschool som ett yttrande förblir det en enda token. Därför kleuterschool markeras som en enda entitet.

Migrera mellan tokenizer-versioner

Tokenisering sker på appnivå. Det finns inget stöd för tokenisering på versionsnivå.

Importera filen som en ny app i stället för en version. Den här åtgärden innebär att den nya appen har ett annat app-ID men använder den tokeniserarversion som anges i filen.