LUIS の言語と地域のサポートLanguage and region support for LUIS

LUIS はサービス内にさまざまな機能を備えています。LUIS has a variety of features within the service. すべての機能の言語パリティが同じであるわけではありません。Not all features are at the same language parity. 関心のある機能が、自分の対象とする言語カルチャでサポートされていることをご確認ください。Make sure the features you are interested in are supported in the language culture you are targeting. LUIS アプリはカルチャ固有で、一度設定したら変更できません。A LUIS app is culture-specific and cannot be changed once it is set.

複数言語の LUIS アプリMulti-language LUIS apps

チャットボットなどの多言語 LUIS クライアント アプリケーションが必要な場合は、オプションがいくつかあります。If you need a multi-language LUIS client application such as a chatbot, you have a few options. LUIS によってすべての言語がサポートされている場合は、言語ごとに LUIS アプリを開発します。If LUIS supports all the languages, you develop a LUIS app for each language. 各 LUIS アプリに一意のアプリ ID と、エンドポイント ログがあります。Each LUIS app has a unique app ID, and endpoint log. LUIS でサポートされていない言語に対して、言語の解釈を提供する必要がある場合は、Microsoft Translator API を使用して、サポートされている言語に発話を翻訳し、LUIS エンドポイントに送信して、結果スコアを受け取ることができます。If you need to provide language understanding for a language LUIS does not support, you can use Microsoft Translator API to translate the utterance into a supported language, submit the utterance to the LUIS endpoint, and receive the resulting scores.

サポートされている言語Languages supported

LUIS が理解する発話の言語を次に示します。LUIS understands utterances in the following languages:

言語Language LocaleLocale 事前構築済みのドメインPrebuilt domain 事前構築済みのエンティティPrebuilt entity フレーズ リストのレコメンデーションPhrase list recommendations **テキスト分析**Text analytics
(センチメントと(Sentiment and
キーワード)Keywords)
英語 (米国)American English en-US
*中国語*Chinese zh-CN -
オランダ語Dutch nl-NL - - -
フランス語 (フランス)French (France) fr-FR -
フランス語 (カナダ)French (Canada) fr-CA - - -
ドイツ語German de-DE -
イタリア語Italian it-IT -
*日本語*Japanese ja-JP - キー フレーズのみKey phrase only
韓国語Korean ko-KR - - - キー フレーズのみKey phrase only
ポルトガル語 (ブラジル)Portuguese (Brazil) pt-BR - 一部のサブカルチャのみnot all sub-cultures
スペイン語 (スペイン)Spanish (Spain) es-ES -
スペイン語 (メキシコ)Spanish (Mexico) es-MX - -
トルコ語Turkish tr-TR - - - センチメントのみSentiment only

言語サポートは、事前構築済みのエンティティおよび事前構築済みのドメインによって異なります。Language support varies for prebuilt entities and prebuilt domains.

*中国語サポートに関するメモ*Chinese support notes

  • zh-cn カルチャで LUIS に必要なのは、繁体字中国語ではなく簡体字中国語の文字セットです。In the zh-cn culture, LUIS expects the simplified Chinese character set instead of the traditional character set.
  • 意図、エンティティ、機能、および正規表現の名前には、中国語の文字またはローマ字を使用できます。The names of intents, entities, features, and regular expressions may be in Chinese or Roman characters.
  • zh-cn カルチャでサポートされているあらかじめ構築されたドメインについては、あらかじめ構築されたドメインのリファレンスを参照してください。See the prebuilt domains reference for information on which prebuilt domains are supported in the zh-cn culture.

*日本語サポートに関するメモ*Japanese support notes

  • LUIS では構文解析が行われず、日本語の敬語とくだけた言葉遣いの違いは解釈されないため、ご自身のアプリケーションについては、トレーニング例としてさまざまなレベルの文体を組み込む必要があります。Because LUIS does not provide syntactic analysis and will not understand the difference between Keigo and informal Japanese, you need to incorporate the different levels of formality as training examples for your applications.
    • "でございます" は、"です" と同じではありません。でございます is not the same as です.
    • "です" は、"だ" と同じではありません。です is not the same as だ.

**テキスト分析サポートに関するメモ**Text analytics support notes

テキスト分析には、keyPhrase 事前構築済みエンティティと感情分析が含まれます。Text analytics includes keyPhrase prebuilt entity and sentiment analysis. サブカルチャ pt-PT および pt-BR については、ポルトガル語のみがサポートされています。Only Portuguese is supported for subcultures: pt-PT and pt-BR. その他のカルチャはすべて、プライマリ カルチャ レベルでサポートされています。All other cultures are supported at the primary culture level. Text Analytics のサポートされている言語の詳細を確認してください。Learn more about Text Analytics supported languages.

Speech API のサポートされている言語Speech API supported languages

Speech ディクテーション モードの言語については、Speech の「Supported language (サポートされている言語)」を参照してください。See Speech Supported languages for Speech dictation mode languages.

Bing Spell Check のサポートされている言語Bing Spell Check supported languages

サポートされている言語と状態の一覧については、Bing Spell Check のサポートされている言語に関するページをご覧ください。See Bing Spell Check Supported languages for a list of supported languages and status.

アプリケーションの珍しい単語または外国の単語Rare or foreign words in an application

en-us カルチャの LUIS では、学習によって英語の単語のほとんど (スラングを含む) が区別されます。In the en-us culture, LUIS learns to distinguish most English words, including slang. zh-cn カルチャの LUIS では、学習によってほとんどの中国語の文字が区別されます。In the zh-cn culture, LUIS learns to distinguish most Chinese characters. en-us で珍しい単語を使用するか、zh-cn で珍しい文字を使用する場合、LUIS で単語または文字を区別できない可能性があるときは、その単語または文字をフレーズ リスト機能に追加できます。If you use a rare word in en-us or character in zh-cn, and you see that LUIS seems unable to distinguish that word or character, you can add that word or character to a phrase-list feature. たとえば、アプリケーションのカルチャ以外の単語、つまり外国の単語は、フレーズ リスト機能に追加する必要があります。For example, words outside of the culture of the application -- that is, foreign words -- should be added to a phrase-list feature. このフレーズ リストは、交換不可能としてマークする必要があります。これにより、一連の珍しい単語によって、LUIS が学習によって認識する必要があるクラスが形成されていること、ただし、それらはシノニムではなく、相互に交換できないことが示されます。This phrase list should be marked non-interchangeable, to indicate that the set of rare words forms a class that LUIS should learn to recognize, but they are not synonyms or interchangeable with each other.

ハイブリッド言語Hybrid languages

ハイブリッド言語では、英語、中国語など、2 つのカルチャの単語が結合されます。Hybrid languages combine words from two cultures such as English and Chinese. アプリが基づくカルチャは 1 つであるため、これらの言語は LUIS ではサポートされていません。These languages are not supported in LUIS because an app is based on a single culture.

トークン化Tokenization

機械学習を実行するために、LUIS では、発話がカルチャに基づいてトークンに分割されます。To perform machine learning, LUIS breaks an utterance into tokens based on culture.

言語Language すべてのスペースまたは特殊文字every space or special character 文字レベルcharacter level 複合語compound words 返されるトークン化されたエンティティtokenized entity returned
中国語Chinese
オランダ語Dutch
英語 (en-us)English (en-us)
フランス語 (fr-FR)French (fr-FR)
フランス語 (fr-CA)French (fr-CA)
ドイツ語German
イタリア語Italian
日本語Japanese
韓国語Korean
ポルトガル語 (ブラジル)Portuguese (Brazil)
スペイン語 (es-ES)Spanish (es-ES)
スペイン語 (es-MX)Spanish (es-MX)

カスタム トークナイザーのバージョンCustom tokenizer versions

次のカルチャには、カスタム トークナイザーのバージョンがあります。The following cultures have custom tokenizer versions:

カルチャCulture VersionVersion 目的Purpose
ドイツ語German
de-de
1.0.01.0.0 複合語をその単一コンポーネントに分解しようとする機械学習ベースのトークナイザーを使用して分割することによって、単語をトークン化します。Tokenizes words by splitting them using a machine learning-based tokenizer that tries to break down composite words into their single components.
ユーザーが発話として Ich fahre einen krankenwagen を入力した場合、それは Ich fahre einen kranken wagen に変換されます。If a user enters Ich fahre einen krankenwagen as an utterance, it is turned to Ich fahre einen kranken wagen. krankenwagen を別のエンティティとして独立にマークすることが可能になります。Allowing the marking of kranken and wagen independently as different entities.
ドイツ語German
de-de
1.0.21.0.2 スペースで分割することによって、単語をトークン化します。Tokenizes words by splitting them on spaces.
ユーザーが発話として Ich fahre einen krankenwagen を入力した場合、それは 1 つのトークンのままになります。if a user enters Ich fahre einen krankenwagen as an utterance, it remains a single token. そのため、krankenwagen は 1 つのエンティティとしてマークされます。Thus krankenwagen is marked as a single entity.

トークナイザーのバージョン間の移行Migrating between tokenizer versions

トークン化は、アプリ レベルで発生します。Tokenization happens at the app level. バージョン レベルのトークン化に対するサポートはありません。There is no support for version-level tokenization.

バージョンの代わりに、新しいアプリとしてファイルをインポートします。Import the file as a new app, instead of a version. このアクションは、新しいアプリはアプリ ID が異なるが、ファイルで指定されたトークナイザーのバージョンを使用することを示します。This action means the new app has a different app ID but uses the tokenizer version specified in the file.