LUIS の言語と地域のサポート

重要

LUIS は 2025 年 10 月 1 日に廃止され、2023 年 4 月 1 日から新しい LUIS リソースを作成できなくなります。 継続的な製品サポートと多言語機能のベネフィットを得るために、LUIS アプリケーション会話言語理解に移行することをお勧めします。

LUIS はサービス内にさまざまな機能を備えています。 すべての機能の言語パリティが同じであるわけではありません。 関心のある機能が、自分の対象とする言語カルチャでサポートされていることをご確認ください。 LUIS アプリはカルチャ固有で、一度設定したら変更できません。

多言語 LUIS アプリ

チャットボットなどの多言語 LUIS クライアント アプリケーションが必要な場合は、オプションがいくつかあります。 LUIS によってすべての言語がサポートされている場合は、言語ごとに LUIS アプリを開発します。 各 LUIS アプリに一意のアプリ ID と、エンドポイント ログがあります。 LUIS でサポートされていない言語に対して、言語の解釈を提供する必要がある場合は、Translator サービスを使用して、サポートされている言語に発話を翻訳し、LUIS エンドポイントに送信して、結果スコアを受け取ることができます。

注意

新しいバージョンの Language Understanding 機能が、Azure AI Language の一部として使用できるようになりました。 詳細については、Azure AI Language のドキュメント を参照してください。 Language Service 内で複数の言語をサポートする言語理解機能については、会話言語理解に関する記事を参照してください。

サポートされている言語

LUIS が理解する発話の言語を次に示します。

Language Locale 事前構築済みのドメイン 事前構築済みのエンティティ フレーズ リストのレコメンデーション **感情分析キー フレーズ抽出
アラビア語 (プレビュー - 現代標準アラビア語) ar-AR - - - -
*中国語 zh-CN -
オランダ語 nl-NL - -
英語 (米国) en-US
英語 (英国) en-GB
フランス語 (カナダ) fr-CA - - -
フランス語 (フランス) fr-FR
ドイツ語 de-DE
グジャラート語 (プレビュー) gu-IN - - - -
ヒンディー語 (プレビュー) hi-IN - - -
イタリア語 it-IT
*日本語 ja-JP キー フレーズのみ
韓国語 ko-KR - - キー フレーズのみ
マラーティー語 (プレビュー) mr-IN - - - -
ポルトガル語 (ブラジル) pt-BR 一部のサブカルチャのみ
スペイン語 (メキシコ) es-MX -
スペイン語 (スペイン) es-ES
タミール語 (プレビュー) ta-IN - - - -
テルグ語 (プレビュー) te-IN - - - -
トルコ語 tr-TR - センチメントのみ

言語サポートは、事前構築済みのエンティティおよび事前構築済みのドメインによって異なります。

*中国語サポートに関するメモ

  • zh-CN カルチャで LUIS に必要なのは、繁体中国語ではなく簡体中国語の文字セットです。
  • 意図、エンティティ、機能、および正規表現の名前には、中国語の文字またはローマ字を使用できます。
  • zh-CN カルチャでサポートされているあらかじめ構築されたドメインについては、あらかじめ構築されたドメインのリファレンスを参照してください。

*日本語サポートに関するメモ

  • LUIS では構文解析が行われず、日本語の敬語とくだけた言葉遣いの違いは解釈されないため、ご自身のアプリケーションについては、トレーニング例としてさまざまなレベルの文体を組み込む必要があります。
    • "でございます" は、"です" と同じではありません。
    • "です" は、"だ" と同じではありません。

**言語サービスのサポートに関するメモ

言語サービスには、keyPhrase 事前構築済みエンティティと感情分析が含まれます。 サブカルチャ pt-PT および pt-BR については、ポルトガル語のみがサポートされています。 その他のカルチャはすべて、プライマリ カルチャ レベルでサポートされています。

Speech API のサポートされている言語

Speech ディクテーション モードの言語については、Speech の「Supported language (サポートされている言語)」を参照してください。

Bing Spell Check のサポートされている言語

サポートされている言語と状態の一覧については、Bing Spell Check のサポートされている言語に関するページをご覧ください。

アプリケーションの珍しい単語または外国の単語

en-us カルチャの LUIS では、学習によって英語の単語のほとんど (スラングを含む) が区別されます。 zh-cn カルチャの LUIS では、学習によってほとんどの中国語の文字が区別されます。 en-us で珍しい単語を使用するか、zh-cn で珍しい文字を使用する場合、LUIS で単語または文字を区別できない可能性があるときは、その単語または文字をフレーズ リスト機能に追加できます。 たとえば、アプリケーションのカルチャ以外の単語、つまり外国の単語は、フレーズ リスト機能に追加する必要があります。

ハイブリッド言語

ハイブリッド言語では、英語、中国語など、2 つのカルチャの単語が結合されます。 アプリが基づくカルチャは 1 つであるため、これらの言語は LUIS ではサポートされていません。

トークン化

機械学習を実行するために、LUIS では、発話がカルチャに基づいてトークンに分割されます。

Language すべてのスペースまたは特殊文字 文字レベル 複合語
アラビア語
Chinese
オランダ語
英語 (en-us)
英語 (en-GB)
フランス語 (fr-FR)
フランス語 (fr-CA)
ドイツ語
グジャラート語
ヒンディー語
イタリア語
日本語
韓国語
マラーティー語
ポルトガル語 (ブラジル)
スペイン語 (es-ES)
スペイン語 (es-MX)
タミル語
テルグ語
トルコ語

カスタム トークナイザーのバージョン

次のカルチャには、カスタム トークナイザーのバージョンがあります。

カルチャ Version 目的
ドイツ語
de-de
1.0.0 複合語をその単一コンポーネントに分解しようとする機械学習ベースのトークナイザーを使用して分割することによって、単語をトークン化します。
ユーザーが発話として Ich fahre einen krankenwagen を入力した場合、それは Ich fahre einen kranken wagen に変換されます。 krankenwagen を別のエンティティとして独立にマークすることが可能になります。
ドイツ語
de-de
1.0.2 スペースで分割することによって、単語をトークン化します。
ユーザーが発話として Ich fahre einen krankenwagen を入力した場合、それは 1つのトークンとして保持されます。 そのため、krankenwagen は 1 つのエンティティとしてマークされます。
オランダ語
nl-nl
1.0.0 複合語をその単一コンポーネントに分解しようとする機械学習ベースのトークナイザーを使用して分割することによって、単語をトークン化します。
ユーザーが発話として Ik ga naar de kleuterschool を入力した場合、それは Ik ga naar de kleuter school に変換されます。 kleuterschool を別のエンティティとして独立にマークすることが可能になります。
オランダ語
nl-nl
1.0.1 スペースで分割することによって、単語をトークン化します。
ユーザーが発話として Ik ga naar de kleuterschool を入力した場合、それは 1つのトークンとして保持されます。 そのため、kleuterschool は 1 つのエンティティとしてマークされます。

トークナイザーのバージョン間の移行

トークン化は、アプリ レベルで発生します。 バージョン レベルのトークン化に対するサポートはありません。

バージョンの代わりに、新しいアプリとしてファイルをインポートします。 このアクションは、新しいアプリはアプリ ID が異なるが、ファイルで指定されたトークナイザーのバージョンを使用することを示します。