LUIS에 대한 언어 및 지역 지원

중요

LUIS는 2025년 10월 1일에 사용 중지되며 2023년 4월 1일부터 새 LUIS 리소스를 만들 수 없습니다. 지속적인 제품 지원 및 다국어 기능을 활용하려면 LUIS 애플리케이션대화 언어 이해로 마이그레이션하는 것이 좋습니다.

LUIS는 서비스 내에 다양한 기능을 포함합니다. 모든 기능이 동일한 언어 패리티에 있는 것은 아닙니다. 관심 있는 기능이 사용자가 원하는 언어 문화권에서 지원되는지 확인합니다. LUIS 앱은 문화권에 관련되며 설정된 후에는 변경할 수 없습니다.

다국어 LUIS 앱

챗봇과 같은 다국어 LUIS 클라이언트 애플리케이션이 필요한 경우, 몇 가지 옵션이 있습니다. LUIS가 모든 언어를 지원하는 경우에는 언어별로 LUIS 앱을 개발합니다. 각 LUIS 앱에는 고유한 앱 ID와 엔드포인트 로그가 있습니다. 지원되지 않는 언어 LUIS에 대한 Language Understanding을 제공해야 하는 경우, Translator 서비스를 사용하여 발화를 지원되는 언어로 번역하고, 발화를 LUIS 엔드포인트에 제출하고, 결과 점수를 받을 수 있습니다.

참고

이제 최신 버전의 Language Understanding 기능을 Azure AI Language의 일부로 사용할 수 있습니다. 자세한 내용은 Azure AI 언어 설명서를 참조하세요. 언어 서비스 내에서 여러 언어를 지원하는 Language Understanding 기능은 대화 언어 이해를 참조하세요.

지원되는 언어

LUIS는 발화를 다음 언어로 이해합니다.

언어 Locale 미리 빌드된 도메인 미리 빌드된 엔터티 문구 목록 권장 사항 **감정 분석핵심 구 추출
아랍어(미리 보기 - 최신 표준 아랍어) ar-AR - - - -
*중국어 zh-CN -
네덜란드어 nl-NL - -
영어(미국) en-US
영어(영국) en-GB
프랑스어(캐나다) fr-CA - - -
프랑스어(프랑스) fr-FR
독일어 de-DE
구자라트어(미리 보기) gu-IN - - - -
힌디어(미리 보기) hi-IN - - -
이탈리아어 it-IT
*일본어 ja-JP 주요 구문만
한국어 ko-KR - - 주요 구문만
마라티어(미리 보기) mr-IN - - - -
포르투갈어(브라질) pt-BR 일부 하위 문화권은 아님
스페인어(멕시코) es-MX -
스페인어(스페인) es-ES
타밀어(미리 보기) ta-IN - - - -
텔루구어(미리 보기) te-IN - - - -
터키어 tr-TR - 감정만

언어 지원은 미리 빌드된 엔터티미리 빌드된 도메인에 따라 다릅니다.

*중국어 지원 참고

  • zh-CN 문화권에서 LUIS는 기존 문자 집합 대신 중국어 간체 문자 집합을 예상합니다.
  • 의도, 엔터티, 기능 및 정규식의 이름은 중국어 또는 로마 문자일 수 있습니다.
  • zh-CN 문화권에서 지원되는 미리 빌드된 도메인에 대한 정보는 미리 빌드된 도메인 참조를 참조하세요.

*일본어 지원 참고

  • LUIS는 구문 분석을 제공하지 않으며 Keigo와 비공식 일본어 간의 차이를 이해하지 못하므로 여러 수준의 형식을 애플리케이션의 학습 예제로 통합해야 합니다.
    • でございます는 です와 같지 않습니다.
    • です는 だ와 같지 않습니다.

**언어 서비스 지원 참고 사항

언어 서비스에는 keyPhrase 미리 빌드된 엔터티 및 감정 분석이 포함됩니다. 하위 문화권에는 포르투갈어만 지원됩니다. pt-PTpt-BR. 다른 모든 문화권은 기본 문화권 수준에서 지원됩니다.

Speech API 지원되는 언어

Speech 받아쓰기 모드 언어에 대해서는 Speech 지원되는 언어를 참조하세요.

Bing Spell Check 지원되는 언어

지원되는 언어 및 상태 목록은 Bing Spell Check 지원되는 언어를 참조하세요.

애플리케이션의 희귀 또는 외래 단어

en-us 문화권에서 LUIS는 은어를 포함하여 대부분의 영어 단어를 구분하도록 학습됩니다. zh-cn 문화권에서 LUIS는 대부분의 중국어 문자를 구분하도록 학습됩니다. en-us의 희귀 단어 또는 zh-cn의 문자를 사용할 때 LUIS가 해당 단어나 문자를 구분할 수 없는 것으로 보이면 해당 단어나 문자를 구문 목록 기능에 추가할 수 있습니다. 예를 들어, 애플리케이션 문화권 외부의 단어(외래 단어)는 구문 목록 기능에 추가해야 합니다.

하이브리드 언어

하이브리드 언어는 영어 및 중국어와 같은 두 문화권의 단어를 결합합니다. 앱은 단일 문화권을 기반으로 하므로 이러한 언어는 LUIS에서 지원되지 않습니다.

토큰화

기계 학습을 수행하기 위해 LUIS는 문화권에 따라 발화를 토큰으로 구분합니다.

언어 모든 공백 또는 특수 문자 문자 수준 복합 단어
아랍어
중국어
네덜란드어
미국 영어(en-us)
영어(en-GB)
프랑스어(fr-FR)
프랑스어(fr-CA)
독일어
구자라트어
힌디어
이탈리아어
일본어
한국어
마라티어
포르투갈어(브라질)
스페인어(es-ES)
스페인어(es-MX)
타밀어
텔루구어
터키어

사용자 지정 토크나이저 버전

다음 문화권에는 사용자 지정 토크나이저 버전이 있습니다.

문화권 Version 목적
독일어
de-de
1.0.0 복합 단어를 단일 구성 요소로 분할하는 기계 학습 기반 토크나이저를 사용하여 단어를 분할하여 토큰화합니다.
사용자가 Ich fahre einen krankenwagen을 발화로 입력하면 Ich fahre einen kranken wagen로 전환됩니다. krankenwagen을 다른 엔터티로 독립적으로 표시할 수 있습니다.
독일어
de-de
1.0.2 단어를 공백으로 분할하여 토큰화합니다.
사용자가 Ich fahre einen krankenwagen을 발화로 입력하면 단일 토큰으로 유지됩니다. 따라서 krankenwagen은 단일 엔터티로 표시됩니다.
네덜란드어
nl-nl
1.0.0 복합 단어를 단일 구성 요소로 분할하는 기계 학습 기반 토크나이저를 사용하여 단어를 분할하여 토큰화합니다.
사용자가 Ik ga naar de kleuterschool을 발화로 입력하면 Ik ga naar de kleuter school로 전환됩니다. kleuterschool을 다른 엔터티로 독립적으로 표시할 수 있습니다.
네덜란드어
nl-nl
1.0.1 단어를 공백으로 분할하여 토큰화합니다.
사용자가 Ik ga naar de kleuterschool을 발화로 입력하면 단일 토큰으로 유지됩니다. 따라서 kleuterschool은 단일 엔터티로 표시됩니다.

토크나이저 버전 간 마이그레이션

토큰화는 앱 수준에서 발생합니다. 버전 수준 토큰화는 지원되지 않습니다.

버전이 아닌 새 앱으로 파일을 가져옵니다. 이 작업은 새 앱의 앱 ID가 다르지만 이 앱에서 파일에 지정된 토크나이저 버전이 사용됨을 의미합니다.