Suporte de idioma e região para o LUIS

Importante

O LUIS será desativado em 1º de outubro de 2025 e, a partir de 1º de abril de 2023, você não poderá criar novos recursos do LUIS. É recomendável migrar seus aplicativos LUIS para a compreensão da linguagem coloquial a fim de usufruir do suporte contínuo ao produto e dos recursos multilíngues.

LUIS tem uma variedade de recursos dentro do serviço. Nem todos os recursos estão na mesma paridade de idioma. Verifique se os recursos em que você está interessado têm suporte na cultura do idioma de destino. Um aplicativo LUIS é específico à cultura e não pode ser alterado após a definição.

Aplicativos LUIS multilíngues

Se você precisar de um aplicativo cliente LUIS multilíngues, como um chatbot, terá algumas opções. Se o LUIS der suporte a todos os idiomas, desenvolva um aplicativo LUIS para cada idioma. Cada aplicativo LUIS tem uma ID de aplicativo exclusiva e um log de ponto de extremidade. Se você precisa fornecer reconhecimento de linguagem para um idioma ao qual o LUIS não oferece suporte, use o serviço Tradutor para traduzir o enunciado para um idioma com suporte, envie o enunciado ao ponto de extremidade do LUIS e receba as pontuações resultantes.

Observação

Uma versão mais recente das funcionalidades de Reconhecimento vocal já está disponível como parte da Linguagem de IA do Azure. Para obter mais informações, confira Documentação da Linguagem de IA do Azure. Para ver as funcionalidades de reconhecimento de linguagem que dão suporte a vários idiomas no serviço de linguagem, confira Compreensão da linguagem coloquial.

Idiomas compatíveis

O LUIS compreende declarações nos seguintes idiomas:

Idioma Locale Domínio predefinido Entidade predefinida Recomendações da lista de frases **Análise de sentimento e extração de frases-chave
Árabe (versão prévia – árabe moderno padrão) ar-AR - - - -
*Chinês zh-CN -
Holandês nl-NL - -
Inglês (Estados Unidos) en-US
Inglês (Reino Unido) en-GB
Francês (Canadá) fr-CA - - -
Francês (França) fr-FR
Alemão de-DE
Gujarati (versão prévia) gu-IN - - - -
Híndi (versão prévia) hi-IN - - -
Italiano it-IT
*Japonês ja-JP Somente frase principal
Coreano ko-KR - - Somente frase principal
Marathi (versão prévia) mr-IN - - - -
Português (Brasil) pt-BR nem todas as subculturas
Espanhol (México) es-MX -
Espanhol (Espanha) es-ES
Tamil (versão prévia) ta-IN - - - -
Telugu (versão prévia) te-IN - - - -
Turco tr-TR - Sentimento, somente

O suporte aos idiomas varia para entidades predefinidas e domínios predefinidos.

*Notas de suporte ao chinês

  • Na cultura zh-CN, o LUIS espera o conjunto de caracteres de chinês simplificado em vez do conjunto de caracteres tradicional.
  • Os nomes de intenções, entidades, recursos e expressões regulares podem estar em caracteres chineses ou romanos.
  • Veja a Referência a domínios predefinida para obter informações sobre quais domínios predefinidos são compatíveis com a cultura zh-CN.

*Notas de suporte ao japonês

  • Como o LUIS não fornece análise sintática e não compreenderá a diferença entre Keigo e japonês informal, será necessário incorporar os diferentes níveis de formalidade como exemplos de treinamento para os seus aplicativos.
    • でございます não é o mesmo que です.
    • です não é o mesmo que だ.

**Notas de suporte do serviço de linguagem

O serviço de linguagem inclui a análise de sentimento e a entidade predefinida keyPhrase. Só há suporte para subculturas em português: pt-PT e pt-BR. Todas as outras culturas têm suporte no nível de cultura principal.

Idiomas com suporte da API de Fala

Veja Idiomas com suporte de Fala para idiomas no modo de ditado de Fala.

Idiomas com suporte para Verificação Ortográfica do Bing

Veja idiomas com suporte da Verificação Ortográfica do Bing para obter uma lista dos idiomas com suporte e status.

Palavras raras ou estrangeiras em um aplicativo

Na culturaen-us, o LUIS aprende a distinguir mais palavras em inglês, incluindo gírias. Na cultura zh-cn, o LUIS aprende distinguir a maioria dos caracteres chineses. Se você usar uma palavra rara em en-us ou caractere em zh-cn, e você verá que o LUIS não parece capaz de distinguir essa palavra ou caractere, você pode adicionar essa palavra ou caractere a um recurso de lista de frases. Por exemplo, as palavras fora da cultura do aplicativo, ou seja, as palavras estrangeiras, devem ser adicionadas a um recurso de lista de frases.

Idiomas híbridos

Os idiomas híbridos combinam palavras de duas culturas, como inglês e chinês. Não há suporte para esses idiomas no LUIS, pois um aplicativo tem base em uma única cultura.

Geração de tokens

Para executar o aprendizado de máquina, o LUIS divide uma declaração em tokens com base na cultura.

Idioma cada espaço ou caractere especial nível do caractere palavras compostas
Árabe
Chinês
Holandês
Inglês (en-us)
Inglês (en-GB)
Francês (fr-FR)
Francês (fr-CA)
Alemão
Guzerate
Híndi
Italiano
Japonês
Coreano
Marati
Português (Brasil)
Espanhol (es-ES)
Espanhol (es-MX)
Tâmil
Télugo
Turco

Versões personalizadas do criador de token

As seguintes culturas têm versões de criador de token personalizadas:

Cultura Versão Finalidade
Alemão
de-de
1.0.0 Cria tokens de palavras por meio de um criador baseado em machine learning, que tenta dividir palavras compostas nos componentes individuais.
Se um usuário inserir Ich fahre einen krankenwagen como enunciado, ele será convertido em Ich fahre einen kranken wagen. Permitir a marcação de kranken e de wagen independentemente como entidades diferentes.
Alemão
de-de
1.0.2 Cria tokens das palavras dividindo-as em espaços.
Se o usuário inserir Ich fahre einen krankenwagen como enunciado, ele permanecerá como um único token. Portanto, krankenwagen é marcado como uma única entidade.
Holandês
nl-nl
1.0.0 Cria tokens de palavras por meio de um criador baseado em machine learning, que tenta dividir palavras compostas nos componentes individuais.
Se um usuário inserir Ik ga naar de kleuterschool como enunciado, ele será convertido em Ik ga naar de kleuter school. Permitir a marcação de kleuter e de school independentemente como entidades diferentes.
Holandês
nl-nl
1.0.1 Cria tokens das palavras dividindo-as em espaços.
Se o usuário inserir Ik ga naar de kleuterschool como enunciado, ele permanecerá como um único token. Portanto, kleuterschool é marcado como uma única entidade.

Migração entre as versões de gerador de token

A geração de tokens ocorre no nível do aplicativo. Não há suporte para geração de tokens no nível de versão.

Importe o arquivo como um novo aplicativo, em vez de uma versão. Essa ação significa que o novo aplicativo tem uma ID diferente, mas usa a versão do criador de token especificada no arquivo.