Análise de sentimento e suporte à linguagem de mineração de opinião

Use este artigo para saber quais idiomas são suportados pela Análise de Sentimento e Mineração de Opinião. Tanto a API baseada na nuvem quanto os contêineres do Docker oferecem suporte aos mesmos idiomas.

Suporte ao idioma da Análise de Sentimento

Total de códigos de idiomas suportados: 94

Linguagem Código de idioma Notas
Afrikaans af
Albanês sq
Amárico am
Árabe ar
Arménio hy
Assamês as
Azerbaijão az
Basco eu
Bielorrusso (novo) be
Bengalês bn
Bósnio bs
Bretão (novo) br
Búlgaro bg
Birmanês my
Catalão ca
Chinês (Simplificado) zh-hans zh também aceito
Chinês (Tradicional) zh-hant
Croata hr
Checo cs
Dinamarquês da
Neerlandês nl
Português en
Esperanto (novo) eo
Estónio et
Filipino fil
Finlandês fi
Francês fr
Galego gl
Georgiano ka
Alemão de
Grego el
Guzerate gu
Hausa (novo) ha
Hebraico he
Hindi hi
Húngaro hu
Indonésio id
Irlandês ga
Italiano it
Japonês ja
Javanês (novo) jv
Canarês kn
Cazaque kk
Khmer km
Coreano ko
Curdo (Kurmanji) ku
Quirguiz ky
Laos lo
Latim (novo) la
Letão lv
Lituano lt
Macedónio mk
Malgaxe mg
Malaio ms
Malaiala ml
Marata mr
Mongol mn
Nepalês ne
Norueguês no
Odia or
Oromo (novo) om
Pashto ps
Persa fa
Polaco pl
Português (Portugal) pt-PT pt também aceito
Português (Brasil) pt-BR
Punjabi pa
Romeno ro
Russo ru
Sânscrito (novo) sa
Gaélico escocês (novo) gd
Sérvio sr
Sindhi (novo) sd
Cingalês (novo) si
Eslovaco sk
Esloveno sl
Somália so
Espanhol es
Sundanês (novo) su
Suaíli sw
Sueco sv
Tâmil ta
Telugu te
Tailandês th
Turco tr
Ucraniano uk
Urdu ur
Uigur ug
Usbeque uz
Vietnamita vi
Galês cy
Frísio Ocidental (novo) fy
Xhosa (novo) xh
Iídiche (novo) yi

Suporte linguístico de mineração de opinião

Total de códigos de idiomas suportados: 94

Linguagem Código de idioma Notas
Africâner (novo) af
Albanês (novo) sq
Amárico (novo) am
Árabe ar
Arménio (novo) hy
Assamese (novo) as
Azerbaijão (novo) az
Basco (novo) eu
Bielorrusso (novo) be
Bengalês bn
Bósnio (novo) bs
Bretão (novo) br
Búlgaro (novo) bg
Birmanês (novo) my
Catalão (novo) ca
Chinês (Simplificado) zh-hans zh também aceito
Chinês (tradicional) (novo) zh-hant
Croata (novo) hr
Checo (novo) cs
Dinamarquês da
Neerlandês nl
Português en
Esperanto (novo) eo
Estónio (novo) et
Filipino (novo) fil
Finlandês fi
Francês fr
Galego (novo) gl
Georgiano (novo) ka
Alemão de
Grego el
Gujarati (novo) gu
Hausa (novo) ha
Hebraico (novo) he
Hindi hi
Húngaro hu
Indonésio id
Irlandês (novo) ga
Italiano it
Japonês ja
Javanês (novo) jv
Kannada (novo) kn
Cazaque (novo) kk
Khmer (novo) km
Coreano ko
Curdo (Kurmanji) ku
Quirguistão (novo) ky
Laos (novo) lo
Latim (novo) la
Letão (novo) lv
Lituano (novo) lt
Macedónio (novo) mk
Malgaxe (novo) mg
Malaio (novo) ms
Malaiala (novo) ml
Marata mr
Mongol (novo) mn
Nepalês (novo) ne
Norueguês no
Odia (novo) or
Oromo (novo) om
Pashto (novo) ps
Persa (novo) fa
Polaco pl
Português (Portugal) pt-PT pt também aceito
Português (Brasil) pt-BR
Punjabi (novo) pa
Romeno (novo) ro
Russo ru
Sânscrito (novo) sa
Gaélico escocês (novo) gd
Sérvio (novo) sr
Sindhi (novo) sd
Cingalês (novo) si
Eslovaco (novo) sk
Esloveno (novo) sl
Somali (novo) so
Espanhol es
Sundanês (novo) su
Swahili (novo) sw
Sueco sv
Tâmil ta
Telugu te
Tailandês (novo) th
Turco tr
Ucraniano (novo) uk
Urdu (novo) ur
Uigur (novo) ug
Usbeque (novo) uz
Vietnamita (novo) vi
Galês (novo) cy
Frísio Ocidental (novo) fy
Xhosa (novo) xh
Iídiche (novo) yi

Opção multilingue (apenas análise de sentimento personalizada)

Com a análise de sentimento personalizada, você pode treinar um modelo em um idioma e usar para classificar documentos em outro idioma. Este recurso é útil porque ajuda a economizar tempo e esforço. Em vez de criar projetos separados para cada idioma, você pode lidar com conjuntos de dados multilíngues em um projeto. Seu conjunto de dados não precisa estar totalmente no mesmo idioma, mas você deve habilitar a opção multilíngue para seu projeto durante a criação ou posterior nas configurações do projeto. Se notar que o seu modelo tem um desempenho fraco em determinadas línguas durante o processo de avaliação, considere adicionar mais dados nessas línguas ao seu conjunto de formação.

Você pode treinar seu projeto inteiramente com documentos em inglês e consultá-lo em: francês, alemão, mandarim, japonês, coreano e outros. A análise de sentimento personalizada facilita a escala de seus projetos para vários idiomas usando tecnologia multilíngue para treinar seus modelos.

Sempre que identificar que uma determinada língua não está a funcionar tão bem como outras línguas, pode adicionar mais documentos para essa língua no seu projeto.

Não se espera que adicione o mesmo número de documentos para todos os idiomas. Você deve construir a maioria do seu projeto em um idioma e adicionar apenas alguns documentos em idiomas que você observa que não estão tendo um bom desempenho. Se você criar um projeto principalmente em inglês e começar a testá-lo em francês, alemão e espanhol, poderá observar que o alemão não funciona tão bem quanto os outros dois idiomas. Nesse caso, considere adicionar 5% dos seus documentos originais em inglês em alemão, treinar um novo modelo e testar novamente em alemão. Você deve ver melhores resultados para consultas alemãs. Quanto mais documentos rotulados você adicionar, maior a probabilidade de os resultados melhorarem.

Quando você adiciona dados em outro idioma, não deve esperar que isso afete negativamente outros idiomas.

Próximos passos