Supporto del linguaggio di analisi del sentiment e opinion mining

Usare questo articolo per informazioni sulle lingue supportate dall'analisi del sentiment e dal opinion mining. Sia l'API basata sul cloud che i contenitori Docker supportano le stesse lingue.

Supporto del linguaggio di analisi del sentiment

Totale codici di lingua supportati: 94

Lingua Codice lingua Note
Afrikaans af
Albanese sq
Amharico am
arabo ar
Armeno hy
Assamese as
Azerbaigiano az
Basco eu
Bielorussa (nuovo) be
Bengalese bn
Bosniaco bs
Breton (nuovo) br
Bulgaro bg
Birmano my
Catalano ca
Cinese semplificato zh-hans Accettato anche zh
Cinese tradizionale zh-hant
Croato hr
Ceco cs
Danese da
Olandese nl
Inglese en
Esperanto (nuovo) eo
Estone et
Filippino fil
Finlandese fi
Francese fr
Galiziano gl
Georgiano ka
Tedesco de
Greco el
Gujarati gu
Hausa (nuovo) ha
Ebraico he
Hindi hi
Ungherese hu
Indonesiano id
Irlandese ga
Italiano it
Giapponese ja
Javanese (nuovo) jv
Kannada kn
Kazako kk
Khmer km
Coreano ko
Curdo (Kurmanji) ku
kirghiso ky
Lao lo
Latino (nuovo) la
Lettone lv
Lituano lt
Macedone mk
Malgascio mg
Malese ms
Malayalam ml
Marathi mr
Mongolo mn
Nepalese ne
Norvegese no
Odia or
Oromo (nuovo) om
Pashto ps
Persiano fa
Polacco pl
Portoghese (Portogallo) pt-PT Accettato anche pt
Portoghese (Brasile) pt-BR
Punjabi pa
Romeno ro
Russo ru
Sanskrit (nuovo) sa
Gaelico scozzese (nuovo) gd
Serbo sr
Sindhi (nuovo) sd
Sinhala (nuovo) si
Slovacco sk
Sloveno sl
Somalo so
Spagnolo es
Sundanese (nuovo) su
Swahili sw
Svedese sv
Tamil ta
Telugu te
Thai th
Turco tr
Ucraino uk
Urdu ur
Uiguro ug
Uzbeco uz
Vietnamita vi
Gallese cy
Frisiano occidentale (nuovo) fy
Xhosa (nuovo) xh
Yiddish (nuovo) yi

Supporto del linguaggio opinion mining

Totale codici di lingua supportati: 94

Lingua Codice lingua Note
Afrikaans (nuovo) af
Albanese (nuovo) sq
Amharico (nuovo) am
arabo ar
Armeno (nuovo) hy
Assamese (nuovo) as
Azero (nuovo) az
Basco (nuovo) eu
Bielorussa (nuovo) be
Bengalese bn
Bosniaco (nuovo) bs
Breton (nuovo) br
Bulgaro (nuovo) bg
Burmese (nuovo) my
Catalano (nuovo) ca
Cinese semplificato zh-hans Accettato anche zh
Cinese (tradizionale) (nuovo) zh-hant
Croato (nuovo) hr
Ceco (nuovo) cs
Danese da
Olandese nl
Inglese en
Esperanto (nuovo) eo
Estone (nuovo) et
Filippino (nuovo) fil
Finlandese fi
Francese fr
Galiziano (nuovo) gl
Georgiano (nuovo) ka
Tedesco de
Greco el
Gujarati (nuovo) gu
Hausa (nuovo) ha
Ebraico (nuovo) he
Hindi hi
Ungherese hu
Indonesiano id
Irlandese (nuovo) ga
Italiano it
Giapponese ja
Javanese (nuovo) jv
Kannada (nuovo) kn
Kazako (nuovo) kk
Khmer (nuovo) km
Coreano ko
Curdo (Kurmanji) ku
Kirghizistan (nuovo) ky
Lao (nuovo) lo
Latino (nuovo) la
Lettone (nuovo) lv
Lituano (nuovo) lt
Macedone (nuovo) mk
Malagasy (nuovo) mg
Malese (nuovo) ms
Malayalam (nuovo) ml
Marathi mr
Mongolo (nuovo) mn
Nepalese (nuovo) ne
Norvegese no
Odia (nuovo) or
Oromo (nuovo) om
Pashto (nuovo) ps
Persiano (nuovo) fa
Polacco pl
Portoghese (Portogallo) pt-PT Accettato anche pt
Portoghese (Brasile) pt-BR
Punjabi (nuovo) pa
Romeno (nuovo) ro
Russo ru
Sanskrit (nuovo) sa
Gaelico scozzese (nuovo) gd
Serbo (nuovo) sr
Sindhi (nuovo) sd
Sinhala (nuovo) si
Slovacco (nuovo) sk
Sloveno (nuovo) sl
Somali (nuovo) so
Spagnolo es
Sundanese (nuovo) su
Swahili (nuovo) sw
Svedese sv
Tamil ta
Telugu te
Thai (nuovo) th
Turco tr
Ucraino (nuovo) uk
Urdu (nuovo) ur
Uyghur (nuovo) ug
Uzbeko (nuovo) uz
Vietnamita (nuovo) vi
Welsh (nuovo) cy
Frisiano occidentale (nuovo) fy
Xhosa (nuovo) xh
Yiddish (nuovo) yi

Opzione multilingue (solo analisi del sentiment personalizzata)

Con l'analisi del sentiment personalizzata è possibile eseguire il training di un modello in una lingua e usare per classificare i documenti in un'altra lingua. Questa funzionalità è utile perché consente di risparmiare tempo e fatica. Anziché compilare progetti separati per ogni linguaggio, è possibile gestire un set di dati multilingue in un unico progetto. Il set di dati non deve trovarsi interamente nella stessa lingua, ma è necessario abilitare l'opzione multilingue per il progetto durante la creazione o una versione successiva nelle impostazioni del progetto. Se si nota che il modello ha prestazioni scarse in determinate lingue durante il processo di valutazione, è consigliabile aggiungere altri dati in queste lingue al set di training.

È possibile eseguire il training del progetto interamente con documenti in inglese ed eseguirne una query in: francese, tedesco, mandarino, giapponese, coreano e altri. L'analisi del sentiment personalizzata semplifica la scalabilità dei progetti in più lingue usando la tecnologia multilingue per eseguire il training dei modelli.

Ogni volta che si identifica che una determinata lingua non funziona così come altre lingue, è possibile aggiungere altri documenti per tale lingua nel progetto.

Non si prevede di aggiungere lo stesso numero di documenti per ogni lingua. È consigliabile creare la maggior parte del progetto in una sola lingua e aggiungere solo alcuni documenti nelle lingue osservate non funzionano correttamente. Se si crea un progetto che si trova principalmente in inglese e si inizia a testarlo in francese, tedesco e spagnolo, si potrebbe osservare che il tedesco non funziona così come le altre due lingue. In tal caso, è consigliabile aggiungere il 5% dei documenti originali in inglese in tedesco, eseguire di nuovo il training di un nuovo modello e testare in tedesco. Dovrebbero essere visualizzati risultati migliori per le query tedesche. Più documenti etichettati si aggiungono, più probabilmente i risultati saranno migliori.

Quando si aggiungono dati in un'altra lingua, non è consigliabile che influisca negativamente su altre lingue.

Passaggi successivi