Supporto del linguaggio di analisi del sentiment e opinion mining

Articolo
12/19/2023

Usare questo articolo per informazioni sulle lingue supportate dall'analisi del sentiment e dal opinion mining. Sia l'API basata sul cloud che i contenitori Docker supportano le stesse lingue.

Supporto del linguaggio di analisi del sentiment

Totale codici di lingua supportati: 94

Lingua	Codice lingua	Note
Afrikaans	`af`
Albanese	`sq`
Amharico	`am`
arabo	`ar`
Armeno	`hy`
Assamese	`as`
Azerbaigiano	`az`
Basco	`eu`
Bielorussa (nuovo)	`be`
Bengalese	`bn`
Bosniaco	`bs`
Breton (nuovo)	`br`
Bulgaro	`bg`
Birmano	`my`
Catalano	`ca`
Cinese semplificato	`zh-hans`	Accettato anche `zh`
Cinese tradizionale	`zh-hant`
Croato	`hr`
Ceco	`cs`
Danese	`da`
Olandese	`nl`
Inglese	`en`
Esperanto (nuovo)	`eo`
Estone	`et`
Filippino	`fil`
Finlandese	`fi`
Francese	`fr`
Galiziano	`gl`
Georgiano	`ka`
Tedesco	`de`
Greco	`el`
Gujarati	`gu`
Hausa (nuovo)	`ha`
Ebraico	`he`
Hindi	`hi`
Ungherese	`hu`
Indonesiano	`id`
Irlandese	`ga`
Italiano	`it`
Giapponese	`ja`
Javanese (nuovo)	`jv`
Kannada	`kn`
Kazako	`kk`
Khmer	`km`
Coreano	`ko`
Curdo (Kurmanji)	`ku`
kirghiso	`ky`
Lao	`lo`
Latino (nuovo)	`la`
Lettone	`lv`
Lituano	`lt`
Macedone	`mk`
Malgascio	`mg`
Malese	`ms`
Malayalam	`ml`
Marathi	`mr`
Mongolo	`mn`
Nepalese	`ne`
Norvegese	`no`
Odia	`or`
Oromo (nuovo)	`om`
Pashto	`ps`
Persiano	`fa`
Polacco	`pl`
Portoghese (Portogallo)	`pt-PT`	Accettato anche `pt`
Portoghese (Brasile)	`pt-BR`
Punjabi	`pa`
Romeno	`ro`
Russo	`ru`
Sanskrit (nuovo)	`sa`
Gaelico scozzese (nuovo)	`gd`
Serbo	`sr`
Sindhi (nuovo)	`sd`
Sinhala (nuovo)	`si`
Slovacco	`sk`
Sloveno	`sl`
Somalo	`so`
Spagnolo	`es`
Sundanese (nuovo)	`su`
Swahili	`sw`
Svedese	`sv`
Tamil	`ta`
Telugu	`te`
Thai	`th`
Turco	`tr`
Ucraino	`uk`
Urdu	`ur`
Uiguro	`ug`
Uzbeco	`uz`
Vietnamita	`vi`
Gallese	`cy`
Frisiano occidentale (nuovo)	`fy`
Xhosa (nuovo)	`xh`
Yiddish (nuovo)	`yi`

Supporto del linguaggio opinion mining

Totale codici di lingua supportati: 94

Lingua	Codice lingua	Note
Afrikaans (nuovo)	`af`
Albanese (nuovo)	`sq`
Amharico (nuovo)	`am`
arabo	`ar`
Armeno (nuovo)	`hy`
Assamese (nuovo)	`as`
Azero (nuovo)	`az`
Basco (nuovo)	`eu`
Bielorussa (nuovo)	`be`
Bengalese	`bn`
Bosniaco (nuovo)	`bs`
Breton (nuovo)	`br`
Bulgaro (nuovo)	`bg`
Burmese (nuovo)	`my`
Catalano (nuovo)	`ca`
Cinese semplificato	`zh-hans`	Accettato anche `zh`
Cinese (tradizionale) (nuovo)	`zh-hant`
Croato (nuovo)	`hr`
Ceco (nuovo)	`cs`
Danese	`da`
Olandese	`nl`
Inglese	`en`
Esperanto (nuovo)	`eo`
Estone (nuovo)	`et`
Filippino (nuovo)	`fil`
Finlandese	`fi`
Francese	`fr`
Galiziano (nuovo)	`gl`
Georgiano (nuovo)	`ka`
Tedesco	`de`
Greco	`el`
Gujarati (nuovo)	`gu`
Hausa (nuovo)	`ha`
Ebraico (nuovo)	`he`
Hindi	`hi`
Ungherese	`hu`
Indonesiano	`id`
Irlandese (nuovo)	`ga`
Italiano	`it`
Giapponese	`ja`
Javanese (nuovo)	`jv`
Kannada (nuovo)	`kn`
Kazako (nuovo)	`kk`
Khmer (nuovo)	`km`
Coreano	`ko`
Curdo (Kurmanji)	`ku`
Kirghizistan (nuovo)	`ky`
Lao (nuovo)	`lo`
Latino (nuovo)	`la`
Lettone (nuovo)	`lv`
Lituano (nuovo)	`lt`
Macedone (nuovo)	`mk`
Malagasy (nuovo)	`mg`
Malese (nuovo)	`ms`
Malayalam (nuovo)	`ml`
Marathi	`mr`
Mongolo (nuovo)	`mn`
Nepalese (nuovo)	`ne`
Norvegese	`no`
Odia (nuovo)	`or`
Oromo (nuovo)	`om`
Pashto (nuovo)	`ps`
Persiano (nuovo)	`fa`
Polacco	`pl`
Portoghese (Portogallo)	`pt-PT`	Accettato anche `pt`
Portoghese (Brasile)	`pt-BR`
Punjabi (nuovo)	`pa`
Romeno (nuovo)	`ro`
Russo	`ru`
Sanskrit (nuovo)	`sa`
Gaelico scozzese (nuovo)	`gd`
Serbo (nuovo)	`sr`
Sindhi (nuovo)	`sd`
Sinhala (nuovo)	`si`
Slovacco (nuovo)	`sk`
Sloveno (nuovo)	`sl`
Somali (nuovo)	`so`
Spagnolo	`es`
Sundanese (nuovo)	`su`
Swahili (nuovo)	`sw`
Svedese	`sv`
Tamil	`ta`
Telugu	`te`
Thai (nuovo)	`th`
Turco	`tr`
Ucraino (nuovo)	`uk`
Urdu (nuovo)	`ur`
Uyghur (nuovo)	`ug`
Uzbeko (nuovo)	`uz`
Vietnamita (nuovo)	`vi`
Welsh (nuovo)	`cy`
Frisiano occidentale (nuovo)	`fy`
Xhosa (nuovo)	`xh`
Yiddish (nuovo)	`yi`

Opzione multilingue (solo analisi del sentiment personalizzata)

Con l'analisi del sentiment personalizzata è possibile eseguire il training di un modello in una lingua e usare per classificare i documenti in un'altra lingua. Questa funzionalità è utile perché consente di risparmiare tempo e fatica. Anziché compilare progetti separati per ogni linguaggio, è possibile gestire un set di dati multilingue in un unico progetto. Il set di dati non deve trovarsi interamente nella stessa lingua, ma è necessario abilitare l'opzione multilingue per il progetto durante la creazione o una versione successiva nelle impostazioni del progetto. Se si nota che il modello ha prestazioni scarse in determinate lingue durante il processo di valutazione, è consigliabile aggiungere altri dati in queste lingue al set di training.

È possibile eseguire il training del progetto interamente con documenti in inglese ed eseguirne una query in: francese, tedesco, mandarino, giapponese, coreano e altri. L'analisi del sentiment personalizzata semplifica la scalabilità dei progetti in più lingue usando la tecnologia multilingue per eseguire il training dei modelli.

Ogni volta che si identifica che una determinata lingua non funziona così come altre lingue, è possibile aggiungere altri documenti per tale lingua nel progetto.

Non si prevede di aggiungere lo stesso numero di documenti per ogni lingua. È consigliabile creare la maggior parte del progetto in una sola lingua e aggiungere solo alcuni documenti nelle lingue osservate non funzionano correttamente. Se si crea un progetto che si trova principalmente in inglese e si inizia a testarlo in francese, tedesco e spagnolo, si potrebbe osservare che il tedesco non funziona così come le altre due lingue. In tal caso, è consigliabile aggiungere il 5% dei documenti originali in inglese in tedesco, eseguire di nuovo il training di un nuovo modello e testare in tedesco. Dovrebbero essere visualizzati risultati migliori per le query tedesche. Più documenti etichettati si aggiungono, più probabilmente i risultati saranno migliori.

Quando si aggiungono dati in un'altra lingua, non è consigliabile che influisca negativamente su altre lingue.

Passaggi successivi

come chiamare l'API per altre informazioni.
Guida introduttiva: Usare la libreria client di Analisi del sentiment e l'API REST

Supporto del linguaggio di analisi del sentiment e opinion mining