Языковая поддержка анализа тональности и интеллектуального анализа мнений

В данной статье рассматривается, какие языки поддерживаются анализом тональности и интеллектуальным анализом мнений. Как облачные API, так и контейнеры Docker поддерживают одни и те же языки.

Языковая поддержка анализа тональности

Всего поддерживаемых языковых кодов: 94

Язык Код языка Примечания.
Африкаанс af
Албанский sq
Амхарский am
Арабский ar
Армянский hy
Ассамский as
Азербайджанский az
Баскский eu
Белорусский (новый) be
Бенгальский bn
Боснийский bs
Бретон (новое) br
Болгарский bg
Бирманский my
Каталонский ca
Китайский (упрощенное письмо) zh-hans Также допускается zh
Китайский (традиционное письмо) zh-hant
Хорватский hr
Чешский cs
датский da
Голландский nl
Английский en
Esperanto (new) eo
Эстонский et
Филиппинский fil
Финский fi
французский fr
Галисийский gl
Грузинский ka
немецкий de
Греческий el
Гуджарати gu
Хауса (новая) ha
Иврит he
Хинди hi
Венгерский hu
Индонезийский id
Ирландский ga
Итальянский it
Японский ja
Javanese (новое) jv
Каннада kn
Казахский kk
Кхмерский km
Корейский ko
Курдский (Курманжи) ku
Киргизский ky
Лаосский lo
Латиница (новая) la
Латышский lv
Литовский lt
Macedonian mk
Малагасийский mg
Малайский ms
Малаялам ml
Маратхи mr
Монгольский mn
Непальский ne
Норвежский no
Ория or
Оромо (новое) om
Пушту ps
Персидский fa
Польский pl
Португальский (Португалия) pt-PT Также допускается pt
португальский (Бразилия) pt-BR
Панджаби pa
Румынский ro
Русский ru
Санскрит (новое) sa
Шотландский Гейлик (новое) gd
Сербский sr
Синдхи (новое) sd
Синхала (новая) si
Словацкий sk
Словенский sl
Сомалийский so
Испанский es
Sundanese (новое) su
Суахили sw
Шведский sv
Тамильский ta
Телугу te
Тайский th
Турецкий tr
Украинский uk
Урду ur
Уйгурский ug
Узбекский uz
Вьетнамский vi
Валлийский cy
Западный Фризиан (новое) fy
Xhosa (new) xh
Yiddish (new) yi

Языковая поддержка интеллектуального анализа мнений

Всего поддерживаемых языковых кодов: 94

Язык Код языка Примечания.
Afrikaans (new) af
Албанский (новый) sq
Амхарич (новое) am
Арабский ar
Армянский (новый) hy
Assamese (new) as
Азербайджан (новое) az
Баск (новая) eu
Белорусский (новый) be
Бенгальский bn
Боснийский (новый) bs
Бретон (новое) br
Болгарский (новый) bg
Бирмский (новый) my
Каталонский (новый) ca
Китайский (упрощенное письмо) zh-hans Также допускается zh
Китайский (традиционное) (новое) zh-hant
Хорватский (новый) hr
Чешская (новая) cs
датский da
Голландский nl
Английский en
Esperanto (new) eo
Эстония (новая) et
Филиппино (новое) fil
Финский fi
французский fr
Галицийский (новый) gl
Грузин (новое) ka
немецкий de
Греческий el
Гуджарати (новое) gu
Хауса (новая) ha
Иврит (новое) he
Хинди hi
Венгерский hu
Индонезийский id
Ирландский (новый) ga
Итальянский it
Японский ja
Javanese (новое) jv
Каннада (новая) kn
Казах (новое) kk
Кхмер (новая) km
Корейский ko
Курдский (Курманжи) ku
Киргиз (новое) ky
Лаос (новое) lo
Латиница (новая) la
Латышский (новый) lv
Литовец (новое) lt
Македонский (новый) mk
Малагаси (новое) mg
Малайский (новый) ms
Малаялам (новая) ml
Маратхи mr
Монгольский (новый) mn
Непали (новое) ne
Норвежский no
Одия (новая) or
Оромо (новое) om
Пашто (новое) ps
Персидский (новый) fa
Польский pl
Португальский (Португалия) pt-PT Также допускается pt
португальский (Бразилия) pt-BR
Пенджаби (новое) pa
Румын (новое) ro
русском языке ru
Санскрит (новое) sa
Шотландский Гейлик (новое) gd
Сербский (новый) sr
Синдхи (новое) sd
Синхала (новая) si
Словацкий (новый) sk
Словен (новое) sl
Сомалийский (новый) so
Испанский es
Sundanese (новое) su
Swahili (new) sw
Шведский sv
Тамильский ta
Телугу te
Тайский (новое) th
Турецкий tr
Украинский (новый) uk
Урду (новое) ur
Уйгур (новое) ug
Узбекистан (новое) uz
Вьетнамские (новые) vi
Валлийский (новый) cy
Западный Фризиан (новое) fy
Xhosa (new) xh
Yiddish (new) yi

Многоязычный параметр (только для анализа пользовательских тональности)

С помощью пользовательского анализа тональности можно обучить модель на одном языке и использовать для классификации документов на другом языке. Эта функция очень полезна, так как позволяет экономить время и усилия. Она устраняет необходимость создавать отдельные проекты для каждого языка, и в одном проекте можно использовать многоязычный набор данных. Набор данных не обязательно должен быть построен на одном языке, но при создании проекта или позже в параметрах проекта необходимо включить параметр многоязычности. Если при оценивании вы определили, что модель плохо работает на определенных языках, рассмотрите добавление дополнительных данных на таких языках в набор для обучения.

Вы можете полностью обучить свой проект документам на английском языке и запрашивать его на французском, немецком, китайском, японском, корейском и других языках. Пользовательский анализ тональности упрощает масштабирование проектов на нескольких языках с помощью многоязычной технологии для обучения моделей.

Когда вы обнаружите, что определенный язык работает не так хорошо, как другие языки, вы можете добавить документы для этого языка в свой проект.

Вы не должны добавлять одинаковое количество документов для каждого языка. Вы должны создать большую часть проекта на одном языке и добавить лишь несколько документов на тех языках, которые работают не очень хорошо. Если вы создадите проект преимущественно на английском языке и начнете тестировать его на французском, немецком и испанском языках, вы можете заметить, что немецкий язык работает не так хорошо, как два других языка. В этом случае попробуйте добавить 5 % исходных английских документов на немецком языке, обучите новую модель и снова протестируйте на немецком языке. Вы должны получить лучшие результаты для запросов на немецком языке. Чем больше документов с метками вы добавите, тем больше вероятность того, что результаты станут лучше.

Когда вы добавляете данные на другом языке, не стоит опасаться, что они негативно повлияют на остальные языки.

Следующие шаги