Suporte a idiomas da Visão de IA do Azure
Algumas funcionalidades da Visão de IA do Azure dão suporte a vários idiomas. Todas as funcionalidades não mencionadas aqui só dão suporte ao inglês.
OCR (reconhecimento óptico de caracteres)
A API de Leitura da Visão de IA do Azure dá suporte a muitos idiomas. A API Read
pode extrair texto de imagens e documentos com idiomas variados, incluindo da mesma linha de texto, sem exigir um parâmetro de idioma.
Observação
Código de idioma opcional
Os modelos universais baseados em aprendizado profundo de OCR Read
extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas variados, e não exigem a especificação de um código de idioma. Não forneça o código de idioma como o parâmetro, a menos que você tenha certeza sobre o idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço poderá retornar texto incompleto e incorreto.
Confira Como especificar o modelo Read
para usar os novos idiomas.
Texto manuscrito
A tabela a seguir lista os idiomas de OCR de texto manuscrito compatíveis com o modelo Read
GA mais recente.
Idioma | Código de idioma (opcional) | Idioma | Código de idioma (opcional) |
---|---|---|---|
Inglês | en |
Japonês | ja |
Chinês simplificado | zh-Hans |
Coreano | ko |
Francês | fr |
Português | pt |
Alemão | de |
Espanhol | es |
Italiano | it |
Texto impresso
A tabela a seguir lista os idiomas de OCR de texto impresso compatíveis com o modelo Read
GA mais recente.
Idioma | Código (opcional) | Idioma | Código (opcional) |
---|---|---|---|
Africâner | af |
Khasi | kha |
Albanês | sq |
Quiché | quc |
Angika (Devanagiri) | anp |
Coreano | ko |
Árabe | ar |
Korku | kfq |
Asturiano | ast |
koryak | kpy |
Hindi Awadhi (Devanagiri) | awa |
kosraean | kos |
Azerbaidjano (Latino) | az |
kumyk (cirílico) | kum |
Bagheli | bfy |
Curdo (árabe) | ku-arab |
Basco | eu |
Curdo (latino) | ku-latn |
bielorrusso (cirílico) | be , be-cyrl |
Kurux (Devanagiri) | kru |
bielorrusso (latino) | be , be-latn |
quirguiz (cirílico) | ky |
Hindi Bhojpuri (Devanagiri) | bho |
Lakota | lkt |
Bislama | bi |
Latim | la |
Bodo (Devanagiri) | brx |
Lituano | lt |
Bósnio (latim) | bs |
baixo sorábio | dsb |
Brajbha | bra |
sami de Lule | smj |
Bretão | br |
Luxemburguês | lb |
Búlgaro | bg |
Mahasu Pahari (Devanagiri) | bfz |
Bundeli | bns |
Malaio (latino) | ms |
buryat (cirílico) | bua |
Maltês | mt |
Catalão | ca |
Malto (Devanagiri) | kmj |
Cebuano | ceb |
Manx | gv |
Chamling | rab |
Maori | mi |
Chamorro | ch |
Marati | mr |
Chhattisgarhi (Devanagiri) | hne |
Mongol (Cirílico) | mn |
Chinês simplificado | zh-Hans |
montenegrino (cirílico) | cnr-cyrl |
Chinês (tradicional) | zh-Hant |
montenegrino (latino) | cnr-latn |
Córnico | kw |
Napolitano | nap |
Corso | co |
Nepali | ne |
Tártaro da Crimeia (latim) | crh |
niueano | niu |
Croata | hr |
nogay | nog |
Tcheco | cs |
sami setentrional (latino) | sme |
Dinamarquês | da |
Norueguês | no |
Dari | prs |
Occitânico | oc |
Dhimal (Devanagiri) | dhi |
osseto | os |
Dogri (Devanagiri) | doi |
Pashto | ps |
Holandês | nl |
Persa | fa |
Inglês | en |
Polonês | pl |
erzya (cirílico) | myv |
Português | pt |
Estoniano | et |
Punjabi (Árabe) | pa |
Faroês | fo |
ripuário | ksh |
Fijiano | fj |
Romeno | ro |
Filipino | fil |
Romanche | rm |
Finlandês | fi |
Russo | ru |
Francês | fr |
Sadri (Devanagiri) | sck |
Friuliano | fur |
samoano (latino) | sm |
gagauz (latino) | gag |
Sanskrit (Devanagari) | sa |
Galego | gl |
Santali(Devanagiri) | sat |
Alemão | de |
Escocês | sco |
Gilbertês | gil |
Gaélico escocês | gd |
Gondi (Devanagiri) | gon |
Sérvio (latino) | sr , sr-latn |
Groenlandês | kl |
Sherpa (Devanagiri) | xsr |
Gurung (Devanagiri) | gvr |
Sirmauri (Devanagiri) | srx |
Crioulo haitiano | ht |
sami de Skolt | sms |
Halbi (Devanagiri) | hlb |
Eslovaco | sk |
Hani | hni |
Esloveno | sl |
Haryanvi | bgc |
Somali (árabe) | so |
havaiano | haw |
sami do sul | sma |
Híndi | hi |
Espanhol | es |
Hmong daw (latim) | mww |
Suaíli (latim) | sw |
Ho(Devanagiri) | hoc |
Sueco | sv |
Húngaro | hu |
Tadjique (Cirílico) | tg |
Islandês | is |
Tártaro (latim) | tt |
sami de Inari | smn |
Tetum | tet |
Indonésio | id |
Thani | thf |
Interlíngua | ia |
Tongan | to |
Inuktitut (Latino) | iu |
Turco | tr |
Irlandês | ga |
turcomeno (latino) | tk |
Italiano | it |
Tuva | tyv |
Japonês | ja |
Alto sorábio | hsb |
Jaunsari (Devanagiri) | Jns |
Urdu | ur |
Javanês | jv |
Uigur (árabe) | ug |
Kabuverdianu | kea |
Usbeque (árabe) | uz-arab |
Kachin (latim) | kac |
Uzbeque (cirílico) | uz-cyrl |
Kangri (Devanagiri) | xnr |
Uzbeque (latino) | uz |
Karachay-Balkar | krc |
Volapuque | vo |
kara-kalpak (cirílico) | kaa-cyrl |
Walser | wae |
Caracalpaque (latino) | kaa |
Galês | cy |
Cashubiano | csb |
Frísio ocidental | fy |
cazaque (cirílico) | kk-cyrl |
Yucatec Maya | yua |
cazaque (latino) | kk-latn |
Zuangue | za |
Khaling | klr |
Zulu | zu |
Analisar a imagem
Algumas funcionalidades da API de Análise – Imagem podem retornar resultados em outros idiomas, especificados com o parâmetro de consulta language
. Outras ações retornam resultados em inglês, independentemente do idioma especificado, e outras geram uma exceção para idiomas sem suporte. As ações são especificadas com os parâmetros de consulta visualFeatures
e details
. Confira a Visão geral para obter uma lista de todas as ações que você pode fazer com a análise de imagem. Os idiomas para marcação só estão disponíveis na versão de API 3.2 ou posterior.
Linguagem | Código de idioma | Categorias | Marcações | Descrição | Adulto | Marcas | Cor | Faces | ImageType | Objetos | Celebridades | Pontos de referência | Legendas/legendas densas |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Árabe | ar |
✅ | |||||||||||
Azerbaidjano | az |
✅ | |||||||||||
Búlgaro | bg |
✅ | |||||||||||
Bósnio Latim | bs |
✅ | |||||||||||
Catalão | ca |
✅ | |||||||||||
Tcheco | cs |
✅ | |||||||||||
Galês | cy |
✅ | |||||||||||
Dinamarquês | da |
✅ | |||||||||||
Alemão | de |
✅ | |||||||||||
Grego | el |
✅ | |||||||||||
Inglês | en |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Espanhol | es |
✅ | ✅ | ✅ | ✅ | ✅ | |||||||
Estoniano | et |
✅ | |||||||||||
Basco | eu |
✅ | |||||||||||
Finlandês | fi |
✅ | |||||||||||
Francês | fr |
✅ | |||||||||||
Irlandês | ga |
✅ | |||||||||||
Galego | gl |
✅ | |||||||||||
Hebraico | he |
✅ | |||||||||||
Híndi | hi |
✅ | |||||||||||
Croata | hr |
✅ | |||||||||||
Húngaro | hu |
✅ | |||||||||||
Indonésio | id |
✅ | |||||||||||
Italiano | it |
✅ | |||||||||||
Japonês | ja |
✅ | ✅ | ✅ | ✅ | ✅ | |||||||
Cazaque | kk |
✅ | |||||||||||
Coreano | ko |
✅ | |||||||||||
Lituano | lt |
✅ | |||||||||||
Letão | lv |
✅ | |||||||||||
Macedônio | mk |
✅ | |||||||||||
Malaio Malásia | ms |
✅ | |||||||||||
Norueguês (Bokmal) | nb |
✅ | |||||||||||
Holandês | nl |
✅ | |||||||||||
Polonês | pl |
✅ | |||||||||||
Dari | prs |
✅ | |||||||||||
Português-Brasil | pt-BR |
✅ | |||||||||||
Português-Portugal | pt |
✅ | ✅ | ✅ | ✅ | ✅ | |||||||
Português-Portugal | pt-PT |
✅ | |||||||||||
Romeno | ro |
✅ | |||||||||||
Russo | ru |
✅ | |||||||||||
Eslovaco | sk |
✅ | |||||||||||
Esloveno | sl |
✅ | |||||||||||
Sérvio - Cirílico RS | sr-Cryl |
✅ | |||||||||||
Sérvio - Latim RS | sr-Latn |
✅ | |||||||||||
Sueco | sv |
✅ | |||||||||||
Tailandês | th |
✅ | |||||||||||
Turco | tr |
✅ | |||||||||||
Ucraniano | uk |
✅ | |||||||||||
Vietnamita | vi |
✅ | |||||||||||
Chinês simplificado | zh |
✅ | ✅ | ✅ | ✅ | ✅ | |||||||
Chinês simplificado | zh-Hans |
✅ | |||||||||||
Chinês tradicional | zh-Hant |
✅ |
Inserções multimodal
O modelo de inserções multimodal mais recente dá suporte à busca em vetores em muitos idiomas. O modelo original dá suporte apenas ao inglês. As imagens que são vetorizadas no modelo somente em inglês não são compatíveis com as pesquisas de texto no modelo multilíngue.
Linguagem | Código do idioma | 2023-04-15 model |
2022-04-11 model |
---|---|---|---|
Africâner | af |
✅ | |
Amárico | am |
✅ | |
Árabe | ar |
✅ | |
Armênia | hy |
✅ | |
Assamês | as |
✅ | |
Asturiano | ast |
✅ | |
Azerbaidjano | az |
✅ | |
Bielorrusso | be |
✅ | |
Bengali | bn |
✅ | |
Bósnio | bs |
✅ | |
Búlgaro | bg |
✅ | |
Birmanês | my |
✅ | |
Catalão | ca |
✅ | |
Cebuano | ceb |
✅ | |
Chinês simplificado | zho |
✅ | |
Chinês tradicional | zho |
✅ | |
Croata | hr |
✅ | |
Tcheco | cs |
✅ | |
Dinamarquês | da |
✅ | |
Holandês | nl |
✅ | |
Inglês | en |
✅ | ✅ |
Estoniano | et |
✅ | |
Filipino (Tagalog) | tl |
✅ | |
Finlandês | fi |
✅ | |
Francês | fr |
✅ | |
Fulah | ff |
✅ | |
Galego | gl |
✅ | |
Ganda | lg |
✅ | |
Georgiano | ka |
✅ | |
Alemão | de |
✅ | |
Grego | el |
✅ | |
Guzerate | gu |
✅ | |
Hausa | ha |
✅ | |
Hebraico | he |
✅ | |
Híndi | hi |
✅ | |
Húngaro | hu |
✅ | |
Islandês | is |
✅ | |
Igbo | ig |
✅ | |
Indonésio | id |
✅ | |
Irlandês | ga |
✅ | |
Italiano | it |
✅ | |
Japonês | ja |
✅ | |
Javanês | jv |
✅ | |
Kabuverdianu | kea |
✅ | |
Kamba | kam |
✅ | |
canarim | kn |
✅ | |
Cazaque | kk |
✅ | |
Khmer | km |
✅ | |
Coreano | ko |
✅ | |
Kyrgyz | ky |
✅ | |
Lao | lo |
✅ | |
Letão | lv |
✅ | |
Lingala | ln |
✅ | |
Lituano | lt |
✅ | |
Luo | luo |
✅ | |
Luxemburguês | lb |
✅ | |
Macedônio | mk |
✅ | |
Malaio | ms |
✅ | |
Malaiala | ml |
✅ | |
Maltês | mt |
✅ | |
Maori | mi |
✅ | |
Marati | mr |
✅ | |
Mongol | mn |
✅ | |
Nepali | ne |
✅ | |
Soto do Norte | ns |
✅ | |
Norueguês | no |
✅ | |
Nianja | ny |
✅ | |
Occitânico | oc |
✅ | |
Oriya | or |
✅ | |
Oromo | om |
✅ | |
Pashto | ps |
✅ | |
Persa | fa |
✅ | |
Polonês | pl |
✅ | |
Português (Brasil) | pt |
✅ | |
Panjabi | pa |
✅ | |
Romeno | ro |
✅ | |
Russo | ru |
✅ | |
Sérvio | sr |
✅ | |
Shona | sn |
✅ | |
Sindhi | sd |
✅ | |
Eslovaco | sk |
✅ | |
Esloveno | sl |
✅ | |
Somali | so |
✅ | |
Sorâni | ku |
✅ | |
Espanhol (América Latina) | es |
✅ | |
Swahili | sw |
✅ | |
Sueco | sv |
✅ | |
Tajik | tg |
✅ | |
Tâmil | ta |
✅ | |
Télugo | te |
✅ | |
Tailandês | th |
✅ | |
Turco | tr |
✅ | |
Ucraniano | uk |
✅ | |
Umbundu | umb |
✅ | |
Urdu | ur |
✅ | |
Uzbek | uz |
✅ | |
Vietnamita | vi |
✅ | |
Galês | cy |
✅ | |
Wolof | wo |
✅ | |
Xhosa | xh |
✅ | |
Ioruba | yo |
✅ | |
Zulu | zu |
✅ |