Prise en charge linguistique d’Azure AI Vision

Certaines des fonctionnalités d’Azure AI Vision prennent en charge plusieurs langages ; celles qui ne sont pas mentionnées ici ne prennent en charge que l’anglais.

Reconnaissance optique des caractères (OCR)

L’API Read d’Azure AI Vision prend en charge de nombreux langages. L’API Read peut extraire du texte à partir d’images et de documents avec des langues mixtes, y compris sur une même ligne de texte, sans avoir besoin d’un paramètre de langue. Pour utiliser les nouvelles langues, consultez Comment spécifier le modèle Read.

Remarque

Code de langue facultatif

Les modèles universels basés sur le Deep Learning de la reconnaissance optique de caractères (OCR) de Read extraient tout le texte multilingue de vos documents, y compris les lignes de texte contenant plusieurs langues, et ne nécessitent pas la spécification d’un code de langue. N’indiquez pas de code de langue en tant que paramètre, sauf si vous êtes sûr de la langue et si vous souhaitez forcer le service à appliquer uniquement le modèle approprié. Sinon, le service pourrait retourner du texte incomplet et incorrect.

Texte manuscrit

Le tableau suivant répertorie les langues prises en charge par la reconnaissance optique de caractères (OCR) pour un texte manuscrit par le modèle en disponibilité générale Read le plus récent.

Langage Code langue (facultatif) Langage Code langue (facultatif)
Anglais en Japonais ja
Chinois (simplifié) zh-Hans Coréen ko
Français fr Portugais pt
Allemand de Espagnol es
Italien it

Le tableau suivant répertorie les langues prises en charge par la reconnaissance optique de caractères (OCR) pour un texte imprimé par le modèle en disponibilité générale Read le plus récent.

Langage Code (facultatif) Langage Code (facultatif)
Afrikaans af Khasi kha
Albanais sq Quiché quc
Angika (devanagari) anp Coréen ko
Arabe ar Korku kfq
Asturien ast Koryak kpy
Awadhi-Hindi (devanagari) awa Kosrae kos
Azerbaïdjanais (Latin) az Kumyk (Cyrillique) kum
Bagheli bfy Kurde (arabe) ku-arab
Basque eu Kurde (latin) ku-latn
Biélorusse (cyrillique) be, be-cyrl Kurukh (devanagari) kru
Biélorusse (latin) be, be-latn Kirghiz (cyrillique) ky
Bhojpuri-Hindi (devanagari) bho Lakota lkt
Bichelamar bi Latin la
Bodo (devanagari) brx Lituanien lt
Bosniaque (latin) bs Bas sorabe dsb
Brajbha bra Lule Sami smj
Breton br Luxembourgeois lb
Bulgare bg Mahasu Pahari (devanagari) bfz
Bundeli bns Malais (latin) ms
Buryat (cyrillique) bua Maltais mt
Catalan ca Malto (devanagari) kmj
Cebuano ceb Mannois gv
Chamling rab Maori mi
Chamorro ch Marathi mr
Chhattisgarhi (devanagari) hne Mongole (cyrillique) mn
Chinois (simplifié) zh-Hans Monténégrin (cyrillique) cnr-cyrl
Chinois traditionnel zh-Hant Montenegrin (latin) cnr-latn
Cornique kw Napolitain nap
Corse co Népalais ne
Tatar de Crimée (latin) crh Niué niu
Croate hr Nogay nog
Tchèque cs Same du Nord (latin) sme
Danois da Norvégien no
Dari prs Occitan oc
Dhimal (devanagari) dhi Ossète os
Dogri (devanagari) doi Pachto ps
Néerlandais nl Persan fa
Anglais en Polonais pl
Erzya (Cyrillique) myv Portugais pt
Estonien et Pendjabi (arabe) pa
Féroïen fo Francique ripuaire ksh
Fidjien fj Roumain ro
Filipino fil Romanche rm
Finnois fi Russe ru
Français fr Sadri (devanagari) sck
Frioulan fur Samoan (latin) sm
Gagauz (Latin) gag Sanskrit (devanagari) sa
Galicien gl Santali (devanagari) sat
Allemand de Scots sco
Gilbertin gil Gaélique écossais gd
Gondi (devanagari) gon Serbe (latin) sr, sr-latn
Groenlandais kl Sherpa (devanagari) xsr
Gurung (devanagari) gvr Sirmauri (devanagari) srx
Créole haïtien ht Same de Skolt sms
Halbi (devanagari) hlb Slovaque sk
Hani hni Slovène sl
Haryanvi bgc Somali (arabe) so
Hawaïen haw Same du Sud sma
Hindi hi Espagnol es
Hmong daw (latin) mww Swahili (latin) sw
Ho (devanagari) hoc Suédois sv
Hongrois hu Tadjik (cyrillique) tg
Islandais is Tatar (latin) tt
Inari Sami smn Tétoum tet
Indonésien id Thangmi thf
Interlingua ia Tonga to
Inuktitut (Latin) iu Turc tr
Irlandais ga Turkmène (latin) tk
Italien it Touvain tyv
Japonais ja Haut sorabe hsb
Jaunsari (devanagari) Jns Ourdou ur
Javanais jv Ouïgour (arabe) ug
Créole du Cap-Vert kea Ouzbek (arabe) uz-arab
Kachin (latin) kac Ouzbek (cyrillique) uz-cyrl
Kangri (devanagari) xnr Ouzbek (latin) uz
Karachay-Balkar krc Volapük vo
Kara-Kalpak (Cyrillique) kaa-cyrl Haut-valaisan wae
Kara-Kalpak (Latin) kaa Gallois cy
Cachoube csb Frison occidental fy
Kazakh (Cyrillique) kk-cyrl Yucatec Maya yua
Kazakh (Latin) kk-latn Zhuang za
Khaling klr Zoulou zu

Analyser l’image

Certaines fonctionnalités de l’API Analyser : Image peuvent retourner des résultats dans d’autres langues, spécifiées avec le paramètre de requête language. D’autres donnent des résultats en anglais indépendamment de la langue spécifiée ; les dernières lèvent une exception pour les langues non prises en charge. Les actions sont spécifiées avec les paramètres de requête visualFeatures et details ; pour connaître la liste de toutes les actions possibles avec l’API Analyser, consultez la Vue d’ensemble ou suivez le guide pratique pour les essayer.

Langage Code langue Catégories Balises Description Adultes, marques, couleurs, visages, ImageType, objets Célébrités, monuments et sites Légendes, légendes denses
Arabe ar
Azéri az
Bulgare bg
Bosniaque latin bs
Catalan ca
Tchèque cs
Gallois cy
Danois da
Allemand de
Grec el
Anglais en
Espagnol es
Estonien et
Basque eu
Finnois fi
Français fr
Irlandais ga
Galicien gl
Hébreu he
Hindi hi
Croate hr
Hongrois hu
Indonésien id
Italien it
Japonais ja
Kazakh kk
Coréen ko
Lituanien lt
Letton lv
Macédonien mk
Malais (Malaisie) ms
Norvégien (bokmål) nb
Néerlandais nl
Polonais pl
Dari prs
Portugais (Brésil) pt-BR
Portugais (Portugal) pt
Portugais (Portugal) pt-PT
Roumain ro
Russe ru
Slovaque sk
Slovène sl
Serbe (cyrillique) sr-Cryl
Serbe (Latin) sr-Latn
Suédois sv
Thaï th
Turc tr
Ukrainien uk
Vietnamien vi
Chinois (simplifié) zh
Chinois (simplifié) zh-Hans
Chinois (traditionnel) zh-Hant

Incorporations multimodales

Le dernier modèle Incorporations multimodales prend en charge la recherche vectorielle dans de nombreuses langues. Le modèle d’origine prend uniquement en charge la langue anglaise. Les images vectorisées dans le modèle uniquement en anglais ne sont pas compatibles avec les recherches textuelles dans le modèle multilingue.

Langage Code de langue 2023-04-15 modèle 2022-04-11 modèle
Afrikaans af
Amharique am
Arabe ar
Arménien hy
Assamais as
Asturien ast
Azéri az
Biélorusse be
Bengali bn
Bosniaque bs
Bulgare bg
Birman my
Catalan ca
Cebuano ceb
Chinois simplifié zho
Chinois traditionnel zho
Croate hr
Tchèque cs
Danois da
Néerlandais nl
Anglais en
Estonien et
Filipino (Tagalog) tl
Finnois fi
Français fr
Peul ff
Galicien gl
Ganda lg
Géorgien ka
Allemand de
Grec el
Goudjrati gu
Hausa ha
Hébreu he
Hindi hi
Hongrois hu
Islandais is
Igbo ig
Indonésien id
Irlandais ga
Italien it
Japonais ja
Javanais jv
Créole du Cap-Vert kea
Kamba kam
Kannada kn
Kazakh kk
Khmer km
Coréen ko
Kirghiz ky
Lao lo
Letton lv
Lingala ln
Lituanien lt
Luo luo
Luxembourgeois lb
Macédonien mk
Malais ms
Malayalam ml
Maltais mt
Maori mi
Marathi mr
Mongol mn
Népalais ne
Sotho du Nord ns
Norvégien no
Nyanja ny
Occitan oc
Odia or
Oromo om
Pachto ps
Persan fa
Polonais pl
Portugais (Brésil) pt
Pendjabi pa
Roumain ro
Russe ru
Serbe sr
Shona sn
Sindhi sd
Slovaque sk
Slovène sl
Somali so
Kurde sorani ku
Espagnol (Amérique latine) es
Swahili sw
Suédois sv
Tadjik tg
Tamoul ta
Télougou te
Thaï th
Turc tr
Ukrainien uk
Umbundu umb
Ourdou ur
Ouzbek uz
Vietnamien vi
Gallois cy
Wolof wo
Xhosa xh
Yoruba yo
Zoulou zu