Partager via


Prise en charge linguistique : modèles personnalisés

Ce contenu s’applique à :cochev4.0 (préversion) | Versions précédentes :coche-bleuev3.1(GA)coche-bleuev3.0 (GA)coche-bleuev2.1 (GA)

Ce contenu s’applique à :cochev3.1 (GA) | Dernière version :coche violettev4.0 (préversion) | Versions précédentes :coche-bleuev3.0coche-bleuev2.1

Ce contenu s’applique à :cochev3.0 (GA) | Dernières versions :coche violettev4.0 (préversion)coche-violettev3.1 | Version précédente :coche-bleuev2.1

Ce contenu s’applique à :cochev2.1 | Dernière version :coche-bleuev4.0 (préversion)

Les modèles d’Intelligence documentaire d’Azure AI fournissent une prise en charge multilingue du traitement des documents. Nos fonctionnalités de prise en charge linguistique permettent à vos utilisateurs de communiquer avec vos applications de manière naturelle et renforcent leur portée mondiale. Des modèles personnalisés sont formés à l'aide de vos ensembles de données étiquetés pour extraire des données distinctes à partir de documents structurés, semi-structurés et non structurés, en fonction de vos cas d'utilisation. Ces modèles personnalisés autonomes peuvent être combinés pour créer des modèles composés. Les tableaux suivants répertorient la prise en charge des langues et des paramètres régionaux disponibles par modèle et fonctionnalité :

Classifieur personnalisé

Langue : code de paramètres régionaux Default
Anglais (États-Unis) : en-US Anglais (États-Unis) : en-US
Langage Code (facultatif)
Afrikaans af
Albanais sq
Arabe ar
Bulgare bg
Chinois (Han (variante simplifiée)) zh-Hans
Chinois (Han (variante traditionnelle)) zh-Hant
Croate hr
Tchèque cs
Danois da
Néerlandais nl
Estonien et
Finnois fi
Français fr
Allemand de
Hébreu he
Hindi hi
Hongrois hu
Indonésien id
Italien it
Japonais ja
Coréen ko
Letton lv
Lituanien lt
Macédonien mk
Marathi mr
Grec moderne (1453-) el
Népalais (macrolangue) ne
Norvégien no
Panjabi pa
Persan fa
Polonais pl
Portugais pt
Roumain rm
Russe ru
Slovaque sk
Slovène sl
Somali (arabe) so
Somalien (latin) so-latn
Espagnol es
Swahili (macrolangue) sw
Suédois sv
Tamoul ta
Thaï th
Turc tr
Ukrainien uk
Ourdou ur
Vietnamien vi

Neural personnalisé

Le tableau suivant répertorie les langues prises en charge pour le texte imprimé.

Langage Code (facultatif)
Afrikaans af
Albanais sq
Arabe ar
Bulgare bg
Chinois (simplifié) zh-Hans
Chinois (traditionnel) zh-Hant
Croate hr
Tchèque cs
Danois da
Néerlandais nl
Estonien et
Finnois fi
Français fr
Allemand de
Hébreu he
Hindi hi
Hongrois hu
Indonésien id
Italien it
Japonais ja
Coréen ko
Letton lv
Lituanien lt
Macédonien mk
Marathi mr
Grec moderne (1453-) el
Népalais (macrolangue) ne
Norvégien no
Panjabi pa
Persan fa
Polonais pl
Portugais pt
Roumain rm
Russe ru
Slovaque sk
Slovène sl
Somali (arabe) so
Somalien (latin) so-latn
Espagnol es
Swahili (macrolangue) sw
Suédois sv
Tamoul ta
Thaï th
Turc tr
Ukrainien uk
Ourdou ur
Vietnamien vi

Les modèles neuraux prennent en charge les langues ajoutées pour v3.1 et les API ultérieures.

Langages Version de l'API
Anglais v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA), v3.0:2022-08-31 (GA)
Allemand v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Italien v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Français v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Espagnol v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Néerlandais v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)

Modèle personnalisé

Le tableau suivant répertorie les langues prises en charge pour le texte imprimé.

Langage Code (facultatif)
Abaza abq
Abkhaze ab
Aceh ace
Acoli ach
Adangme ada
Adyghe ady
Afar aa
Afrikaans af
Akan ak
Albanais sq
Algonquin alq
Angika (Devanagari) anp
Arabe ar
Asturien ast
Asu (Tanzanie) asa
Avaric av
Awadhi-Hindi (Devanagari) awa
Aymara ay
Azerbaïdjanais (Latin) az
Bafia ksf
Bagheli bfy
Bambara bm
Bashkir ba
Basque eu
Biélorusse (cyrillique) be, be-cyrl
Biélorusse (latin) be, be-latn
Bemba (Zambie) bem
Bena (Tanzanie) bez
Bhojpuri-Hindi (devanagari) bho
Bikol bik
Bini bin
Bichelamar bi
Bodo (devanagari) brx
Bosniaque (latin) bs
Brajbha bra
Breton br
Bulgare bg
Bundeli bns
Buryat (cyrillique) bua
Catalan ca
Cebuano ceb
Chamling rab
Chamorro ch
Tchétchène ce
Chhattisgarhi (devanagari) hne
Chiga cgg
Chinois (simplifié) zh-Hans
Chinois traditionnel zh-Hant
Choctaw cho
Chukot ckt
Tchouvache cv
Cornique kw
Corse co
Cris cr
Creek mus
Tatar de Crimée (latin) crh
Croate hr
Crow cro
Tchèque cs
Danois da
Dargwa dar
Dari prs
Dhimal (devanagari) dhi
Dogri (devanagari) doi
Duala dua
Dungan dng
Néerlandais nl
Efik efi
English en
Erzya (Cyrillique) myv
Estonien et
Féroïen fo
Fidjien fj
Filipino fil
Finnois fi
Langage Code (facultatif)
Fon fon
Français fr
Frioulan fur
Ga gaa
Gagauz (Latin) gag
Galicien gl
Ganda lg
Gayo gay
Allemand de
Gilbertin gil
Gondi (devanagari) gon
Grec el
Groenlandais kl
Guarani gn
Gurung (devanagari) gvr
Gusii guz
Créole haïtien ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
Hawaïen haw
Hébreu he
Herero hz
Hiligaynon hil
Hindi hi
Hmong daw (latin) mww
Ho (devanagari) hoc
Hongrois hu
Iban iba
Islandais is
Igbo ig
Iloko ilo
Inari Sami smn
Indonésien id
Ingush inh
Interlingua ia
Inuktitut (Latin) iu
Irlandais ga
Italien it
Japonais ja
Jaunsari (Devanagari) Jns
Javanais jv
Jola-Fonyi dyo
Kabarde kbd
Créole du Cap-Vert kea
Kachin (latin) kac
Kalenjin kln
Kalmyk xal
Kangri (Devanagari) xnr
Kanuri kr
Karachay-Balkar krc
Kara-Kalpak (Cyrillique) kaa-cyrl
Kara-Kalpak (Latin) kaa
Cachoube csb
Kazakh (Cyrillique) kk-cyrl
Kazakh (Latin) kk-latn
Khakas kjh
Khaling klr
Khasi kha
Quiché quc
Kikuyu ki
Kildin Sami sjd
Kinyarwanda rw
Komi kv
Kongo kg
Coréen ko
Korku kfq
Koryak kpy
Kosrae kos
Kpelle kpe
Kuanyama kj
Kumyk (Cyrillique) kum
Kurde (arabe) ku-arab
Kurde (latin) ku-latn
Kurukh (devanagari) kru
Kirghiz (cyrillique) ky
Lak lbe
Lakota lkt
Langage Code (facultatif)
Latin la
Letton lv
Lezghien lex
Lingala ln
Lituanien lt
Bas sorabe dsb
Lozi loz
Lule Sami smj
Luo (Kenya et Tanzanie) luo
Luxembourgeois lb
Luyia luy
Macédonien mk
Machame jmc
Madurais mad
Mahasu Pahari (devanagari) bfz
Makhuwa-Meetto mgh
Makondé kde
Malgache mg
Malais (latin) ms
Maltais mt
Malto (devanagari) kmj
Mandinka mnk
Mannois gv
Maori mi
Mapuche arn
Marathi mr
Mari (Russie) chm
Masai mas
Mende (Sierra Leone) hommes
Meru mer
Meta’ mgo
Minangkabau min
Mohawk moh
Mongole (cyrillique) mn
Mongondow mog
Monténégrin (cyrillique) cnr-cyrl
Montenegrin (latin) cnr-latn
Morisyen mfe
Mundang mua
Nahuatl nah
Navajo nv
Ndonga ng
Napolitain nap
Népalais ne
Ngomba jgo
Niué niu
Nogay nog
Ndebele nord nd
Same du Nord (latin) sme
Norvégien non
Nyanja ny
Nyankole nyn
Nzima nzi
Occitan oc
Ojibwa oj
Oromo om
Ossète SE
Pampanga pam
Pangasinan pag
Papiamento pap
Pachto ps
Pedi nso
Persan fa
Polonais pl
Portugais pt
Pendjabi (arabe) pa
Quechua qu
Francique ripuaire ksh
Roumain ro
Romanche rm
Rundi rn
Russe ru
Rwa rwk
Sadri (Devanagari) sck
Sakha sah
Samburu saq
Samoan (latin) sm
Sango sg
Langage Code (facultatif)
Sangu (Gabon) snq
Sanskrit (devanagari) SA
Santali (devanagari) Sam
Scots sco
Gaélique écossais gd
Sena seh
Serbe (cyrillique) sr-cyrl
Serbe (latin) sr, sr-latn
Shambala ksb
Shona sn
Siksika bla
Sirmauri (devanagari) srx
Same de Skolt sms
Slovaque sk
Slovène sl
Soga xog
Somali (arabe) SO
Somalien (latin) so-latn
Songhaï son
Ndebele sud nr
Altai sud alt
Same du Sud sma
Sotho sud st
Espagnol es
Soundanais su
Swahili (latin) sw
Swati ss
Suédois sv
Tabassaran tab
Tachelhit shi
Tahitien ty
Taita dav
Tadjik (cyrillique) tg
Tamoul ta
Tatar (cyrillique) tt-cyrl
Tatar (latin) tt
Teso teo
Tétoum tet
Thaï th
Thangmi thf
Tok Pisin tpi
Tonga à
Tsonga ts
Tswana tn
Turc tr
Turkmène (latin) tk
Touvain tyv
Udmurt udm
Ouïghour (cyrillique) ug-cyrl
Ukrainien uk
Haut sorabe hsb
Ourdou ur
Ouïgour (arabe) ug
Ouzbek (arabe) uz-arab
Ouzbek (cyrillique) uz-cyrl
Ouzbek (latin) uz
Vietnamien vi
Volapük vo
Vunjo vun
Haut-valaisan wae
Gallois cy
Frison occidental fy
Wolof wo
Xhosa xh
Yucatec Maya yua
Zapotèque zap
Zarma dje
Zhuang za
Zoulou zu