語言支援:檔分析
Azure AI 檔智慧模型提供多語系文件處理支援。 我們的語言支援功能讓使用者能夠以自然的方式與應用程式通訊,並強化全球拓展能力。 文件分析模型可啟用從表單和文件擷取文字,並針對貴組織的動作、使用或進度傳回結構化商務就緒內容。 下表列出模型和功能的可用語言和地區設定支援:
- 讀取:讀取模型可讓您擷取和分析印刷和手寫文字。 此模型是其他文件智慧預先建置模型的基礎 OCR 引擎,例如版面配置、一般檔、發票、收據、身分識別(標識符)檔、健康保險卡、稅務檔和自定義模型。 如需詳細資訊, 請參閱讀取模型概觀
- 版面配置:版面配置模型可從表單和檔中擷取和分析文字、數據表、檔結構和選取標記(例如單選按鈕和複選框)。
- 一般檔:一般檔模型可讓您擷取和分析文字、文件結構和索引鍵/值組。 如需詳細資訊, 請參閱一般檔模型概觀
注意
語言代碼選擇性
Document Intelligence 的深度學習通用模型會擷取檔中的所有多語系文字,包括混合語言的文字行,而且不需要指定語言代碼。
除非您確定語言並想要強制服務只套用相關的模型,否則請勿提供語言程式代碼做為參數。 否則,服務可能會傳回不完整且不正確的文字。
此外,不需要指定地區設定。 這是選擇性參數。 檔智慧深度學習技術會自動偵測影像中的文字語言。
讀取模型
模型標識碼: 預先建置-read
下表列出擷取和分析列印文字的讀取模型語言支援。
語言 |
程式代碼 (選擇性) |
Abaza |
abq |
阿布哈茲文 |
ab |
阿欽文 |
ace |
Acoli |
ach |
Adangme |
ada |
Adyghe |
ady |
遠方 |
aa |
南非荷蘭文 |
af |
Akan |
ak |
阿爾巴尼亞文 |
sq |
阿岡昆 |
alq |
安吉卡(德瓦納加里) |
anp |
阿拉伯文 |
ar |
阿圖里亞文 |
ast |
阿蘇(坦尚尼亞) |
asa |
Avaric |
av |
阿瓦迪-印度文 (德瓦納加里) |
awa |
Aymara |
ay |
亞塞拜然文(拉丁文) |
az |
Bafia |
ksf |
巴蓋利 |
bfy |
Bambara |
bm |
巴什喀爾文 |
ba |
巴斯克文 |
eu |
白俄羅斯文(斯拉夫) |
be , be-cyrl |
白俄羅斯文(拉丁文) |
be , be-latn |
本巴(尚比亞) |
bem |
貝納(坦尚尼亞) |
bez |
Bhojpuri-印度文 (Devanagari) |
bho |
比科爾 |
bik |
Bini |
bin |
Bislama |
bi |
博多(德瓦納加里) |
brx |
波士尼亞文 (拉丁) |
bs |
Brajbha |
bra |
布列塔尼 |
br |
保加利亞文 |
bg |
邦德利 |
bns |
伯里亞特 (斯拉夫) |
bua |
加泰蘭文 |
ca |
Cebuano |
ceb |
查姆林 |
rab |
查莫羅 |
ch |
車臣 |
ce |
查蒂斯加里 (德瓦納加里) |
hne |
Chiga |
cgg |
簡體中文 |
zh-Hans |
繁體中文 |
zh-Hant |
Choctaw |
cho |
丘科特 |
ckt |
Chuvash |
cv |
康沃爾 |
kw |
科西坎 |
co |
Cree |
cr |
溪 |
mus |
克里米亞塔塔爾 (拉丁) |
crh |
克羅埃西亞文 |
hr |
烏鴉 |
cro |
捷克文 |
cs |
丹麥文 |
da |
Dargwa |
dar |
達利文 |
prs |
杜瑪律(德瓦納加里) |
dhi |
Dogri (德瓦納加里) |
doi |
Duala |
dua |
鄧根 |
dng |
荷蘭文 |
nl |
Efik |
efi |
英語 |
en |
埃爾齊亞(斯拉夫) |
myv |
愛沙尼亞文 |
et |
法羅語 |
fo |
斐濟文 |
fj |
菲律賓文 |
fil |
芬蘭文 |
fi |
語言 |
程式代碼 (選擇性) |
Fon |
fon |
法文 |
fr |
弗里利亞文 |
fur |
Ga |
gaa |
加古茲(拉丁) |
gag |
加利西亞文 |
gl |
甘達 |
lg |
蓋奧 |
gay |
德文 |
de |
吉伯特斯 |
gil |
岡迪 (德瓦納加里) |
gon |
希臘文 |
el |
格陵蘭 |
kl |
瓜拉尼 |
gn |
古隆(德瓦納加里) |
gvr |
Gusii |
guz |
海地克里奧爾文 |
ht |
哈爾比(德瓦納加里) |
hlb |
哈尼族 |
hni |
哈揚維 |
bgc |
夏威夷 |
haw |
Hebrew |
he |
Herero |
hz |
希里加農 |
hil |
印度文 |
hi |
苗道(拉丁) |
mww |
何(德瓦納吉里) |
hoc |
匈牙利文 |
hu |
Iban |
iba |
冰島文 |
is |
伊布文 |
ig |
伊洛科 |
ilo |
Inari Sami |
smn |
印尼文 |
id |
Ingush |
inh |
Interlingua |
ia |
Inuktitut (Latin) |
iu |
愛爾蘭文 |
ga |
義大利文 |
it |
日文 |
ja |
詹薩里 (德瓦納加里) |
Jns |
爪 哇 |
jv |
Jola-Fonyi |
dyo |
Kabardian |
kbd |
Kabuverdianu |
kea |
卡欽(拉丁) |
kac |
卡倫金 |
kln |
Kalmyk |
xal |
康里(德瓦納加里) |
xnr |
Kanuri |
kr |
卡拉查伊-巴爾卡爾 |
krc |
卡拉-卡爾派克(斯拉夫) |
kaa-cyrl |
卡拉-卡爾派克(拉丁) |
kaa |
Kashubian |
csb |
哈薩克文(斯拉夫) |
kk-cyrl |
哈薩克文(拉丁) |
kk-latn |
卡卡斯 |
kjh |
Khaling |
klr |
Khasi |
kha |
K'iche' |
quc |
Kikuyu |
ki |
基爾丁·薩米 |
sjd |
盧安達文 |
rw |
Komi |
kv |
孔戈 |
kg |
韓文 |
ko |
Korku |
kfq |
Koryak |
kpy |
科斯林 |
kos |
Kpelle |
kpe |
關山 |
kj |
庫米克(斯拉夫) |
kum |
庫德文 (阿拉伯文) |
ku-arab |
庫德文 (拉丁) |
ku-latn |
庫魯克(德瓦納加里) |
kru |
吉爾吉斯(斯拉夫) |
ky |
Lak |
lbe |
拉科他州 |
lkt |
語言 |
程式代碼 (選擇性) |
拉丁文 |
la |
拉脫維亞文 |
lv |
萊茲吉安 |
lex |
林加拉 |
ln |
立陶宛文 |
lt |
下索比安 |
dsb |
洛齊 |
loz |
Lule Sami |
smj |
羅(肯亞和坦尚尼亞) |
luo |
盧森堡文 |
lb |
盧亞 |
luy |
馬其頓文 |
mk |
麥克漢姆 |
jmc |
馬杜爾塞文 |
mad |
馬哈蘇·帕哈裡(德瓦納加里) |
bfz |
Makhuwa-Meetto |
mgh |
Makonde |
kde |
馬達加斯加文 |
mg |
馬來文 (拉丁) |
ms |
馬爾他文 |
mt |
瑪律托 (德瓦納加里) |
kmj |
曼丁卡 |
mnk |
Manx |
gv |
毛利文 |
mi |
Mapudungun |
arn |
馬拉地文 |
mr |
馬里(俄羅斯) |
chm |
馬賽 |
mas |
門德(塞拉利昂) |
men |
Meru |
mer |
Meta' |
mgo |
Minangkabau |
min |
莫霍克 |
moh |
蒙古文 (斯拉夫) |
mn |
Mongondow |
mog |
黑山(斯拉夫) |
cnr-cyrl |
黑山 (拉丁) |
cnr-latn |
莫裡斯延 |
mfe |
蒙當 |
mua |
納瓦特 |
nah |
納瓦霍 |
nv |
Ndonga |
ng |
那不勒斯 |
nap |
尼泊爾文 |
ne |
恩戈姆巴 |
jgo |
紐安 |
niu |
Nogay |
nog |
北恩德貝勒 |
nd |
北薩米 (拉丁) |
sme |
挪威文 |
no |
尼揚賈 |
ny |
Nyankole |
nyn |
Nzima |
nzi |
Occitan |
oc |
Ojibwa |
oj |
Oromo |
om |
Ossetic |
os |
潘潘加 |
pam |
Pangasinan |
pag |
帕皮亞門托 |
pap |
普什圖文 |
ps |
Pedi |
nso |
波斯文 |
fa |
波蘭文 |
pl |
葡萄牙文 |
pt |
旁遮普文(阿拉伯文) |
pa |
蓋楚瓦文 |
qu |
里普里亞文 |
ksh |
羅馬尼亞文 |
ro |
Romansh |
rm |
Rundi |
rn |
俄文 |
ru |
Rwa |
rwk |
薩德里(德瓦納加里) |
sck |
薩哈文 |
sah |
Samburu |
saq |
薩摩亞文(拉丁) |
sm |
桑戈 |
sg |
語言 |
程式代碼 (選擇性) |
桑古(加蓬) |
snq |
聖文(德瓦納加里) |
sa |
桑塔利(德瓦納吉里) |
sat |
蘇格蘭 |
sco |
蘇格蘭蓋爾文 |
gd |
塞納 |
seh |
塞爾維亞文 (斯拉夫) |
sr-cyrl |
塞爾維亞文 (拉丁) |
sr 、sr-latn |
Shambala |
ksb |
Shona |
sn |
Siksika |
bla |
蘇爾馬里(德瓦納加里) |
srx |
Skolt Sami |
sms |
斯洛伐克文 |
sk |
斯洛維尼亞文 |
sl |
Soga |
xog |
索馬里(阿拉伯文) |
so |
索馬里(拉丁) |
so-latn |
松海 |
son |
南恩德貝勒 |
nr |
南阿爾泰 |
alt |
南薩米文 |
sma |
南索托 |
st |
西班牙文 |
es |
Sundanese |
su |
斯瓦希里文 (拉丁) |
sw |
Swati |
ss |
瑞典文 |
sv |
Tabassaran |
tab |
塔切爾希特 |
shi |
大溪地文 |
ty |
Taita |
dav |
塔吉克文 (斯拉夫) |
tg |
坦米爾文 |
ta |
塔塔爾 (斯拉夫) |
tt-cyrl |
塔塔爾 (拉丁) |
tt |
Teso |
teo |
Tetum |
tet |
泰文 |
th |
Thangmi |
thf |
Tok Pisin |
tpi |
東加文 |
to |
Tsonga |
ts |
茨瓦納語 |
tn |
土耳其文 |
tr |
土庫曼(拉丁) |
tk |
圖文 |
tyv |
Udmurt |
udm |
維吾爾族(斯拉夫) |
ug-cyrl |
烏克蘭文 |
uk |
上索布文 |
hsb |
烏都文 |
ur |
維吾爾文(阿拉伯文) |
ug |
烏茲別克文(阿拉伯文) |
uz-arab |
烏茲別克文 (斯拉夫) |
uz-cyrl |
烏茲別克文 (拉丁) |
uz |
越南文 |
vi |
Volapük |
vo |
Vunjo |
vun |
Walser |
wae |
威爾斯文 |
cy |
西弗里西亞文 |
fy |
沃洛夫文 |
wo |
班圖語 |
xh |
猶加敦馬雅文 |
yua |
Zapotec |
zap |
Zarma |
dje |
莊 |
za |
祖魯語 |
zu |
下表列出擷取和分析列印文字的讀取模型語言支援。
語言 |
程式代碼 (選擇性) |
南非荷蘭文 |
af |
Angika |
anp |
阿拉伯文 |
ar |
阿圖里亞文 |
ast |
阿瓦迪 |
awa |
亞塞拜然文 |
az |
白俄羅斯文(斯拉夫) |
be , be-cyrl |
白俄羅斯文(拉丁文) |
be-latn |
巴蓋利 |
bfy |
馬哈蘇·帕哈裡 |
bfz |
保加利亞文 |
bg |
哈揚維 |
bgc |
博杰普爾文 |
bho |
Bislama |
bi |
邦德利 |
bns |
布列塔尼 |
br |
Braj |
bra |
Bodo |
brx |
波士尼亞文 |
bs |
Buriat |
bua |
加泰蘭文 |
ca |
Cebuano |
ceb |
查莫羅 |
ch |
黑山 (拉丁) |
cnr , cnr-latn |
黑山(斯拉夫) |
cnr-cyrl |
科西坎 |
co |
克里米亞塔塔爾 |
crh |
捷克文 |
cs |
Kashubian |
csb |
威爾斯文 |
cy |
丹麥文 |
da |
德文 |
de |
Dhimal |
dhi |
Dogri |
doi |
下索比安 |
dsb |
英語 |
en |
西班牙文 |
es |
愛沙尼亞文 |
et |
巴斯克文 |
eu |
波斯文 |
fa |
芬蘭文 |
fi |
菲律賓文 |
fil |
語言 |
程式代碼 (選擇性) |
斐濟文 |
fj |
法羅語 |
fo |
法文 |
fr |
弗里利亞文 |
fur |
西弗里西亞文 |
fy |
愛爾蘭文 |
ga |
Gagauz |
gag |
蘇格蘭蓋爾文 |
gd |
吉伯特斯 |
gil |
加利西亞文 |
gl |
Gondi |
gon |
Manx |
gv |
古隆 |
gvr |
夏威夷 |
haw |
印度文 |
hi |
哈爾比 |
hlb |
Chhattisgarhi |
hne |
哈尼族 |
hni |
Ho |
hoc |
克羅埃西亞文 |
hr |
上索布文 |
hsb |
海地文 |
ht |
匈牙利文 |
hu |
Interlingua |
ia |
印尼文 |
id |
冰島文 |
is |
義大利文 |
it |
依奴提圖特文 |
iu |
日文 |
|
Jaunsari |
jns |
爪 哇 |
jv |
卡拉-卡爾派克(拉丁) |
kaa , kaa-latn |
卡拉-卡爾派克(斯拉夫) |
kaa-cyrl |
卡欽文 |
kac |
Kabuverdianu |
kea |
Korku |
kfq |
Khasi |
kha |
哈薩克文(拉丁) |
kk , kk-latn |
哈薩克文(斯拉夫) |
kk-cyrl |
Kalaallisut |
kl |
Khaling |
klr |
瑪律托 |
kmj |
語言 |
程式代碼 (選擇性) |
韓文 |
|
科斯林 |
kos |
Koryak |
kpy |
卡拉查伊-巴爾卡爾 |
krc |
Kurukh |
kru |
Kölsch |
ksh |
庫德文 (拉丁) |
ku , ku-latn |
庫德文 (阿拉伯文) |
ku-arab |
Kumyk |
kum |
康沃爾 |
kw |
柯吉斯 |
ky |
拉丁文 |
la |
盧森堡文 |
lb |
拉科他州 |
lkt |
立陶宛文 |
lt |
毛利文 |
mi |
蒙古文 |
mn |
馬拉地文 |
mr |
馬來文 |
ms |
馬爾他文 |
mt |
苗族 Daw |
mww |
Erzya |
myv |
那不勒斯 |
nap |
尼泊爾文 |
ne |
紐安 |
niu |
荷蘭文 |
nl |
挪威文 |
no |
Nogai |
nog |
Occitan |
oc |
奧塞梯 |
os |
旁遮普文 |
pa |
波蘭文 |
pl |
達利文 |
prs |
Pushto |
ps |
葡萄牙文 |
pt |
K'iche' |
quc |
卡姆林 |
rab |
Romansh |
rm |
羅馬尼亞文 |
ro |
俄文 |
ru |
梵文 |
sa |
山塔利文 |
sat |
語言 |
程式代碼 (選擇性) |
薩德里 |
sck |
蘇格蘭 |
sco |
斯洛伐克文 |
sk |
斯洛維尼亞文 |
sl |
薩摩亞文 |
sm |
南薩米文 |
sma |
北薩米文 |
sme |
Lule Sami |
smj |
Inari Sami |
smn |
Skolt Sami |
sms |
索馬利文 |
so |
阿爾巴尼亞文 |
sq |
塞爾維亞文 (拉丁) |
sr , sr-latn |
Sirmauri |
srx |
瑞典文 |
sv |
史瓦西里文 |
sw |
Tetum |
tet |
塔吉克文 |
tg |
Thangmi |
thf |
土庫曼文 |
tk |
東加 |
to |
土耳其文 |
tr |
韃靼文 |
tt |
圖維尼亞文 |
tyv |
維吾爾族 |
ug |
烏都文 |
ur |
烏茲別克文 (拉丁) |
uz , uz-latn |
烏茲別克文 (斯拉夫) |
uz-cyrl |
烏茲別克文(阿拉伯文) |
uz-arab |
Volapük |
vo |
Walser |
wae |
康里 |
xnr |
Yucateco |
yua |
莊 |
za |
中文 (漢 (簡體中文)) |
zh , zh-hans |
中文 (漢 (繁體中文)) |
zh-hant |
祖魯語 |
zu |
下表列出擷取和分析手寫文字的讀取模型語言支援。
語言 |
語言代碼 (選擇性) |
語言 |
語言代碼 (選擇性) |
英語 |
en |
日文 |
ja |
簡體中文 |
zh-Hans |
韓文 |
ko |
法文 |
fr |
葡萄牙文 |
pt |
德文 |
de |
西班牙文 |
es |
義大利文 |
it |
俄文(預覽) |
ru |
泰文(預覽) |
th |
阿拉伯文(預覽) |
ar |
下表列出擷取和分析手寫文字的讀取模型語言支援。
語言 |
語言代碼 (選擇性) |
語言 |
語言代碼 (選擇性) |
英語 |
en |
日文 |
ja |
簡體中文 |
zh-Hans |
韓文 |
ko |
法文 |
fr |
葡萄牙文 |
pt |
德文 |
de |
西班牙文 |
es |
義大利文 |
it |
|
|
下表列出擷取和分析手寫文字的讀取模型語言支援。
語言 |
語言代碼 (選擇性) |
語言 |
語言代碼 (選擇性) |
英語 |
en |
日文 |
ja |
簡體中文 |
zh-Hans |
韓文 |
ko |
法文 |
fr |
葡萄牙文 |
pt |
德文 |
de |
西班牙文 |
es |
義大利文 |
it |
|
|
讀取模型 API 支援檔中下列語言的語言偵測。 此清單可包含目前不支援文字擷取的語言。
重要
語言偵測
- 檔智慧讀取模型可以 偵測 語言是否存在,並傳回所偵測語言的語言代碼。
偵測到的語言與擷取的語言
- 本節列出我們可以使用讀取模型從文件偵測到的語言,如果有的話。
- 請注意,此清單不同於我們支援從中擷取文字的語言清單,這在每個模型的上述各節中指定。
語言 |
代碼 |
南非荷蘭文 |
af |
阿爾巴尼亞文 |
sq |
阿姆哈拉文 |
am |
阿拉伯文 |
ar |
亞美尼亞文 |
hy |
阿薩姆文 |
as |
亞塞拜然文 |
az |
巴斯克文 |
eu |
白俄羅斯文 |
be |
孟加拉文 |
bn |
波士尼亞文 |
bs |
保加利亞文 |
bg |
緬甸文 |
my |
加泰蘭文 |
ca |
中央高棉 |
km |
中文 |
zh |
簡體中文 |
zh_chs |
繁體中文 |
zh_cht |
科西坎 |
co |
克羅埃西亞文 |
hr |
捷克文 |
cs |
丹麥文 |
da |
達利文 |
prs |
迪維西文 |
dv |
荷蘭文 |
nl |
英語 |
en |
語 |
eo |
愛沙尼亞文 |
et |
斐濟文 |
fj |
芬蘭文 |
fi |
法文 |
fr |
加利西亞文 |
gl |
喬治亞文 |
ka |
德文 |
de |
希臘文 |
el |
古吉拉特文 |
gu |
海地文 |
ht |
豪撒文 |
ha |
希伯來文 |
he |
Hindi |
hi |
白苗文 |
mww |
匈牙利文 |
hu |
冰島文 |
is |
伊布文 |
ig |
印尼文 |
id |
因紐特文 |
iu |
愛爾蘭文 |
ga |
義大利文 |
it |
日文 |
ja |
爪 哇 |
jv |
坎那達文 |
kn |
哈薩克文 |
kk |
盧安達文 |
rw |
柯吉斯 |
ky |
韓文 |
ko |
庫德語 |
ku |
寮文 |
lo |
拉丁文 |
la |
語言 |
代碼 |
拉脫維亞文 |
lv |
立陶宛文 |
lt |
盧森堡文 |
lb |
馬其頓文 |
mk |
馬達加斯加文 |
mg |
馬來文 |
ms |
馬來亞拉姆文 |
ml |
馬爾他文 |
mt |
毛利文 |
mi |
馬拉地文 |
mr |
蒙古文 |
mn |
尼泊爾文 |
ne |
挪威文 |
no |
耐諾斯克挪威文 |
nn |
歐迪亞文 |
or |
Pasht |
ps |
波斯文 |
fa |
波蘭文 |
pl |
葡萄牙文 |
pt |
旁遮普文 |
pa |
奎雷塔洛歐多米文 |
otq |
羅馬尼亞文 |
ro |
俄文 |
ru |
薩摩亞文 |
sm |
塞爾維亞文 |
sr |
Shona |
sn |
信德文 |
sd |
僧伽羅文 |
si |
斯洛伐克文 |
sk |
斯洛維尼亞文 |
sl |
索馬利文 |
so |
西班牙文 |
es |
Sundanese |
su |
史瓦西里文 |
sw |
瑞典文 |
sv |
Tagalog |
tl |
大溪地文 |
ty |
塔吉克文 |
tg |
坦米爾文 |
ta |
韃靼文 |
tt |
泰盧固文 |
te |
泰文 |
th |
藏文 |
bo |
提格里尼亞文 |
ti |
東加文 |
to |
土耳其文 |
tr |
土庫曼文 |
tk |
烏克蘭文 |
uk |
烏都文 |
ur |
烏玆別克文 |
uz |
越南文 |
vi |
威爾斯文 |
cy |
班圖語 |
xh |
Yiddish |
yi |
約魯巴文 |
yo |
猶加敦馬雅文 |
yua |
祖魯語 |
zu |
版面配置
模型標識碼: 預先建置的配置
下表列出列印文字的支持語言:
語言 |
程式代碼 (選擇性) |
Abaza |
abq |
阿布哈茲文 |
ab |
阿欽文 |
ace |
Acoli |
ach |
Adangme |
ada |
Adyghe |
ady |
遠方 |
aa |
南非荷蘭文 |
af |
Akan |
ak |
阿爾巴尼亞文 |
sq |
阿岡昆 |
alq |
安吉卡(德瓦納加里) |
anp |
阿拉伯文 |
ar |
阿圖里亞文 |
ast |
阿蘇(坦尚尼亞) |
asa |
Avaric |
av |
阿瓦迪-印度文 (德瓦納加里) |
awa |
Aymara |
ay |
亞塞拜然文(拉丁文) |
az |
Bafia |
ksf |
巴蓋利 |
bfy |
Bambara |
bm |
巴什喀爾文 |
ba |
巴斯克文 |
eu |
白俄羅斯文(斯拉夫) |
be , be-cyrl |
白俄羅斯文(拉丁文) |
be , be-latn |
本巴(尚比亞) |
bem |
貝納(坦尚尼亞) |
bez |
Bhojpuri-印度文 (Devanagari) |
bho |
比科爾 |
bik |
Bini |
bin |
Bislama |
bi |
博多(德瓦納加里) |
brx |
波士尼亞文 (拉丁) |
bs |
Brajbha |
bra |
布列塔尼 |
br |
保加利亞文 |
bg |
邦德利 |
bns |
伯里亞特 (斯拉夫) |
bua |
加泰蘭文 |
ca |
Cebuano |
ceb |
查姆林 |
rab |
查莫羅 |
ch |
車臣 |
ce |
查蒂斯加里 (德瓦納加里) |
hne |
Chiga |
cgg |
簡體中文 |
zh-Hans |
繁體中文 |
zh-Hant |
Choctaw |
cho |
丘科特 |
ckt |
Chuvash |
cv |
康沃爾 |
kw |
科西坎 |
co |
Cree |
cr |
溪 |
mus |
克里米亞塔塔爾 (拉丁) |
crh |
克羅埃西亞文 |
hr |
烏鴉 |
cro |
捷克文 |
cs |
丹麥文 |
da |
Dargwa |
dar |
達利文 |
prs |
杜瑪律(德瓦納加里) |
dhi |
Dogri (德瓦納加里) |
doi |
Duala |
dua |
鄧根 |
dng |
荷蘭文 |
nl |
Efik |
efi |
英語 |
en |
埃爾齊亞(斯拉夫) |
myv |
愛沙尼亞文 |
et |
法羅語 |
fo |
斐濟文 |
fj |
菲律賓文 |
fil |
芬蘭文 |
fi |
語言 |
程式代碼 (選擇性) |
Fon |
fon |
法文 |
fr |
弗里利亞文 |
fur |
Ga |
gaa |
加古茲(拉丁) |
gag |
加利西亞文 |
gl |
甘達 |
lg |
蓋奧 |
gay |
德文 |
de |
吉伯特斯 |
gil |
岡迪 (德瓦納加里) |
gon |
希臘文 |
el |
格陵蘭 |
kl |
瓜拉尼 |
gn |
古隆(德瓦納加里) |
gvr |
Gusii |
guz |
海地克里奧爾文 |
ht |
哈爾比(德瓦納加里) |
hlb |
哈尼族 |
hni |
哈揚維 |
bgc |
夏威夷 |
haw |
Hebrew |
he |
Herero |
hz |
希里加農 |
hil |
印度文 |
hi |
苗道(拉丁) |
mww |
何(德瓦納吉里) |
hoc |
匈牙利文 |
hu |
Iban |
iba |
冰島文 |
is |
伊布文 |
ig |
伊洛科 |
ilo |
Inari Sami |
smn |
印尼文 |
id |
Ingush |
inh |
Interlingua |
ia |
Inuktitut (Latin) |
iu |
愛爾蘭文 |
ga |
義大利文 |
it |
日文 |
ja |
詹薩里 (德瓦納加里) |
Jns |
爪 哇 |
jv |
Jola-Fonyi |
dyo |
Kabardian |
kbd |
Kabuverdianu |
kea |
卡欽(拉丁) |
kac |
卡倫金 |
kln |
Kalmyk |
xal |
康里(德瓦納加里) |
xnr |
Kanuri |
kr |
卡拉查伊-巴爾卡爾 |
krc |
卡拉-卡爾派克(斯拉夫) |
kaa-cyrl |
卡拉-卡爾派克(拉丁) |
kaa |
Kashubian |
csb |
哈薩克文(斯拉夫) |
kk-cyrl |
哈薩克文(拉丁) |
kk-latn |
卡卡斯 |
kjh |
Khaling |
klr |
Khasi |
kha |
K'iche' |
quc |
Kikuyu |
ki |
基爾丁·薩米 |
sjd |
盧安達文 |
rw |
Komi |
kv |
孔戈 |
kg |
韓文 |
ko |
Korku |
kfq |
Koryak |
kpy |
科斯林 |
kos |
Kpelle |
kpe |
關山 |
kj |
庫米克(斯拉夫) |
kum |
庫德文 (阿拉伯文) |
ku-arab |
庫德文 (拉丁) |
ku-latn |
語言 |
程式代碼 (選擇性) |
庫魯克(德瓦納加里) |
kru |
吉爾吉斯(斯拉夫) |
ky |
Lak |
lbe |
拉科他州 |
lkt |
拉丁文 |
la |
拉脫維亞文 |
lv |
萊茲吉安 |
lex |
林加拉 |
ln |
立陶宛文 |
lt |
下索比安 |
dsb |
洛齊 |
loz |
Lule Sami |
smj |
羅(肯亞和坦尚尼亞) |
luo |
盧森堡文 |
lb |
盧亞 |
luy |
馬其頓文 |
mk |
麥克漢姆 |
jmc |
馬杜爾塞文 |
mad |
馬哈蘇·帕哈裡(德瓦納加里) |
bfz |
Makhuwa-Meetto |
mgh |
Makonde |
kde |
馬達加斯加文 |
mg |
馬來文 (拉丁) |
ms |
馬爾他文 |
mt |
瑪律托 (德瓦納加里) |
kmj |
曼丁卡 |
mnk |
Manx |
gv |
毛利文 |
mi |
Mapudungun |
arn |
馬拉地文 |
mr |
馬里(俄羅斯) |
chm |
馬賽 |
mas |
門德(塞拉利昂) |
men |
Meru |
mer |
Meta' |
mgo |
Minangkabau |
min |
莫霍克 |
moh |
蒙古文 (斯拉夫) |
mn |
Mongondow |
mog |
黑山(斯拉夫) |
cnr-cyrl |
黑山 (拉丁) |
cnr-latn |
莫裡斯延 |
mfe |
蒙當 |
mua |
納瓦特 |
nah |
納瓦霍 |
nv |
Ndonga |
ng |
那不勒斯 |
nap |
尼泊爾文 |
ne |
恩戈姆巴 |
jgo |
紐安 |
niu |
Nogay |
nog |
北恩德貝勒 |
nd |
北薩米 (拉丁) |
sme |
挪威文 |
no |
尼揚賈 |
ny |
Nyankole |
nyn |
Nzima |
nzi |
Occitan |
oc |
Ojibwa |
oj |
Oromo |
om |
Ossetic |
os |
潘潘加 |
pam |
Pangasinan |
pag |
帕皮亞門托 |
pap |
普什圖文 |
ps |
Pedi |
nso |
波斯文 |
fa |
波蘭文 |
pl |
葡萄牙文 |
pt |
旁遮普文(阿拉伯文) |
pa |
蓋楚瓦文 |
qu |
里普里亞文 |
ksh |
羅馬尼亞文 |
ro |
Romansh |
rm |
Rundi |
rn |
俄文 |
ru |
語言 |
程式代碼 (選擇性) |
Rwa |
rwk |
薩德里(德瓦納加里) |
sck |
薩哈文 |
sah |
Samburu |
saq |
薩摩亞文(拉丁) |
sm |
桑戈 |
sg |
桑古(加蓬) |
snq |
聖文(德瓦納加里) |
sa |
桑塔利(德瓦納吉里) |
sat |
蘇格蘭 |
sco |
蘇格蘭蓋爾文 |
gd |
塞納 |
seh |
塞爾維亞文 (斯拉夫) |
sr-cyrl |
塞爾維亞文 (拉丁) |
sr , sr-latn |
Shambala |
ksb |
Shona |
sn |
Siksika |
bla |
蘇爾馬里(德瓦納加里) |
srx |
Skolt Sami |
sms |
斯洛伐克文 |
sk |
斯洛維尼亞文 |
sl |
Soga |
xog |
索馬里(阿拉伯文) |
so |
索馬里(拉丁) |
so-latn |
松海 |
son |
南恩德貝勒 |
nr |
南阿爾泰 |
alt |
南薩米文 |
sma |
南索托 |
st |
西班牙文 |
es |
Sundanese |
su |
斯瓦希里文 (拉丁) |
sw |
Swati |
ss |
瑞典文 |
sv |
Tabassaran |
tab |
塔切爾希特 |
shi |
大溪地文 |
ty |
Taita |
dav |
塔吉克文 (斯拉夫) |
tg |
坦米爾文 |
ta |
塔塔爾 (斯拉夫) |
tt-cyrl |
塔塔爾 (拉丁) |
tt |
Teso |
teo |
Tetum |
tet |
泰文 |
th |
Thangmi |
thf |
Tok Pisin |
tpi |
東加文 |
to |
Tsonga |
ts |
茨瓦納語 |
tn |
土耳其文 |
tr |
土庫曼(拉丁) |
tk |
圖文 |
tyv |
Udmurt |
udm |
維吾爾族(斯拉夫) |
ug-cyrl |
烏克蘭文 |
uk |
上索布文 |
hsb |
烏都文 |
ur |
維吾爾文(阿拉伯文) |
ug |
烏茲別克文(阿拉伯文) |
uz-arab |
烏茲別克文 (斯拉夫) |
uz-cyrl |
烏茲別克文 (拉丁) |
uz |
越南文 |
vi |
Volapük |
vo |
Vunjo |
vun |
Walser |
wae |
威爾斯文 |
cy |
西弗里西亞文 |
fy |
沃洛夫文 |
wo |
班圖語 |
xh |
猶加敦馬雅文 |
yua |
Zapotec |
zap |
Zarma |
dje |
莊 |
za |
祖魯語 |
zu |
下表列出擷取和分析 列印 文字的配置模型語言支援。
語言 |
程式代碼 (選擇性) |
南非荷蘭文 |
af |
Angika |
anp |
阿拉伯文 |
ar |
阿圖里亞文 |
ast |
阿瓦迪 |
awa |
亞塞拜然文 |
az |
白俄羅斯文(斯拉夫) |
be , be-cyrl |
白俄羅斯文(拉丁文) |
be-latn |
巴蓋利 |
bfy |
馬哈蘇·帕哈裡 |
bfz |
保加利亞文 |
bg |
哈揚維 |
bgc |
博杰普爾文 |
bho |
Bislama |
bi |
邦德利 |
bns |
布列塔尼 |
br |
Braj |
bra |
Bodo |
brx |
波士尼亞文 |
bs |
Buriat |
bua |
加泰蘭文 |
ca |
Cebuano |
ceb |
查莫羅 |
ch |
黑山 (拉丁) |
cnr , cnr-latn |
黑山(斯拉夫) |
cnr-cyrl |
科西坎 |
co |
克里米亞塔塔爾 |
crh |
捷克文 |
cs |
Kashubian |
csb |
威爾斯文 |
cy |
丹麥文 |
da |
德文 |
de |
Dhimal |
dhi |
Dogri |
doi |
下索比安 |
dsb |
英語 |
en |
西班牙文 |
es |
愛沙尼亞文 |
et |
巴斯克文 |
eu |
波斯文 |
fa |
芬蘭文 |
fi |
菲律賓文 |
fil |
語言 |
程式代碼 (選擇性) |
斐濟文 |
fj |
法羅語 |
fo |
法文 |
fr |
弗里利亞文 |
fur |
西弗里西亞文 |
fy |
愛爾蘭文 |
ga |
Gagauz |
gag |
蘇格蘭蓋爾文 |
gd |
吉伯特斯 |
gil |
加利西亞文 |
gl |
Gondi |
gon |
Manx |
gv |
古隆 |
gvr |
夏威夷 |
haw |
印度文 |
hi |
哈爾比 |
hlb |
Chhattisgarhi |
hne |
哈尼族 |
hni |
Ho |
hoc |
克羅埃西亞文 |
hr |
上索布文 |
hsb |
海地文 |
ht |
匈牙利文 |
hu |
Interlingua |
ia |
印尼文 |
id |
冰島文 |
is |
義大利文 |
it |
依奴提圖特文 |
iu |
日文 |
|
Jaunsari |
jns |
爪 哇 |
jv |
卡拉-卡爾派克(拉丁) |
kaa , kaa-latn |
卡拉-卡爾派克(斯拉夫) |
kaa-cyrl |
卡欽文 |
kac |
Kabuverdianu |
kea |
Korku |
kfq |
Khasi |
kha |
哈薩克文(拉丁) |
kk , kk-latn |
哈薩克文(斯拉夫) |
kk-cyrl |
Kalaallisut |
kl |
Khaling |
klr |
瑪律托 |
kmj |
語言 |
程式代碼 (選擇性) |
韓文 |
|
科斯林 |
kos |
Koryak |
kpy |
卡拉查伊-巴爾卡爾 |
krc |
Kurukh |
kru |
Kölsch |
ksh |
庫德文 (拉丁) |
ku , ku-latn |
庫德文 (阿拉伯文) |
ku-arab |
Kumyk |
kum |
康沃爾 |
kw |
柯吉斯 |
ky |
拉丁文 |
la |
盧森堡文 |
lb |
拉科他州 |
lkt |
立陶宛文 |
lt |
毛利文 |
mi |
蒙古文 |
mn |
馬拉地文 |
mr |
馬來文 |
ms |
馬爾他文 |
mt |
苗族 Daw |
mww |
Erzya |
myv |
那不勒斯 |
nap |
尼泊爾文 |
ne |
紐安 |
niu |
荷蘭文 |
nl |
挪威文 |
no |
Nogai |
nog |
Occitan |
oc |
奧塞梯 |
os |
旁遮普文 |
pa |
波蘭文 |
pl |
達利文 |
prs |
Pushto |
ps |
葡萄牙文 |
pt |
K'iche' |
quc |
卡姆林 |
rab |
Romansh |
rm |
羅馬尼亞文 |
ro |
俄文 |
ru |
梵文 |
sa |
山塔利文 |
sat |
語言 |
程式代碼 (選擇性) |
薩德里 |
sck |
蘇格蘭 |
sco |
斯洛伐克文 |
sk |
斯洛維尼亞文 |
sl |
薩摩亞文 |
sm |
南薩米文 |
sma |
北薩米文 |
sme |
Lule Sami |
smj |
Inari Sami |
smn |
Skolt Sami |
sms |
索馬利文 |
so |
阿爾巴尼亞文 |
sq |
塞爾維亞文 (拉丁) |
sr , sr-latn |
Sirmauri |
srx |
瑞典文 |
sv |
史瓦西里文 |
sw |
Tetum |
tet |
塔吉克文 |
tg |
Thangmi |
thf |
土庫曼文 |
tk |
東加 |
to |
土耳其文 |
tr |
韃靼文 |
tt |
圖維尼亞文 |
tyv |
維吾爾族 |
ug |
烏都文 |
ur |
烏茲別克文 (拉丁) |
uz , uz-latn |
烏茲別克文 (斯拉夫) |
uz-cyrl |
烏茲別克文(阿拉伯文) |
uz-arab |
Volapük |
vo |
Walser |
wae |
康里 |
xnr |
Yucateco |
yua |
莊 |
za |
中文 (漢 (簡體中文)) |
zh , zh-hans |
中文 (漢 (繁體中文)) |
zh-hant |
祖魯語 |
zu |
語言 |
語言代碼 |
南非荷蘭文 |
af |
阿爾巴尼亞文 |
sq |
阿圖里亞文 |
ast |
巴斯克文 |
eu |
Bislama |
bi |
布列塔尼 |
br |
加泰蘭文 |
ca |
Cebuano |
ceb |
查莫羅 |
ch |
簡體中文 |
zh-Hans |
繁體中文 |
zh-Hant |
康沃爾 |
kw |
科西坎 |
co |
克里米亞塔塔爾 (拉丁) |
crh |
捷克文 |
cs |
丹麥文 |
da |
荷蘭文 |
nl |
英文(印刷和手寫) |
en |
愛沙尼亞文 |
et |
斐濟文 |
fj |
菲律賓文 |
fil |
芬蘭文 |
fi |
法文 |
fr |
弗里利亞文 |
fur |
加利西亞文 |
gl |
德文 |
de |
吉伯特斯 |
gil |
格陵蘭 |
kl |
海地克里奧爾文 |
ht |
哈尼族 |
hni |
苗道(拉丁) |
mww |
匈牙利文 |
hu |
印尼文 |
id |
Interlingua |
ia |
Inuktitut (Latin) |
iu |
愛爾蘭文 |
ga |
語言 |
語言代碼 |
義大利文 |
it |
日文 |
ja |
爪 哇 |
jv |
K'iche' |
quc |
Kabuverdianu |
kea |
卡欽(拉丁) |
kac |
卡拉-卡爾派克 |
kaa |
Kashubian |
csb |
Khasi |
kha |
韓文 |
ko |
庫爾德人 (拉丁) |
kur |
盧森堡文 |
lb |
馬來文 (拉丁) |
ms |
Manx |
gv |
那不勒斯 |
nap |
挪威文 |
no |
Occitan |
oc |
波蘭文 |
pl |
葡萄牙文 |
pt |
Romansh |
rm |
蘇格蘭 |
sco |
蘇格蘭蓋爾文 |
gd |
斯洛維尼亞文 |
slv |
西班牙文 |
es |
斯瓦希里文 (拉丁) |
sw |
瑞典文 |
sv |
塔塔爾 (拉丁) |
tat |
Tetum |
tet |
土耳其文 |
tr |
上索布文 |
hsb |
烏茲別克文 (拉丁) |
uz |
Volapük |
vo |
Walser |
wae |
西弗里西亞文 |
fy |
猶加敦馬雅文 |
yua |
莊 |
za |
祖魯語 |
zu |
下表列出擷取和分析 手寫 文字的配置模型語言支援。
語言 |
語言代碼 (選擇性) |
語言 |
語言代碼 (選擇性) |
英語 |
en |
日文 |
ja |
簡體中文 |
zh-Hans |
韓文 |
ko |
法文 |
fr |
葡萄牙文 |
pt |
德文 |
de |
西班牙文 |
es |
義大利文 |
it |
俄文(預覽) |
ru |
泰文(預覽) |
th |
阿拉伯文(預覽) |
ar |
模型標識碼: 預先建置的配置
下表列出擷取和分析 手寫 文字的配置模型語言支援。
語言 |
語言代碼 (選擇性) |
語言 |
語言代碼 (選擇性) |
英語 |
en |
日文 |
ja |
簡體中文 |
zh-Hans |
韓文 |
ko |
法文 |
fr |
葡萄牙文 |
pt |
德文 |
de |
西班牙文 |
es |
義大利文 |
it |
|
|
注意
Document Intelligence v2.1 不支援手寫文字擷取。
下表列出擷取和分析 手寫 文字的配置模型語言支援。
語言 |
語言代碼 (選擇性) |
語言 |
語言代碼 (選擇性) |
英語 |
en |
日文 |
ja |
簡體中文 |
zh-Hans |
韓文 |
ko |
法文 |
fr |
葡萄牙文 |
pt |
德文 |
de |
西班牙文 |
es |
義大利文 |
it |
俄文(預覽) |
ru |
泰文(預覽) |
th |
阿拉伯文(預覽) |
ar |
一般文件
重要
隨著文件智慧 v4.0:2024-02-29-preview、2023-10-31-preview 和未來,一般檔模型 (prebuilt-document) 會新增至版面配置 (prebuilt-layout)。 若要從檔擷取機碼/值組、選取標記、文字、數據表和結構,請使用下列模型:
索引鍵值組 |
version |
Model ID |
指定查詢字串features=keyValuePairs 的版面配置模型。 |
• v4:2024-02-29-preview, 2023-10-31-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
一般檔模型 |
• v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
模型標識碼: 預先建置的檔
下表列出一般檔模型語言支援。
模型 ID |
語言 — 地區設定程式代碼 |
預設 |
prebuilt-document |
英文 (美國)— en-US |
英文 (美國)— en-US |