文件處理模型的要求與限制

支援的語言

固定式範本文件的模型

在訓練文件處理模型並選取固定式範本文件做為檔案類型時,支援以下語言:

阿巴札文、阿布哈茲文、阿齊文、阿科利文、阿當梅文、阿迪格文、阿法爾文、南非荷蘭文、阿坎文、阿爾巴尼亞文、阿爾岡昆文、安吉卡文 (天城文)、阿拉伯文、阿斯圖裡亞斯文、阿蘇文 (坦尚尼亞文)、阿瓦里克文、阿瓦迪-印地文 (天城文)、艾馬拉文、亞塞拜然文 (拉丁文)、巴菲亞文、巴格利文、班巴拉文、巴什基爾文、巴斯克文、白俄羅斯文 (西里爾文)、白俄羅斯文 (拉丁文)、本巴文 (尚比亞)、本巴文 (尚比亞)、博傑普爾-印地文 (天城文)、比科爾文、比尼文、比斯拉馬文、博多文 (天城文)、波士尼亞文 (拉丁文)、布拉吉巴文、布列塔尼文、保加利亞文、本德里文、布里亞特文 (西里爾文)、加泰隆尼亞文、宿霧文、查姆林文、查莫羅文、車臣文、恰蒂斯加爾文 (梵文)、奇加文、簡體中文、繁體中文、喬克托文、楚科特文、楚瓦什文、康沃爾文、科西嘉文、克里文、克里克文、克里米亞韃靼文 (拉丁文)、克羅埃西亞文、烏鴉文、捷克文、丹麥文、Dargwa、達裡文、Dhimal (梵文)、Dogri (梵文)、Duala、Dungan、荷蘭文、Efik、英文、Erzya (西里爾文)、愛沙尼亞文、法羅文、斐濟文、菲律賓文、芬蘭文、豐文、法文、弗留利文、加文、加告茲文 (拉丁文)、加利西亞文、甘達文、加尤文、德文、吉爾伯特文、貢迪文 (天城文)、希臘文、格陵蘭文、瓜拉尼文、古隆文 (天城文)、Gusii、海地語克里奧爾文、哈爾比文 (天城文)、哈尼文、哈里揚維文、夏威夷文、希伯來文、赫雷羅文、希利蓋農文、印地語文、苗族文 (拉丁文)、何文 (天城文)、匈牙利文、伊班文、冰島文、伊博文、伊洛科文、伊納裡薩米文、印尼文、印古什文、國際文、因紐特文 (拉丁文)、愛爾蘭文、義大利文、日文、Jaunsari (天城文)、爪哇文、Jola-Fonyi、卡巴爾達文、Kabuverdianu、克欽文 (拉丁文)、卡倫津文、卡爾梅克文、Kangri (天城文)、卡努里文、卡拉恰伊巴爾卡爾文、卡拉卡爾帕克文 (西里爾文)、卡拉-卡爾帕克 (拉丁文)、卡舒比文、哈薩克文 (西里爾文)、哈薩克文 (拉丁文)、哈卡斯文、卡林文、卡西文、K'iche'、基庫尤文、基爾丁薩米文、基尼亞盧安達文、科米文、剛果文、韓文、科爾庫文、科里亞克文、科斯拉文、克佩勒文、寬山文、庫梅克文 (西里爾文)、庫德文 (阿拉伯文)、庫德文 (拉丁文)、庫魯克文 (梵文)、吉爾吉斯文 (西里爾文)、拉克文、拉科塔文、拉丁文、拉脫維亞文、列茲吉安文、林加拉文、立陶宛文、下索布文、洛茲文、盧勒薩米文、羅文 (肯亞和坦尚尼亞)、盧森堡文、Luyia luy、馬其頓文、Machame、馬都拉文、Mahasu Pahari (天城文)、Makhuwa-Meetto、馬孔德文、馬達加斯加文、馬來文 (拉丁文)、馬耳他文、馬爾托文 (天城文)、曼丁卡文、馬恩島文、毛利文、馬普敦貢文、馬拉地文、馬利文 (俄羅斯)、馬賽文、門德文 (塞拉利昂)、梅魯文、梅塔文、米南加保文、莫霍克文、蒙古文 (西里爾文)、蒙貢多文、黑山文 (西里爾文)、黑山文 (拉丁文)、Morisyen、Mundang、納瓦特爾文、納瓦霍文、恩東加文、那不勒斯文、尼泊爾文、恩貢巴文、紐埃文、諾蓋文、北恩德貝萊文、北薩米文、奧吉布瓦文、奧羅莫文、奧塞梯文、邦板牙文、邦阿西南文、帕皮阿門托文、普什圖文、Pedi、波斯文、波蘭文、葡萄牙文、旁遮普文 (阿拉伯文)、克丘亞文、Ripuarian、羅馬尼亞文、羅曼什文、倫迪文、俄文、魯瓦文、薩德里文 (梵文)、薩哈文、桑布魯文、薩摩亞文 (拉丁文)、Sango、Sangu (加彭)、梵文 (天城文)、桑塔利文 (天城文)、蘇格蘭文、蘇格蘭蓋爾文、塞納文、塞爾維亞文 (西里爾文)、塞爾維亞文 (拉丁文)、香巴拉文、夏爾巴文 (天城文)、修納文、錫克西卡文、西毛里文 (天文學)、斯科爾特薩米文、斯洛伐克文、斯洛維尼亞文、索加文、索馬利文 (阿拉伯文)、索馬利文 (拉丁文)、桑海文、南恩德貝勒文、南阿爾泰文、南薩米文、南索托文、西班牙文、巽他文、斯瓦希里文 (拉丁文)、斯瓦蒂文、瑞典文、塔巴薩蘭文、塔切爾希特文、塔希提文、泰塔文、塔吉克文 (西里爾文)、泰米爾文、韃靼文 (西里爾字母)、韃靼文 (拉丁文)、特索文、德頓文、泰文、唐米文、托克皮辛文、東加文、特松加文、茨瓦納文、土耳其文、土庫曼文 (拉丁文)、圖瓦文、烏德穆爾特文、維吾爾文 (西里爾文)、烏克蘭文、上索布文、烏爾都文、維吾爾文 (阿拉伯文)、烏茲別克文 (阿拉伯文)、烏茲別克文 (西里爾文)、烏茲別克文 (拉丁文)、越南文、沃拉普克文、文喬文、瓦爾澤文、威爾斯文、西弗里斯蘭文、沃洛夫文、科薩文、尤卡坦瑪雅文、薩巴特克文、扎爾馬文、壯文、祖魯語

通用文件的模型

在訓練文件處理模型並選取通用文件做為檔案類型時,支援以下語言。

南非荷蘭文、阿爾巴尼亞文、阿拉伯文、保加利亞文、中文 (簡體中文)、中文 (繁體中文)、克羅埃西亞文、捷克文、丹麥文、荷蘭文、愛沙尼亞文、芬蘭文、法文、德文、希伯來語文、印地文、匈牙利文、印尼文、義大利文、日文、韓文、拉脫維亞文、立陶宛文、馬其頓文、馬拉地文、現代希臘文 (1453-)、尼泊爾文 (宏語言)、挪威文、旁遮普文、波斯文、波蘭文、葡萄牙文、羅馬尼亞文、俄文、斯洛伐克文、斯洛維尼亞文、索馬利文 (阿拉伯文)、索馬利文 (拉丁文)、西班牙文、斯瓦希里文 (宏語言)、瑞典文、泰米爾文、泰文、土耳其文、烏克蘭文、烏爾都文、越南語

需求

文件處理可搭配符合下列需求的輸入文件使用:

  • JPG、PNG 或 PDF 格式 (文字或掃描)。 內嵌文字的 PDF 比較好,因為在擷取和定位字元時不會有任何錯誤。
  • TIFF 檔案不能用於定型。 您將需要使用 PDF、JPG 或 PNG 格式的文件來定型模型。 模型經過定型後,當模型用於 Power Automate 雲端流程時,它可以從 TIFF 檔案中擷取資料。
  • 如果您的 PDF 有密碼鎖定,則必須在提交之前移除鎖定。
  • 要處理的文件大小上限不得超過 20 MB。
  • 在影像方面,維度必須介於 50 × 50 和 10,000 × 10,000 像素之間。
  • 如果掃描自書面文件,掃描出來的檔案應該要是高品質的影像。
  • 每個模型最多可以建立 200 個集合。
  • 在雲端流程中,可以標記用於文件處理的欄位限制為 300。

注意

  • 目前不支援從文件擷取簽章。
  • 目前不支援跨頁面邊界進行分割的欄位。
  • 目前不支援從一個頁面換行至另一個頁面的資料列。

最佳化提示

了解如何改善文件處理模型的效能

下一個步驟

建立表單處理模型