Anforderungen und Einschränkungen für ein Dokumentverarbeitungsmodell

Unterstützte Sprachen

Modell für Dokumente mit fester Vorlage

Die folgenden Sprachen werden unterstützt, wenn ein Dokumentverarbeitungsmodell trainiert und der Dokumententyp Dokumente mit fester Vorlage ausgewählt wird:

Abasinisch, Abchasisch, Achinesisch, Acholi, Adangbe, Adygeisch, Afar, Afrikaans, Akan, Albanisch, Algonkin, Angika (Devanagari), Arabisch, Asturisch, Asu (Tansania), Awarisch, Awadhi-Hindi (Devanagari), Aymara, Aserbaidschanisch (Latein), Bafia, Bagheli, Bambara, Baschkirisch, Baskisch, Belarussisch (Kyrillisch), Belarussisch (Latein), Bemba (Sambia), Bhojpuri-Hindi (Devanagari), Bikol, Bini, Bislama, Bodo (Devanagari), Bosnisch (Latein), Braj-Bhakha, Bretonisch, Bulgarisch, Bundeli, Burjatisch (Kyrillisch), Katalanisch, Cebuano, Chamling, Chamorro, Tschetschenisch, Chhattisgarhi (Devanagari), Chiga, Chinesisch (vereinfacht), Chinesisch (traditionell), Choctaw, Tschuktschisch, Tschuwaschisch, Kornisch, Korsisch, Cree, Creek, Krimtatarisch (Latein), Kroatisch, Crow, Tschechisch, Dänisch, Darginisch, Dari, Dhimal (Devanagari), Dogri (Devanagari), Duala, Dunganisch, Niederländisch, Efik, Englisch, Ersjanisch (Kyrillisch), Estnisch, Färöisch, Fidschi, Filipino, Finnisch, Fon, Französisch, Friaulisch, Ga, Gagausisch (Latein), Galizisch, Ganda, Gayo, Deutsch, Kiribatisch, Gondi (Devanagari), Griechisch, Grönländisch, Guarani, Gurung (Devanagari), Gusii, Haitianisch-Kreolisch, Halbi (Devanagari), Hani, Haryanvi, Hawaiisch, Hebräisch, Herero, Hiligaynon, Hindi, Hmong Daw (Latein), Ho (Devanagiri), Ungarisch, Iban, Isländisch, Igbo, Ilokano, Inarisamisch, Indonesisch, Inguschisch, Interlingua, Inuktitut (Latein), Irisch, Italienisch, Japanisch, Jaunsari (Devanagari), Javanisch, Jola-Fonyi, Kabardinisch, kapverdisches Kreol, Kachin (Latein), Kalendschin, Kalmückisch, Kangri (Devanagari), Kanuri, Karatschai-Balkarisch, Karakalpakisch (Kyrillisch), Karakalpakisch (Latein), Kaschubisch, Kasachisch (Kyrillisch), Kasachisch (Latein), Chakassisch, Khaling, Khasi, K'iche', Kikuyu, Kildinsamisch, Kinyarwanda, Komi, Kongo, Koreanisch, Korku, Korjakisch, Kosraeanisch, Kpelle, Kuanyama, Kumykisch (Kyrillisch), Kurdisch (Arabisch), Kurdisch (Latein), Kurukh (Devanagari), Kirgisisch (Kyrillisch), Lakisch, Lakota, Latein, Lettisch, Lesgisch, Lingala, Litauisch, Niedersorbisch, Lozi, Lulesamisch, Luo (Kenia und Tansania), Luxemburgisch, Luyia (Luy), Mazedonisch, Machame, Maduresisch, Mahasu Pahari (Devanagari), Makhuwa-Meetto, Makonde, Madagassisch, Malaiisch (Latein), Maltesisch, Malto (Devanagari), Mandinka, Manx, Maori, Mapudungun, Marathi, Mari (Russland), Masai, Mende (Sierra Leone), Meru, Meta', Minangkabau, Mohawk, Mongolisch (Kyrillisch), Mongondow, Montenegrinisch (Kyrillisch), Montenegrinisch (Latein), Morisyen, Mundang, Nahuatl, Navajo, Ndonga, Neapolitanisch, Nepalesisch, Ngomba, Niueanisch, Nogay, Nord-Ndebele, Nordsamisch (Latein), Norwegisch, Nyanja, Nyankole, Nzima, Okzitanisch, Ojibwa, Oromo, Ossetisch, Pampanga, Pangasinan, Papiamento, Paschtu, Pedi, Persisch, Polnisch, Portugiesisch, Punjabi (Arabisch), Quechua, Ripuarisch, Rumänisch, Rätoromanisch, Rundi, Russisch, Rwa, Sadri (Devanagari), Sacha, Samburu, Samoanisch (Latein), Sango, Sangu (Gabun), Sanskrit (Devanagari), Santali (Devanagiri), Schottisch, Schottisch-Gälisch, Sena, Serbisch (Kyrillisch), Serbisch (Latein), Shambala, Sherpa (Devanagari), Shona, Siksika, Sirmauri (Devanagari), Skoltsamisch, Slowakisch, Slowenisch, Soga, Somali (Arabisch), Somali (Latein), Songhai, Süd-Ndebele, Süd-Altai, Südsamisch, Süd-Sotho, Spanisch, Sundanesisch, Suaheli (Latein), Swati, Schwedisch, Tabassaran, Taschelhit, Tahitianisch, Taita, Tadschikisch (Kyrillisch), Tamil, Tatarisch (Kyrillisch), Tatarisch (Latein), Teso, Tetum, Thai, Thangmi, Tok Pisin, Tongaisch, Tsonga, Tswana, Türkisch, Turkmenisch (Latein), Tuwinisch, Udmurtisch, Uigurisch (Kyrillisch), Ukrainisch, Obersorbisch, Urdu, Uigurisch (Arabisch), Usbekisch (Arabisch), Usbekisch (Kyrillisch), Usbekisch (Latein), Vietnamesisch, Volapük, Vunjo, Walser, Walisisch, Westfriesisch, Wolof, Xhosa, Yukatekisches Maya, Zapotekisch, Zarma, Zhuang, Zulu

Modell für allgemeine Dokumente

Die folgenden Sprachen werden unterstützt, wenn ein Dokumentverarbeitungsmodell trainiert und der Dokumententyp Allgemeine Dokumente ausgewählt wird.

Afrikaans, Albanisch, Arabisch, Bulgarisch, Chinesisch (Han, vereinfacht), Chinesisch (Han, traditionell), Kroatisch, Tschechisch, Dänisch, Niederländisch, Estnisch, Finnisch, Französisch, Deutsch, Hebräisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Lettisch, Litauisch, Mazedonisch, Marathi, modernes Griechisch (1453-), Nepali (Makrosprache), Norwegisch, Panjabi, Persisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Slowakisch, Slowenisch, Somali (Arabisch), Somali (Latein), Spanisch, Suaheli (Makrosprache), Schwedisch, Tamil, Thailändisch, Türkisch, Ukrainisch, Urdu, Vietnamesisch

Anforderungen

Die Dokumentbearbeitung arbeitet mit Eingabedokumenten, die die folgenden Anforderungen erfüllen:

  • JPG, PNG oder PDF-Format (Text oder gescannt). In Text eingebettete PDFs eignen sich besser, da beim Extrahieren von Zeichen und ihrer Position keine Fehler auftreten.
  • TIFF-Dateien können nicht für Schulungen verwendet werden. Sie müssen Dokumente im PDF-, JPG- oder PNG-Format verwenden, um ein Modell zu trainieren. Sobald das Modell trainiert wurde, kann es Daten aus TIFF-Dateien extrahieren, wenn das Modell in einem Power Automate Cloud-Flow verwendet wird.
  • Wenn Ihre PDF-Dateien mit einem Kennwort gesperrt sind, müssen Sie die Sperre aufheben, bevor Sie sie senden.
  • Die maximale zu verarbeitende Dokumentgröße darf 20 MB nicht überschreiten.
  • Für Bilder müssen die Abmessungen zwischen 50 × 50 und 10.000 × 10.000 Pixel liegen.
  • Wenn Sie von Papierbelegen scannen, sollten die Scans von hoher Qualität sein.
  • Sie können bis zu 200 Sammlungen pro Modell erstellen.
  • In einem Cloud-Flow beträgt die Grenze der Felder, die für die Dokumentverarbeitung markiert werden können, 300.

Anmerkung

  • Das Extrahieren von Signaturen aus Dokumenten wird derzeit nicht unterstützt.
  • Felder, die sich über Seitengrenzen hinweg aufteilen, werden derzeit nicht unterstützt.
  • Zeilen, die von einer Seite zur anderen umbrechen, werden derzeit nicht unterstützt.

Optimierungstipp

Weitere Informationen zum Verbessern der Leistung von Dokumentverarbeitungsmodellen.

Nächster Schritt

Ein Formularverarbeitungsmodell erstellen