Vordefiniertes Texterkennungsmodell

Artikel
01/10/2024

Das vordefinierte Texterkennungsmodell extrahiert Wörter aus Dokumenten und Bildern in maschinell lesbare Zeichenströme. Verwendet wird dabei hochmoderne optische Zeichenerkennung (OCR), um in Bildern gedruckten und handgeschriebenen Text zu ermitteln.

Dieses Modell verarbeitet Bilder und Dokumentdateien, um die Zeilen des gedruckten oder handgeschriebenen Texts zu extrahieren.

In Power Apps verwenden

Das vordefinierte Texterkennungsmodell ist in Power Apps mithilfe der Texterkennungskomponente verfügbar. Weitere Informationen: Verwenden der Texterkennungskomponente in Power Apps

In Power Automate verwenden

Informationen zur Verwendung dieses Modells in Power Automate erhalten Sie unter Das vordefinierte Modell zur Texterkennung in Power Automate verwenden.

Unterstützte Sprache, Format und Größe

Die Dateien, die Sie mit dem Texterkennungsmodell überprüfen können, müssen diese Eigenschaften haben:

Sprache für Drucktext : Afrikaans, Albanisch, Angika (Devanagiri), Arabisch, Asturisch, Awadhi-Hindi (Devanagiri), Aserbaidschanisch (Latein), Bagheli, Baskisch, Belarussisch (Kyrillisch), Belarussisch (Latein), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnisch (Lateinisch), Brajbha, Bretonisch, Bulgarisch, Bundeli, Burjatisch (Kyrillisch), Katalanisch, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinesisch (vereinfacht), Chinesisch (traditionell), Kornisch, Korsisch, Krim Tatarisch (Latein), Kroatisch, Tschechisch, Dänisch, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Niederländisch, Englisch, Erzya (Kyrillisch), Estnisch, Färöisch, Fidschianisch, Philippinisch, Finnisch, Französisch, Friaulisch, Gagausisch (Latein), Galicisch, Deutsch, Gilbertese, Gondi (Devanagiri), Grönländisch, Gurung (Devanagiri), Haitianisches Kreolisch, Halbi (Devanagiri), Hani, Haryanvi, Hawaiianisch, Hindi, Hmong Daw (Lateinisch), Ho(Devanagiri), Ungarisch, Isländisch, Inari-Samisch, Indonesisch, Interlingua, Inuktitut (Latein), Irisch, Italienisch, Japanisch, Jaunsari (Devanagiri), Javanisch, Kabuverdianu, Kachin (Latein), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Kyrillisch), Kara-Kalpak (Latein), Kaschubisch, Kasachisch (Kyrillisch), Kasachisch (Latein), Khaling, Khasi, K'iche', Koreanisch, Korku, Koryak, Kosraean, Kumyk (Kyrillisch), Kurdisch (Arabisch), Kurdisch (Latein), Kurukh (Devanagiri), Kirgisisch (Kyrillisch), Lakota, Latein, Litauisch, Niedersorbisch, Lulesami, Luxemburgisch, Mahasu Pahari (Devanagiri), Malaiisch (Latein), Maltesisch, Malto (Devanagiri), Manx, Maori, Marathi, Mongolisch (Kyrillisch), Montenegrinisch (Kyrillisch), Montenegrinisch (Lateinisch), Neapolitanisch, Nepali, Niuean, Nogay, Nordsamisch (Lateinisch), Norwegisch, Okzitanisch, Ossetisch, Paschtu, Persisch, Polnisch, Portugiesisch, Punjabi (Arabisch), Ripuarisch, Rumänisch, Rätoromanisch, Russisch, Sadri (Devanagiri), Samoanisch (Latein), Sanskrit (Devanagari), Santali (Devanagiri), Schottisch, Schottisch-Gälisch, Serbisch (Latein), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skoltsamisch, Slowakisch, Slowenisch, Somali (Arabisch), Südsamisch, Spanisch, Suaheli (Lateinisch), Schwedisch, Tadschikisch (Kyrillisch), Tatarisch (Lateinisch), Tetum, Thangmi, Ton Gan, Türkisch, Turkmenisch (Lateinisch), Tuwinisch, Obersorbisch, Urdu, Uigurisch (Arabisch), Usbekisch (Arabisch), Usbekisch (Kyrillisch), Usbekisch (Lateinisch), Volapük, Walser, Walisisch, Westfriesisch, Yucatec Maya, Zhuang, Zulu-
Sprache für handgeschriebenen Text : Englisch, Chinesisch (vereinfacht), Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Spanisch
Format:
- JPG
- PNG
- BMP
- PDF
Größe: max. 20 MB
Bei PDF-Dokumenten werden nur die ersten 2,000 Seiten verarbeitet.

Modellausgabe

Wenn ein Dokument erkannt wird, gibt das Texterkennungsmodell die folgenden Informationen aus:

Ergebnisse: Eine Liste der aus dem Eingabetext extrahierten Zeilen.
Text: Zeichenfolgen, welche die erkannten Textzeilen enthalten.
BoundingBox: Vier Werte, die das umgebende Feld darstellen, das anhand der Positionen oben und links sowie der Breite und Höhe beschrieben wird

Grenzwerte

Action	Limit	Erneuerungszeitraum
Aufruf der Texterkennung (pro Umgebung)	480	60 Sekunden

Siehe auch

Training: Text mit AI Builder erkennen (Modul)