Share via


Előre felépített szövegfelismerési modell

A szövegfelismerési előre felépített modellek gépileg olvasható karakterfolyamokba nyernek ki szavakat dokumentumokból és képekből. A képeken található nyomtatott és kézzel írott szöveg felismerésére a legújabb technológiát képviselő optikai karakterfelismerést (OCR) használnak.

Ez az modell feldolgozza a képeket és a dokumentumfájlokat a nyomtatott vagy kézzel írott szövegsorok kinyeréséhez.

Használat a Power Apps szolgáltatásban

Az előkészített szövegfelismerő modell a Power Apps szolgáltatásban a szövegfelismerő összetevő használatával érhető el. További információ:A szövegfelismerő összetevő használata a következőben: Power Apps

A Power Automate-ben való használat

További információ a modell Power Automate használatáról: A szövegfelismerés előre összeállított modelljének használata a következőben: A szövegfelismerés beépített modelljében Power Automate.

Támogatott nyelv, formátum és méret

A szövegfelismerési modellel szkennelhető fájloknak az alábbi jellemzőkkel kell rendelkezniük:

  • A nyomtatott szöveg nyelve: afrikaans, albán, angika (devanagiri), arab, asztúriai, awadhi-hindi (devanagiri), azerbajdzsáni (latin), bagheli, baszk, belarusz (cirill), belarusz (latin), bhojpuri-hindi (devanagiri), bislama, bodo (devanagiri), bosnyák (latin), brajbha, breton, bolgár, bundeli, burját (cirill), katalán, cebuano, chamling, chammorro, chhattisgarhi (devanagiri), kínai (egyszerűsített), kínai (hagyományos), kornis, korzikai tatár (latin), horvát, cseh, dán, dari, dhimal (devanagiri), dogri (devanagiri), holland, angol, erzya (cirill), észt, feröeri, fidzsi, filippínó, finn, francia, friuli, gagauz (latin), galíciai, német, gilbertese, gondi (devanagiri), grönlandi, gurung (devanagiri), haiti kreol, halbi (devanagiri), hani, haryanvi, hawaii, hindi, hmong daw (latin), ho (devanagiri), magyar, izlandi, inari számi, indonéz, interlinggua, inuktitut (latin), ír, olasz, japán, jaunsari (devanagiri), jávai, Kabuverdianu, Kachin (latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (cirill betűs), Kara-Kalpak (latin), Kashubian, Kazah (cirill betűs), kazah (latin), Khaling, Khasi, K'iche', koreai, Korku, Koryak, Kosraean, Kumyk (cirill), kurd (arab), kurd (latin), kurukh (Devanagiri), kirgiz (cirill betűs), lakota, latin, litván, alsó-szorb, lule számi, luxemburgi, Mahasu Pahari (Devanagiri), maláj (latin), máltai, malto (devanagiri), manx, maori, marathi, mongol (cirill), montenegrói (cirill betűs), montenegrói (latin betűs), nápolyi, nepáli, niueai, nogay, északi számi (latin), norvég, okcitán, osszetikai, pastu, perzsa, lengyel, portugál, pandzsábi (arab), ripuár, román, orosz, sadri (devanagiri), szamoai (latin), szanszkrit (devanagari), santali (devanagiri), skót, skóciai kelta, szerb (latin), serpa (devanagiri), sirmauri (devanagiri), skolt számi, szlovák, szlovén, szomáliai (arab), déli számi, spanyol, szuahéli (latin), svéd, tádzsik (cirill betűs), tatár (latin), tetum, thangmi, tongán, török, türkmén (latin), tuvan, felső szorb, urdu, ujgur (arab), üzbég (arab), üzbég (cirill betűs), üzbég (latin), volapük, walser, walser, walesi, nyugati fríz, Yucatec Maya, Zhuang, Zulu
  • A kézzel írt szöveg nyelve: angol, kínai (egyszerűsített), francia, német, olasz, japán, koreai, portugál, spanyol
  • Formátum:
    • JPG
    • PNG
    • BMP
    • PDF
  • Méret: maximum 20 MB
  • PDF-dokumentumok esetén csak az első 2,000-oldalt dolgozza fel a rendszer.

A modell kimenete

Ha a rendszer egy dokumentumot észlel, a szövegfelismerési modell kimenete a következő információ:

  • Eredmények: A bemeneti szövegből kinyert sorok listája.
  • Szöveg: Az észlelt szövegsort tartalmazó karakterláncok.
  • BoundingBox: A határolókeretet jelölő négy érték, amelyek leírása a felső és a bal oldali pozíció, valamint a szélesség és a magasság használatával történik.

Korlátozások

Akció Korlát Megújítási időszak
Szövegfelismerési hívások (környezetenként) 480 60 másodperc

Kapcsolódó információk

Oktatás: Szöveg felismerése a következővel AI Builder : (modul)