Mi az az Azure Form Recognizer?

Fontos

Transport Layer Security (TLS) 1.2 mostantól a szolgáltatásnak szóló összes HTTP-kérésre érvényes. További információ: Azure Cognitive Services.

Az Azure Form Recognizer az Azure Alkalmazott AI-szolgáltatások része, amellyel automatizált adatfeldolgozási szoftvereket építhet ki gépi tanulási technológiával. Azonosíthatja és kinyerhet szövegeket, kulcs/érték párokat, kijelölési jeleket, táblákat és struktúrát a dokumentumokból. A szolgáltatás strukturált adatokat ad vissza, amelyek tartalmazzák az eredeti fájlban lévő kapcsolatokat, a határolókereteket és a — megbízhatóságot. Gyorsan pontos eredményeket kap, amelyek az adott tartalomhoz vannak szabva anélkül, hogy nagy manuális beavatkozásra vagy kiterjedt adattudományi szakértelemre volna szükség. A Form Recognizer automatizálhatja az adatbevitelt az alkalmazásokban, és gazdagíthatja a dokumentumok keresési képességeit.

Form Recognizer egyéni dokumentumfeldolgozási modellekből, előre összeállított számlamodellekből, nyugtákból, kiosztási kártyákból és elrendezési modellekből áll. Az összetettség csökkentése Form Recognizer és a munkafolyamatba vagy alkalmazásba való integrálása érdekében REST API kódtár-SDK-k használatával hívhatja meg a modellmodelleket.

Ez a dokumentáció a következő cikktípusokat tartalmazza:

  • A fogalmak részletes magyarázatot nyújtanak a szolgáltatás funkcióiról és funkcióiról.
  • A rövid útmutatók olyan első lépések, amelyek végigvezetik a szolgáltatásnak indított kérések folyamatán.
  • Az útmutatók a szolgáltatás pontosabb vagy testreszabottabb módon való használatával kapcsolatos utasításokat tartalmaznak.
  • Az oktatóanyagok hosszabb útmutatók, amelyekből megtudhatja, hogyan használhatja a szolgáltatást összetevőként a szélesebb körű üzleti megoldásokban.

Form Recognizer funkciók

A Form Recognizer a következő funkciókkal egyszerűen kinyerheti és elemezheti a dokumentumadatokat:

Elrendezés

Szöveg,kijelölési jelek és táblák szerkezetének kinyerés a határolókeret koordinátáival együtt a dokumentumokból.

Form Recognizer nagy felbontású optikai karakterfelismeréssel (OCR) és egy továbbfejlesztett mélytanulásmodellel kinyerheti a szövegeket, a kijelölési jeleket és a táblastruktúrát (a szöveghez társított sor- és oszlopszámokat).

példatáblákra

Egyéni modellek

Szöveg,kulcs/érték párok, kijelölési jelek és táblaadatok kinyerása űrlapokból. Ezek a modellek a saját adataival vannak betanítva, így az Űrlapokhoz vannak szabva.

Form Recognizer egyéni modellek a saját adataira képeznek betanításokat, és csak öt mintabeviteli űrlapra van szükség a kezdéshez. A betanított dokumentumfeldolgozási modell olyan strukturált adatokat képes kihozni, amelyek tartalmazzák az eredeti űrlapdokumentumban található kapcsolatokat. A modell betanítása után tesztelheti és újra betaníthatja, majd végül arra használhatja, hogy az igényeinek megfelelően megbízhatóan kinyerje az adatokat több űrlapról.

Egyéni modellek betanításakor a következő lehetőségek állnak rendelkezésre: betanítás címkével jelölt adatokkal és címkével nem jelölt adatokkal.

Betanítás címkék nélkül

Form Recognizer nem felügyelet nélküli tanulással érti meg az űrlapok mezőinek és bejegyzéseinek elrendezését és kapcsolatait. A bemeneti űrlapok elküldésekor az algoritmus típus szerint csoportosítja az űrlapokat, felderíti, hogy milyen kulcsok és táblák vannak jelen, és kulcsokkal és bejegyzésekkel társítja az értékeket a táblákhoz. A címkék nélküli betanítás nem igényel manuális adatcímkézást vagy intenzív kódolást és karbantartást, ezért javasoljuk, hogy először próbálja ki ezt a módszert.

A betanítás dokumentumainak gyűjtésével kapcsolatos tippekért lásd: Képzési adatkészlet létrehozása.

Betanítás címkékkel

A címkével jelölt adatokkal való betanításkor a modell felügyelt tanulással kinyeri a hasznos értékeket az Ön által megadott címkével jelölt űrlapokkal. A címkével jelölt adatok jobb teljesítő modelleket hoznak létre, és olyan modelleket hoznak létre, amelyek összetett űrlapokkal vagy kulcs nélküli értékeket tartalmazó űrlapokkal működnek.

Form Recognizer a Layout API-val tanulja meg a nyomtatott és kézzel írt szövegelemek várható méretét és pozícióit, és kinyeri a táblákat. Ezután a felhasználó által megadott címkékkel tanulja meg a dokumentumokban lévő kulcs/érték társításokat és táblákat. Javasoljuk, hogy egy új modell betanításakor használjon öt manuálisan címkével jelölt, azonos típusú (azonos szerkezetű) űrlapot az első lépésekhez, és szükség szerint adjon hozzá további címkével jelölt adatokat a modell pontosságának javításához. Form Recognizer modell betanítható a kulcs-érték párok és táblák felügyelt tanulási képességekkel való kinyerére.

A Betanítás címkékkel – első lépések

Előre összeállított modellek

Form Recognizer előre összeállított modelleket is tartalmaz a nyugták, névjegykártyák, számlák és identitásdokumentumok automatizált adatfeldolgozásához.

Nyugták

Az előre összeállított nyugtamodell az Ausztrália, Kanada, Nagy-Egyesült Királyság, India és az éttermek, benzinkutak, kiskereskedelem stb. által használt Egyesült Államok angol értékesítési nyugták beolvasására — használható. Ez a modell olyan fontos információkat von ki, mint például a tranzakció időpontja és dátuma, a kereskedő adatai, az adók összegei, a sorelemek, az összegek stb. Emellett az előre összeállított nyugtamodell úgy van betanítva, hogy elemezze és visszaadja a nyugtán található összes szöveget.

minta-nyugta

Névjegykártyák

A Névjegykártyák modell lehetővé teszi olyan információk kinyerét a névjegykártyákról, mint például a személy neve, beosztása, címe, e-mail-címe, vállalata és telefonszámai angol nyelven.

névjegykártyaminta

Számlák

Az előre összeállított számlamodell különböző formátumokban kinyeri az adatokat a számlákból, és strukturált adatokat ad vissza. Ez a modell kinyeri a legfontosabb információkat, például a számlaazonosítót, az ügyféladatokat, a szállító adatait, a kiszállító adatait, a kiszállítót, a számlázási adatokat, az összegeket, az adókat, a részösszegeket, a sorelemeket stb. Emellett az előre összeállított számlamodell úgy van betanítva, hogy elemezze és visszaadja a számlán szereplő összes szöveget és táblát.

mintaszámla

Identitásdokumentumok

Az Identitásdokumentumok (ID) modell lehetővé teszi, hogy kulcsinformációkat kinyerje az egész világra érvényes passports és US driver licenses (USA-jú sofőrlicencek) alapján. Olyan adatokat is kinyer, mint például a dokumentum azonosítója, a születési dátum, a lejárat dátuma, a név, az ország, a régió, a gép által olvasható zóna stb.

mintaazonosító kártya

Bevezetés

A Sample Form Recognizer Tool használatával kipróbálhatja az elrendezést, az előre felépített modelleket, és betaníthat egy egyéni modellt a dokumentumokhoz. Szüksége lesz egy Azure-előfizetésre (hozzon létre egyet ingyenesen), valamint egy Form Recognizer erőforrásvégpontra és kulcsra a Form Recognizer kipróbálása érdekében.

Kövesse az ügyféloldali kódtárat REST API rövid útmutatót a dokumentumok adatainak kinyeréséhez. Javasoljuk, hogy a technológia tanulásakor használja az ingyenes szolgáltatást. Ne feledje, hogy az ingyenes oldalak száma havonta legfeljebb 500 lehet.

További információért tekintse REST API referenciadokumentációját. Ha már ismeri az API egy korábbi verzióját, az Újdonságok cikkben talál további információt a legutóbbi változásokról.

Bemeneti követelmények

Form Recognizer a következő követelményeknek megfelelő bemeneti dokumentumokon működik:

  • A formátumnak JPG, PNG, PDF (szöveg vagy szkennelt) vagy TIFF formátumúnak kell lennie. A szövegbe ágyazott PDF-ek a legjobbak, mert a karakterkinyerés és a hely nem hibás.
  • A fájlméretnek 50 MB-nál kisebbnek kell lennie.
  • A képméretnek 50 x 50 és 10000 x 10000 képpont között kell lennie.
  • A PDF-méreteknek legalább 17 x 17 hüvelyknek kell lenniük, ami jogi vagy A3-as papírméretnek és kisebbnek kell lennie.
  • PDF és TIFF esetén csak az első 200 oldal lesz feldolgozva (ingyenes szintű előfizetéssel csak az első két oldal lesz feldolgozva).
  • A betanítás adatkészletének teljes méretének legalább 500 oldalnak kell lennie.
  • Ha a PDF-fájlok zárolva vannak a jelszóban, el kell távolítania a zárolást, mielőtt beküldi azokat.
  • Papírdokumentumok vizsgálata esetén az űrlapoknak jó minőségűnek kell lennie.
  • A nem felügyelet nélküli (címkével jelölt adatok nélküli) tanuláshoz az adatoknak kulcsokat és értékeket kell tartalmazni.
  • A nem felügyelet nélküli (címkével jelölt adatok nélküli) tanuláshoz a kulcsoknak az értékek felett vagy bal oldalon kell megjelenniük; nem jelennek meg az alatta vagy a jobb oldalon.

Szolgáltatás rendelkezésre állása és redundancia

Rugalmas Form Recognizer-e a szolgáltatászóna?

Igen. A Form Recognizer szolgáltatás alapértelmezés szerint rugalmas a zónák számára.

Hogyan a Form Recognizer szolgáltatást zónatred rugalmasra konfigurálni?

A zóna rugalmasságának engedélyezéséhez nincs szükség ügyfélkonfigurációra. Az erőforrások zónatűrése Form Recognizer alapértelmezés szerint elérhető, és maga a szolgáltatás kezeli.

Adatvédelem és biztonság

  • Mint minden kognitív szolgáltatást, a Form Recognizer szolgáltatást használó fejlesztőknek is tisztában kell lenniük az ügyféladatokra vonatkozó Microsoft-szabályzatokkal. További Cognitive Services a Microsoft Biztonsági és biztonsági központ Cognitive Services oldalon.

  • Form Recognizer nem tárolja és nem feldolgoz ügyféladatokat azon a régión kívül, ahol az ügyfél üzembe helyezheti a szolgáltatáspéldányt.

Következő lépések

Próbálja ki online eszközünket és rövid útmutatóját, ha többet szeretne megtudni a Form Recognizer szolgáltatásról.