Dokumentumintelligencia-azonosító dokumentummodellje
Fontos
- A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz.
- A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
- A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-02-29-preview verziója.
- A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
Ez a tartalom a következőre vonatkozik::v4.0 (előzetes verzió) | Korábbi verziók:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Ez a tartalom a következőre vonatkozik::v3.1 (GA) | Legújabb verzió:v4.0 (előzetes verzió) | Korábbi verziók:v3.0v2.1
Ez a tartalom a következőre vonatkozik::v3.0 (GA) | Legújabb verziók:v4.0 (előzetes verzió)v3.1 | Korábbi verzió:v2.1
Ez a tartalom a következőre vonatkozik::v2.1 | Legújabb verzió:v4.0 (előzetes verzió)
A Dokumentumintelligencia-identitás (ID) modell az optikai karakterfelismerést (OCR) és a mélytanulási modelleket kombinálva elemzi és kinyeri a kulcsadatokat az identitásdokumentumokból. Az API elemzi az identitásdokumentumokat (beleértve a következőket is), és strukturált JSON-adatreprezentációt ad vissza:
- Passport book, passport card worldwide
- Jogosítvány Egyesült Államok, Európa, India, Kanada és Ausztrália területén
- Egyesült Államok azonosító kártyák, tartózkodási engedély (zöld kártya), társadalombiztosítási kártya, katonai azonosító
- Európai azonosító kártyák, tartózkodási engedélyek
- India PAN kártya, Aadhaar kártya
- Kanada azonosító kártyái, tartózkodási engedély (juharkártya)
- Ausztrália fényképkártya, kulcs-pass azonosító (beleértve a digitális verziót is)
A Dokumentumintelligencia képes elemezni és kinyerni a kormányzati azonosítókból származó információkat az előre összeállított azonosítómodell használatával. Egyesíti a hatékony optikai karakterfelismerési (OCR) képességeinket az azonosító-felismerési képességekkel, hogy kulcsadatokat nyerjen ki a Worldwide Passports és az amerikai illesztőprogram licenceiből (mind az 50 államból és a D.C.-ből). Az IDs API kulcsadatokat nyer ki ezekből az identitásdokumentumokból, például vezetéknév, vezetéknév, születési dátum, dokumentumszám stb. Ez az API a Document Intelligence 2.1-es verzióban érhető el felhőszolgáltatásként.
Identitásdokumentum feldolgozása
Az identitásdokumentum-feldolgozás magában foglalja az adatok kinyerését az identitásdokumentumokból manuálisan vagy OCR-alapú technológiával. Az azonosítódokumentum-feldolgozás fontos lépés minden olyan üzleti műveletben, amely identitásigazolást igényel. Ilyenek például a bankok és más pénzintézetek ügyfél-ellenőrzése, jelzálogkérelmek, orvosi látogatások, jogcímfeldolgozás, vendéglátás stb. Az egyének jogosítványokkal, útlevélekkel és más hasonló dokumentumokkal igazolják személyazonosságukat, hogy a vállalkozás hatékonyan ellenőrizhesse őket a szolgáltatások és előnyök biztosítása előtt.
A Document Intelligence Studióval feldolgozott amerikai illesztőprogram-licencminta
Adatkinyerés
Az előre összeállított azonosítók szolgáltatás kinyeri a kulcsértékeket a világútlevelekből és az amerikai jogosítványokból, és rendszerezett, strukturált JSON-válaszban adja vissza őket.
Példa az illesztőprogram licencére
Passport-példa
Fejlesztési lehetőségek
A Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Azonosító dokumentummodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított-idDocument |
A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Azonosító dokumentummodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított-idDocument |
A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Azonosító dokumentummodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított-idDocument |
A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források |
---|---|
Azonosító dokumentummodell | • Dokumentumintelligencia-címkézési eszköz • REST API • Ügyfélkódtár SDK • Dokumentumintelligencia Docker-tároló |
Bemeneti követelmények
A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
Támogatott fájlformátumok:
Modell PDF Kép:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTMLOlvasás ✔ ✔ ✔ Elrendezés ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Általános dokumentum ✔ ✔ Előre összeállított ✔ ✔ Egyéni kinyerés ✔ ✔ Egyéni besorolás ✔ ✔ ✔ (2024-02-29-preview) PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.
A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül
8
150 pont/hüvelyk (DPI) pont szövegnek felel meg.Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.
Egyéni besorolási modell betanítása esetén a betanítási adatok
1GB
teljes mérete legfeljebb 10 000 oldal lehet.
Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.
A PDF- és TIFF-fájlok oldalainak támogatott száma: legfeljebb 2000 oldal, vagy csak az első két oldal az ingyenes szintű előfizetők számára.
Támogatott fájlméret: kevesebb, mint 50 MB ÖSSZESEN; minimális képpontok: 50 x 50 px; maximális képpontméret 10 000 x 10 000 px.
Azonosító dokumentummodell adatainak kinyerése
Adatokat nyer ki, beleértve a nevet, a születési dátumot és a lejárati dátumot az azonosító dokumentumokból. A következő erőforrásokra van szüksége:
Azure-előfizetés – ingyenesen létrehozhat egyet.
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (
F0
). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.
Feljegyzés
A Document Intelligence Studio 3.1-s és 3.0-s verziójú API-kkal és újabb verziókkal érhető el.
A Document Intelligence Studio kezdőlapján válassza az Identitásdokumentumok lehetőséget.
Elemezheti a mintául szolgáló számlát, vagy feltöltheti saját fájljait.
Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:
Dokumentumintelligencia-mintacímkéző eszköz
Lépjen a dokumentumintelligencia-mintaeszközre.
A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.
Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.
Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:
A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.
A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.
A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.
Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Analyze Prebuilt API-t, és elemzi a dokumentumot.
Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.
Töltse le a JSON kimeneti fájlt a részletes eredmények megtekintéséhez.
- A "readResults" csomópont minden olyan szövegsort tartalmaz, amelyen a megfelelő határolókeret található az oldalon.
- A "selectionMarks" csomópont megjeleníti az összes kijelölési jelet (jelölőnégyzet, választójel), valamint azt, hogy az állapota ki van-e jelölve , vagy nincs bejelölve.
- A "pageResults" szakasz tartalmazza a kinyert táblákat. A Dokumentumintelligencia minden táblához kinyeri a szöveget, a sor- és oszlopindexet, a sor- és oszlopfedést, a határolókeretet és egyebeket.
- A "documentResults" mező a dokumentum legrelevánsabb részeire vonatkozó kulcs-/értékpár-információkat és sorelemek adatait tartalmazza.
Feljegyzés
A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.
Támogatott dokumentumtípusok
Régió | Dokumentumtípusok |
---|---|
Világszerte | Passport Book, Passport Card |
Egyesült Államok | Jogosítvány, azonosító kártya, tartózkodási engedély (zöld kártya), társadalombiztosítási kártya, katonai azonosító |
Európa | Jogosítvány, azonosító kártya, tartózkodási engedély |
India | Jogosítvány, PAN kártya, Aadhaar Kártya |
Kanada | Jogosítvány, azonosító kártya, tartózkodási engedély (juharkártya) |
Ausztrália | Jogosítvány, fényképkártya, kulcsigazolvány azonosítója (beleértve a digitális verziót is) |
Mezőkinyerések
Az alábbiakban a dokumentumtípusonként kinyert mezőket írjuk ki. A Dokumentumintelligencia-azonosító modell prebuilt-idDocument
a következő mezőket nyeri ki a documents.*.fields
. A json-kimenet tartalmazza a dokumentumokban, szavakban, vonalakban és stílusokban kinyert összes szöveget.
idDocument.driverLicense
Mező | Típus | Leírás | Példa |
---|---|---|---|
CountryRegion |
countryRegion |
Ország vagy régió kódja | USA |
Region |
string |
Állam vagy tartomány | Washington |
DocumentNumber |
string |
Illesztőprogram-licenc száma | WDLABCD456DG |
DocumentDiscriminator |
string |
Jogosítványlicenc-dokumentum diszkriminatív | 12645646464554646456464544 |
FirstName |
string |
Adott név és középső kezdőbetű, ha van | LIAM R. |
LastName |
string |
Vezetéknév | TALBOT |
Address |
address |
Cím | 123 STR ENTERPRISE KIADÁS T ADDRESS YOUR CITY WA 99999-1234 |
DateOfBirth |
date |
Születési dátum | 01/06/1958 |
DateOfExpiration |
date |
Lejárat dátuma | 08/12/2020 |
DateOfIssue |
date |
A probléma dátuma | 08/12/2012 |
EyeColor |
string |
Szemszín | Kék |
HairColor |
string |
Hajszín | Barna |
Height |
string |
Magasság | 5'11" |
Weight |
string |
Betűvastagság | 185LB |
Sex |
string |
Nem | H |
Endorsements |
string |
Jóváhagyások | L |
Restrictions |
string |
Korlátozások | h |
VehicleClassifications |
string |
Járműbesorolás | T |
idDocument.passport
Mező | Típus | Leírás | Példa |
---|---|---|---|
DocumentNumber |
string |
Útlevélszám | 340020013 |
FirstName |
string |
Adott név és középső kezdőbetű, ha van | JENNIFER |
MiddleName |
string |
Név a keresztnév és a vezetéknév között | REYES |
LastName |
string |
Vezetéknév | BROOKS |
Aliases |
array |
||
Aliases.* |
string |
Néven | MAT LIN |
DateOfBirth |
date |
Születési dátum | 1980-01-01 |
DateOfExpiration |
date |
Lejárat dátuma | 2019-05-05 |
DateOfIssue |
date |
A probléma dátuma | 2014-05-06 |
Sex |
string |
Nem | F |
CountryRegion |
countryRegion |
Kibocsátó ország vagy szervezet | USA |
DocumentType |
string |
Dokumentumtípusok | P |
Nationality |
countryRegion |
Állampolgárság | USA |
PlaceOfBirth |
string |
Születési hely | MASSACHU Standard kiadás TTS, Amerikai Egyesült Államok |
PlaceOfIssue |
string |
A probléma helye | LISSZABONI |
IssuingAuthority |
string |
Kibocsátó hatóság | Egyesült Államok Külügyminisztérium |
PersonalNumber |
string |
Személyes azonosító. Szám | A234567893 |
MachineReadableZone |
object |
Géppel olvasható zóna (MRZ) | P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816 |
MachineReadableZone.FirstName |
string |
Adott név és középső kezdőbetű, ha van | JENNIFER |
MachineReadableZone.LastName |
string |
Vezetéknév | BROOKS |
MachineReadableZone.DocumentNumber |
string |
Útlevélszám | 340020013 |
MachineReadableZone.CountryRegion |
countryRegion |
Kibocsátó ország vagy szervezet | USA |
MachineReadableZone.Nationality |
countryRegion |
Állampolgárság | USA |
MachineReadableZone.DateOfBirth |
date |
Születési dátum | 1980-01-01 |
MachineReadableZone.DateOfExpiration |
date |
Lejárat dátuma | 2019-05-05 |
MachineReadableZone.Sex |
string |
Nem | F |
idDocument.nationalIdentityCard
Mező | Típus | Leírás | Példa |
---|---|---|---|
CountryRegion |
countryRegion |
Ország vagy régió kódja | USA |
Region |
string |
Állam vagy tartomány | Washington |
DocumentNumber |
string |
Nemzeti személyazonosító igazolvány száma | WDLABCD456DG |
DocumentDiscriminator |
string |
Nemzeti személyazonossági kártya dokumentum diszkriminatív | 12645646464554646456464544 |
FirstName |
string |
Adott név és középső kezdőbetű, ha van | LIAM R. |
LastName |
string |
Vezetéknév | TALBOT |
Address |
address |
Cím | 123 STR ENTERPRISE KIADÁS T ADDRESS YOUR CITY WA 99999-1234 |
DateOfBirth |
date |
Születési dátum | 01/06/1958 |
DateOfExpiration |
date |
Lejárat dátuma | 08/12/2020 |
DateOfIssue |
date |
A probléma dátuma | 08/12/2012 |
EyeColor |
string |
Szemszín | KÉK |
HairColor |
string |
Hajszín | BARNA |
Height |
string |
Magasság | 5'11" |
Weight |
string |
Betűvastagság | 185LB |
Sex |
string |
Nem | H |
idDocument.residencePermit
Mező | Típus | Leírás | Példa |
---|---|---|---|
CountryRegion |
countryRegion |
Ország vagy régió kódja | USA |
DocumentNumber |
string |
Tartózkodási engedély száma | WDLABCD456DG |
FirstName |
string |
Adott név és középső kezdőbetű, ha van | LIAM R. |
LastName |
string |
Vezetéknév | TALBOT |
DateOfBirth |
date |
Születési dátum | 01/06/1958 |
DateOfExpiration |
date |
Lejárat dátuma | 08/12/2020 |
DateOfIssue |
date |
A probléma dátuma | 08/12/2012 |
Sex |
string |
Nem | H |
PlaceOfBirth |
string |
Születési hely | Németország |
Category |
string |
Engedélykategória | DV2 |
Address |
string |
Cím | 123 STR ENTERPRISE KIADÁS T ADDRESS YOUR CITY WA 99999-1234 |
idDocument.usSocialSecurityCard
Mező | Típus | Leírás | Példa |
---|---|---|---|
DocumentNumber |
string |
Társadalombiztosítási kártya száma | WDLABCD456DG |
FirstName |
string |
Adott név és középső kezdőbetű, ha van | LIAM R. |
LastName |
string |
Vezetéknév | TALBOT |
DateOfIssue |
date |
A probléma dátuma | 08/12/2012 |
idDocument
Mező | Típus | Leírás | Példa |
---|---|---|---|
Address |
address |
Cím | 123 STR ENTERPRISE KIADÁS T ADDRESS YOUR CITY WA 99999-1234 |
DocumentNumber |
string |
Illesztőprogram-licenc száma | WDLABCD456DG |
FirstName |
string |
Adott név és középső kezdőbetű, ha van | LIAM R. |
LastName |
string |
Vezetéknév | TALBOT |
DateOfBirth |
date |
Születési dátum | 01/06/1958 |
DateOfExpiration |
date |
Lejárat dátuma | 08/12/2020 |
Támogatott dokumentumtípusok
Az azonosító okmánymodell jelenleg támogatja az egyesült államokbeli jogosítványokat és az életrajzi oldalt a nemzetközi útlevelekből (a vízum és egyéb úti okmányok kivételével).
Kinyert mezők
Név | Típus | Leírás | Érték |
---|---|---|---|
Ország | Ország | Az ISO 3166 szabványnak megfelelő országkód | "USA" |
DateOfBirth | dátum: | DOB YYYY-MM-DD formátumban | "1980-01-01" |
DateOfExpiration | dátum: | Lejárati dátum YYYY-MM-DD formátumban | "2019-05-05" |
DocumentNumber | húr | Megfelelő útlevélszám, jogosítványszám stb. | "340020013" |
FirstName | húr | Kinyert utónév és középső kezdőbetű, ha van | "JENNIFER" |
LastName | húr | Kinyert vezetéknév | "BROOKS" |
Állampolgárság | Ország | Az ISO 3166 szabványnak megfelelő országkód | "USA" |
Nem | nem | Lehetséges kinyert értékek: "M" "F" "X" | "F" |
MachineReadableZone | object | Kinyert Passport MRZ, amely egyenként két 44 karakterből álló sorból áll | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | húr | Dokumentum típusa, például Passport, Driver's License | "útlevél" |
Cím | húr | Kinyert cím (csak az illesztőprogram licence) | "123 STR Enterprise kiadás T ADDRESS YOUR CITY WA 99999-1234" |
Régió | húr | Kinyert régió, állam, tartomány stb. (csak jogosítvány) | "Washington" |
Migrálási útmutató
Következő lépések
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Document Intelligence Studióval.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Dokumentumintelligencia mintacímkéző eszközzel.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.