Model dokumentu s ID pro rozpoznávání formulářů
Model dokumentu s ID kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely obsáhlého učení, které analyzují a extrahuje informace o klíčích z licencí na ovladače USA (všechny stavy 50 a oblast Kolumbie) a mezinárodní stránky Passport Biographical (s výjimkou víz a dalších cestovních dokumentů). Rozhraní API analyzuje dokumenty identity. extrahuje klíčové informace, jako je křestní jméno, příjmení, adresa a datum narození; a vrací strukturované znázornění dat JSON.
Ukázková licence k ovladači USA zpracovaná pomocí nástroje pro rozpoznávání formulářů
Možnosti vývoje
Nástroj pro rozpoznávání formulářů v 2.1 podporuje následující zdroje:
| Funkce | Zdroje informací |
|---|---|
| Model dokumentu ID |
Nástroj pro rozpoznávání formulářů v 3.0 podporuje následující zdroje:
| Funkce | Zdroje informací | ID modelu |
|---|---|---|
| Model dokumentu ID | předem sestavený – idDocument |
Vyzkoušet Nástroj pro rozpoznávání formulářů
Podívejte se, jak se z dokumentů ID extrahují data, včetně názvu, data narození, strojově čitelné zóny a data vypršení platnosti, a to pomocí nástroje pro rozpoznávání formulářů Studio nebo našeho nástroje pro popisky ukázek. Budete potřebovat následující:
Předplatné Azure – můžete ho vytvořit zdarma .
Instance pro rozpoznávání formulářů v Azure Portal. Službu můžete vyzkoušet pomocí bezplatné cenové úrovně (
F0). Po nasazení prostředků vyberte Přejít k prostředku a získejte klíč rozhraní API a koncový bod.
Rozpoznávání formulářů – Studio (Preview)
Poznámka
Nástroj pro rozpoznávání formulářů je k dispozici v rozhraní API Preview (v 3.0).
Na domovské stránce studia pro rozpoznávání formulářů vyberte faktury .
Můžete analyzovat ukázkovou fakturu nebo vybrat tlačítko + Přidat a nahrát si tak vlastní ukázku.
Vyberte tlačítko analyzovat :
Ukázkový nástroj pro popisky
Budete potřebovat dokument s ID. Můžete použít ukázkový dokument s ID.
Na domovské stránce nástroje Sample labeling vyberte použít předem sestavený model k získání dat.
Vyberte dokumenty identity z rozevírací nabídky typ formuláře :
Požadavky na vstup
- Nejlepších výsledků dosáhnete, když zadáte jednu z jasných fotografií nebo vysoce kvalitní kontrolu na dokument.
- Podporované formáty souborů: JPEG, PNG, BMP, TIFF a PDF (text – vložený nebo naskenovaný). Soubory PDF vložené do textu jsou nejvhodnější pro odstranění možnosti chyby při extrakci a umístění znaků.
- Pro PDF a TIFF se dají zpracovat až 2000 stránek (s předplatným úrovně Free, zpracovávají se jenom první dvě stránky).
- Velikost souboru musí být menší než 50 MB.
- Rozměry obrázku musí být mezi 50 × 50 pixelů a 10000 × 10000 pixelů.
- Rozměry PDF jsou až 17 × 17 palců, které odpovídají právnímu nebo a3 velikosti papíru nebo jsou menší.
- Celková velikost školicích dat je 500 stránek nebo méně.
- Pokud jsou vaše soubory PDF zamčené heslem, je nutné před odesláním odebrat zámek.
- Pro bezdohledový Learning (bez označení dat):
- Data musí obsahovat klíče a hodnoty.
- Klíče se musí nacházet nad nebo nalevo od hodnot. nemůžou se zobrazit níže nebo vpravo.
Poznámka
Nástroj pro označování ukázkových popisků nepodporuje formát souboru BMP. Toto je omezení nástroje, který není službou pro rozpoznávání formulářů.
Podporované jazyky a národní prostředí v 2.1
| Modelování | Jazyk – kód národního prostředí | Výchozí |
|---|---|---|
| ID dokumentu |
|
Angličtina (USA) – EN-US |
Extrakce polí
| Název | Typ | Description | Standardizovaný výstup |
|---|---|---|---|
| CountryRegion | Země | Kód země nebo oblasti odpovídající normě ISO 3166 Standard | |
| DateOfBirth | Date (Datum) | DOB | rrrr-mm-dd |
| DateOfExpiration | Date (Datum) | Datum vypršení platnosti DOB | rrrr-mm-dd |
| DocumentNumber | Řetězec | Příslušné číslo služby Passport, číslo řidičského průkazu atd. | |
| FirstName | Řetězec | Extrahováný křestní jméno a iniciála, pokud je k dispozici | |
| LastName | Řetězec | Extrahované příjmení | |
| Provozovatel | Země | Kód země nebo oblasti kompatibilní se standardem ISO 3166 (pouze Passport) | |
| Sex | Řetězec | Možné extrahované hodnoty zahrnují "M", "F" a "X" | |
| MachineReadableZone | Objekt | Extrahování služby Passport MRZ, včetně dvou řádků 44 znaků | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<<<<<<<<<<<<<<<<<<<<<<< 6 715816" |
| DocumentType | Řetězec | Typ dokumentu, například pas, licence k ovladači | užívat |
| Adresa | Řetězec | Extrahovaná adresa (jenom licence řidiče) | |
| Oblast | Řetězec | Extrahovaná oblast, stát, provincie atd. (jenom licence řidiče) |
Verze Preview nástroje pro rozpoznávání formulářů v 3.0
Verze Preview nástroje pro rozpoznávání formulářů přináší několik nových funkcí a možností:
- Model dokumentu ID (v 3.0) podporuje potvrzení, omezení a extrakci klasifikace vozidel z licencí ovladače USA.
Extrakce pole náhledu dokumentu ID
| Název | Typ | Description | Standardizovaný výstup |
|---|---|---|---|
| 🆕 potvrzení | Řetězec | Další oprávnění k řízení udělená řidiči, jako je například motocykl nebo školní sběrnice. | |
| omezení 🆕 | Řetězec | Omezená oprávnění pro řízení platná pro pozastavené nebo odvolané licence. | |
| 🆕 VehicleClassification | Řetězec | Typy vozidel, které mohou být řízeny ovladačem. | |
| CountryRegion | Země | Kód země nebo oblasti odpovídající normě ISO 3166 Standard | |
| DateOfBirth | Date (Datum) | DOB | rrrr-mm-dd |
| DateOfExpiration | Date (Datum) | Datum vypršení platnosti DOB | rrrr-mm-dd |
| DocumentNumber | Řetězec | Příslušné číslo služby Passport, číslo řidičského průkazu atd. | |
| FirstName | Řetězec | Extrahováný křestní jméno a iniciála, pokud je k dispozici | |
| LastName | Řetězec | Extrahované příjmení | |
| Provozovatel | Země | Kód země nebo oblasti kompatibilní se standardem ISO 3166 (pouze Passport) | |
| Sex | Řetězec | Možné extrahované hodnoty zahrnují "M", "F" a "X" | |
| MachineReadableZone | Objekt | Extrahování služby Passport MRZ, včetně dvou řádků 44 znaků | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<<<<<<<<<<<<<<<<<<<<<<< 6 715816" |
| DocumentType | Řetězec | Typ dokumentu, například pas, licence k ovladači | užívat |
| Adresa | Řetězec | Extrahovaná adresa (jenom licence řidiče) | |
| Oblast | Řetězec | Extrahovaná oblast, stát, provincie atd. (jenom licence řidiče) |
Průvodce migrací a REST API v 3.0
Informace o použití verze Preview ve vašich aplikacích a pracovních postupech najdete v naší příručce Průvodce migrací pro rozpoznávání formulářů v 3.0 .
Podívejte se na naše REST API (Preview) , kde najdete další informace o verzi Preview a nových funkcích.
Další kroky
Dokončete rychlé zprovoznění pro rozpoznávání formulářů:
Prozkoumejte naše REST API: