Model dokumentu s ID pro rozpoznávání formulářů

Model dokumentu s ID kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely obsáhlého učení, které analyzují a extrahuje informace o klíčích z licencí na ovladače USA (všechny stavy 50 a oblast Kolumbie) a mezinárodní stránky Passport Biographical (s výjimkou víz a dalších cestovních dokumentů). Rozhraní API analyzuje dokumenty identity. extrahuje klíčové informace, jako je křestní jméno, příjmení, adresa a datum narození; a vrací strukturované znázornění dat JSON.

Ukázková licence k ovladači USA zpracovaná pomocí nástroje pro rozpoznávání formulářů

Ukázka identifikační karty

Možnosti vývoje

Nástroj pro rozpoznávání formulářů v 2.1 podporuje následující zdroje:

Funkce Zdroje informací
Model dokumentu ID

Nástroj pro rozpoznávání formulářů v 3.0 podporuje následující zdroje:

Funkce Zdroje informací ID modelu
Model dokumentu ID předem sestavený – idDocument

Vyzkoušet Nástroj pro rozpoznávání formulářů

Podívejte se, jak se z dokumentů ID extrahují data, včetně názvu, data narození, strojově čitelné zóny a data vypršení platnosti, a to pomocí nástroje pro rozpoznávání formulářů Studio nebo našeho nástroje pro popisky ukázek. Budete potřebovat následující:

Snímek obrazovky: klíče a umístění koncového bodu v Azure Portal.

Rozpoznávání formulářů – Studio (Preview)

Poznámka

Nástroj pro rozpoznávání formulářů je k dispozici v rozhraní API Preview (v 3.0).

  1. Na domovské stránce studia pro rozpoznávání formulářů vyberte faktury .

  2. Můžete analyzovat ukázkovou fakturu nebo vybrat tlačítko + Přidat a nahrát si tak vlastní ukázku.

  3. Vyberte tlačítko analyzovat :

    Snímek obrazovky: nabídka analýza dokumentu ID

Ukázkový nástroj pro popisky

Budete potřebovat dokument s ID. Můžete použít ukázkový dokument s ID.

  1. Na domovské stránce nástroje Sample labeling vyberte použít předem sestavený model k získání dat.

  2. Vyberte dokumenty identity z rozevírací nabídky typ formuláře :

    Snímek obrazovky: Ukázka výběr nástrojů pro popisky v nabídce Výběr předem sestaveného modelu rozevíracího seznamu.

Požadavky na vstup

  • Nejlepších výsledků dosáhnete, když zadáte jednu z jasných fotografií nebo vysoce kvalitní kontrolu na dokument.
  • Podporované formáty souborů: JPEG, PNG, BMP, TIFF a PDF (text – vložený nebo naskenovaný). Soubory PDF vložené do textu jsou nejvhodnější pro odstranění možnosti chyby při extrakci a umístění znaků.
  • Pro PDF a TIFF se dají zpracovat až 2000 stránek (s předplatným úrovně Free, zpracovávají se jenom první dvě stránky).
  • Velikost souboru musí být menší než 50 MB.
  • Rozměry obrázku musí být mezi 50 × 50 pixelů a 10000 × 10000 pixelů.
  • Rozměry PDF jsou až 17 × 17 palců, které odpovídají právnímu nebo a3 velikosti papíru nebo jsou menší.
  • Celková velikost školicích dat je 500 stránek nebo méně.
  • Pokud jsou vaše soubory PDF zamčené heslem, je nutné před odesláním odebrat zámek.
  • Pro bezdohledový Learning (bez označení dat):
    • Data musí obsahovat klíče a hodnoty.
    • Klíče se musí nacházet nad nebo nalevo od hodnot. nemůžou se zobrazit níže nebo vpravo.

Poznámka

Nástroj pro označování ukázkových popisků nepodporuje formát souboru BMP. Toto je omezení nástroje, který není službou pro rozpoznávání formulářů.

Podporované jazyky a národní prostředí v 2.1

Modelování Jazyk – kód národního prostředí Výchozí
ID dokumentu
  • Angličtina (USA) – EN-US (řidičský průkaz)
  • Biographical stránky od mezinárodních cestovních pasů
    (kromě víz a jiných cestovních dokumentů)

Angličtina (USA) – EN-US

Extrakce polí

Název Typ Description Standardizovaný výstup
CountryRegion Země Kód země nebo oblasti odpovídající normě ISO 3166 Standard
DateOfBirth Date (Datum) DOB rrrr-mm-dd
DateOfExpiration Date (Datum) Datum vypršení platnosti DOB rrrr-mm-dd
DocumentNumber Řetězec Příslušné číslo služby Passport, číslo řidičského průkazu atd.
FirstName Řetězec Extrahováný křestní jméno a iniciála, pokud je k dispozici
LastName Řetězec Extrahované příjmení
Provozovatel Země Kód země nebo oblasti kompatibilní se standardem ISO 3166 (pouze Passport)
Sex Řetězec Možné extrahované hodnoty zahrnují "M", "F" a "X"
MachineReadableZone Objekt Extrahování služby Passport MRZ, včetně dvou řádků 44 znaků "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<<<<<<<<<<<<<<<<<<<<<<< 6 715816"
DocumentType Řetězec Typ dokumentu, například pas, licence k ovladači užívat
Adresa Řetězec Extrahovaná adresa (jenom licence řidiče)
Oblast Řetězec Extrahovaná oblast, stát, provincie atd. (jenom licence řidiče)

Verze Preview nástroje pro rozpoznávání formulářů v 3.0

Verze Preview nástroje pro rozpoznávání formulářů přináší několik nových funkcí a možností:

  • Model dokumentu ID (v 3.0) podporuje potvrzení, omezení a extrakci klasifikace vozidel z licencí ovladače USA.

Extrakce pole náhledu dokumentu ID

Název Typ Description Standardizovaný výstup
🆕 potvrzení Řetězec Další oprávnění k řízení udělená řidiči, jako je například motocykl nebo školní sběrnice.
omezení 🆕 Řetězec Omezená oprávnění pro řízení platná pro pozastavené nebo odvolané licence.
🆕 VehicleClassification Řetězec Typy vozidel, které mohou být řízeny ovladačem.
CountryRegion Země Kód země nebo oblasti odpovídající normě ISO 3166 Standard
DateOfBirth Date (Datum) DOB rrrr-mm-dd
DateOfExpiration Date (Datum) Datum vypršení platnosti DOB rrrr-mm-dd
DocumentNumber Řetězec Příslušné číslo služby Passport, číslo řidičského průkazu atd.
FirstName Řetězec Extrahováný křestní jméno a iniciála, pokud je k dispozici
LastName Řetězec Extrahované příjmení
Provozovatel Země Kód země nebo oblasti kompatibilní se standardem ISO 3166 (pouze Passport)
Sex Řetězec Možné extrahované hodnoty zahrnují "M", "F" a "X"
MachineReadableZone Objekt Extrahování služby Passport MRZ, včetně dvou řádků 44 znaků "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<<<<<<<<<<<<<<<<<<<<<<< 6 715816"
DocumentType Řetězec Typ dokumentu, například pas, licence k ovladači užívat
Adresa Řetězec Extrahovaná adresa (jenom licence řidiče)
Oblast Řetězec Extrahovaná oblast, stát, provincie atd. (jenom licence řidiče)

Průvodce migrací a REST API v 3.0

Další kroky