Form Recognizer id-documentmodel

Het id-documentmodel combineert krachtige OCR-mogelijkheden (Optical Character Recognition) met deep learning-modellen om belangrijke informatie te analyseren en extraheren uit Amerikaanse stuurprogrammalicenties (alle 50 staten en district of Columbia) en internationale biografische passport-pagina's (met uitzondering van creditcard- en andere reisdocumenten). De API analyseert identiteitsdocumenten; extraheert belangrijke informatie zoals voornaam, achternaam, adres en geboortedatum; en retourneert een gestructureerde JSON-gegevensweergave.

Voorbeeld van amerikaanse stuurprogrammalicentie verwerkt met Form Recognizer Studio

voorbeeld van een identificatiekaart

Ontwikkelingsopties

De volgende resources worden ondersteund door Form Recognizer v2.1:

Functie Resources
Id-documentmodel

De volgende resources worden ondersteund door Form Recognizer v3.0:

Functie Resources Model-id
Id-documentmodel vooraf gebouwde idDocument

Form Recognizer proberen

Zie hoe gegevens, waaronder naam, geboortedatum, machine leesbare zone en vervaldatum, worden geëxtraheerd uit id-documenten met behulp van Form Recognizer Studio of ons voorbeeldhulpprogramma voor labelen. U hebt het volgende nodig:

  • Een Azure-abonnement: u kunt er gratis een maken

  • Een Form Recognizer-exemplaar in de Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar resource om uw API-sleutel en eindpunt op te halen.

Schermopname: sleutels en eindpuntlocatie in de Azure Portal.

Form Recognizer Studio (preview)

Notitie

Form Recognizer Studio is beschikbaar met de preview-API (v3.0).

  1. Selecteer facturen Form Recognizer de startpagina van Form Recognizer Studio

  2. U kunt de voorbeeldfactuur analyseren of de knop + Toevoegen selecteren om uw eigen voorbeeld te uploaden.

  3. Selecteer de knop Analyseren:

    Schermopname: menu id-document analyseren.

Voorbeeldhulpprogramma voor labelen

U hebt een id-document nodig. U kunt ons voorbeeld-id-document gebruiken.

  1. Selecteer op de startpagina van het voorbeeldhulpprogramma voor labelen de optie Vooraf gebouwd model gebruiken om gegevens op te halen.

  2. Selecteer Identiteitsdocumenten in de vervolgkeuzelijst Formuliertype:

    Schermopname: Vervolgkeuzelijst voorbeeldhulpprogramma voor het selecteren van vooraf gemaakt model.

Vereisten voor invoer

  • Geef voor de beste resultaten één duidelijke foto of scan van hoge kwaliteit per document op.
  • Ondersteunde bestandsindelingen: JPEG, PNG, BMP, TIFF en PDF (tekst ingesloten of gescand). Pdf-bestanden met ingesloten tekst kunnen het beste de mogelijkheid van een fout in tekenextractie en -locatie elimineren.
  • Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).
  • De bestandsgrootte moet kleiner zijn dan 50 MB.
  • De afmetingen van afbeeldingen moeten tussen 50 x 50 en 10000 x 10000 pixels liggen.
  • PDF-afmetingen zijn maximaal 17 x 17 inch, wat overeenkomt met de papiergrootte Juridisch of A3 of kleiner.
  • De totale grootte van de trainingsgegevens is 500 pagina's of minder.
  • Als uw PDF-bestanden met een wachtwoord zijn vergrendeld, moet u de vergrendeling verwijderen voordat u ze indient.
  • Voor leren zonder supermomenten (zonder gelabelde gegevens):
    • Gegevens moeten sleutels en waarden bevatten.
    • Sleutels moeten boven of links van de waarden worden weergegeven; ze kunnen niet onder of rechts worden weergegeven.

Notitie

Het voorbeeldhulpprogramma voor labelen biedt geen ondersteuning voor de BMP-bestandsindeling. Dit is een beperking van het hulpprogramma, niet van Form Recognizer Service.

Ondersteunde talen en talen v2.1

Model Taal: taalcode Standaard
Id-document
  • Engels (Verenigde Staten)— en-US (licentie voor stuurprogramma)
  • Biografiepagina's van internationale paspoorten
    (met uitzondering van Den Haag en andere reisdocumenten)

Engels (Verenigde Staten)— en-US

Veldextractie

Naam Type Description Gestandaardiseerde uitvoer
CountryRegion countryRegion Land- of regiocode die voldoet aan de ISO 3166-standaard
DateOfBirth Datum DOB jjjj-mm-dd
DateOfExpiration Datum Vervaldatum DOB jjjj-mm-dd
DocumentNumber Tekenreeks Relevant paspoortnummer, licentienummer van de stuurprogramma, enzovoort.
FirstName Tekenreeks Voornaam en middelste initiële geëxtraheerd, indien van toepassing
LastName Tekenreeks Geëxtraheerde achternaam
Nationaliteit countryRegion Land- of regiocode die voldoet aan de ISO 3166-standaard (alleen Passport)
Sex Tekenreeks Mogelijke geëxtraheerde waarden zijn 'M', 'F' en 'X'
MachineReadableZone Object Geëxtraheerde Passport MRZ met twee regels van elk 44 tekens "P<USAOUSS<<<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F190505471000307<<<<<<<<<<<<<<<<<<<<<<< 6 715816"
DocumentType Tekenreeks Documenttype, bijvoorbeeld Passport, Driver's License "passport"
Adres Tekenreeks Geëxtraheerd adres (alleen stuurprogrammalicentie)
Regio Tekenreeks Geëxtraheerde regio, staat, provincie, enzovoort (alleen licentie voor stuurprogramma' s)

Form Recognizer preview v3.0

De Form Recognizer preview introduceert verschillende nieuwe functies en mogelijkheden:

  • Het model id-document (v3.0) ondersteunt goedkeuringen, beperkingen en extractie van voertuigclassificatie uit licenties van Amerikaanse stuurprogramma's.

Voorbeeld van veldextractie id-document

Naam Type Description Gestandaardiseerde uitvoer
🆕-goedkeuringen Tekenreeks Aanvullende rijbevoegdheden verleend aan een stuurprogramma, zoals motor of schoolbus.
🆕 beperkingen Tekenreeks Beperkte rijbevoegdheden die van toepassing zijn op ingetrokken of ingetrokken licenties.
🆕VehicleClassification Tekenreeks Typen voertuigen die kunnen worden bestuurd door een stuurprogramma.
CountryRegion countryRegion Land- of regiocode die voldoet aan de ISO 3166-standaard
DateOfBirth Datum DOB jjjj-mm-dd
DateOfExpiration Datum Vervaldatum DOB jjjj-mm-dd
DocumentNumber Tekenreeks Relevant paspoortnummer, licentienummer van de stuurprogramma, enzovoort.
FirstName Tekenreeks Voornaam en middelste initiële geëxtraheerd, indien van toepassing
LastName Tekenreeks Geëxtraheerde achternaam
Nationaliteit countryRegion Land- of regiocode die voldoet aan de ISO 3166-standaard (alleen Passport)
Sex Tekenreeks Mogelijke geëxtraheerde waarden zijn 'M', 'F' en 'X'
MachineReadableZone Object Geëxtraheerde Passport MRZ met twee regels van elk 44 tekens "P<USAOUSS<<<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F190505471000307<<<<<<<<<<<<<<<<<<<<<<< 6 715816"
DocumentType Tekenreeks Documenttype, bijvoorbeeld Passport, Driver's License "passport"
Adres Tekenreeks Geëxtraheerd adres (alleen stuurprogrammalicentie)
Regio Tekenreeks Geëxtraheerde regio, staat, provincie, enzovoort (alleen licentie voor stuurprogramma' s)

Migratiehandleiding en REST API v3.0

Volgende stappen