Form Recognizer id-documentmodel
Het id-documentmodel combineert krachtige OCR-mogelijkheden (Optical Character Recognition) met deep learning-modellen om belangrijke informatie te analyseren en extraheren uit Amerikaanse stuurprogrammalicenties (alle 50 staten en district of Columbia) en internationale biografische passport-pagina's (met uitzondering van creditcard- en andere reisdocumenten). De API analyseert identiteitsdocumenten; extraheert belangrijke informatie zoals voornaam, achternaam, adres en geboortedatum; en retourneert een gestructureerde JSON-gegevensweergave.
Voorbeeld van amerikaanse stuurprogrammalicentie verwerkt met Form Recognizer Studio
Ontwikkelingsopties
De volgende resources worden ondersteund door Form Recognizer v2.1:
| Functie | Resources |
|---|---|
| Id-documentmodel |
De volgende resources worden ondersteund door Form Recognizer v3.0:
| Functie | Resources | Model-id |
|---|---|---|
| Id-documentmodel | vooraf gebouwde idDocument |
Form Recognizer proberen
Zie hoe gegevens, waaronder naam, geboortedatum, machine leesbare zone en vervaldatum, worden geëxtraheerd uit id-documenten met behulp van Form Recognizer Studio of ons voorbeeldhulpprogramma voor labelen. U hebt het volgende nodig:
Een Azure-abonnement: u kunt er gratis een maken
Een Form Recognizer-exemplaar in de Azure Portal. U kunt de gratis prijscategorie (
F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar resource om uw API-sleutel en eindpunt op te halen.
Form Recognizer Studio (preview)
Notitie
Form Recognizer Studio is beschikbaar met de preview-API (v3.0).
Selecteer facturen Form Recognizer de startpagina van Form Recognizer Studio
U kunt de voorbeeldfactuur analyseren of de knop + Toevoegen selecteren om uw eigen voorbeeld te uploaden.
Selecteer de knop Analyseren:
Voorbeeldhulpprogramma voor labelen
U hebt een id-document nodig. U kunt ons voorbeeld-id-document gebruiken.
Selecteer op de startpagina van het voorbeeldhulpprogramma voor labelen de optie Vooraf gebouwd model gebruiken om gegevens op te halen.
Selecteer Identiteitsdocumenten in de vervolgkeuzelijst Formuliertype:
Vereisten voor invoer
- Geef voor de beste resultaten één duidelijke foto of scan van hoge kwaliteit per document op.
- Ondersteunde bestandsindelingen: JPEG, PNG, BMP, TIFF en PDF (tekst ingesloten of gescand). Pdf-bestanden met ingesloten tekst kunnen het beste de mogelijkheid van een fout in tekenextractie en -locatie elimineren.
- Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- De afmetingen van afbeeldingen moeten tussen 50 x 50 en 10000 x 10000 pixels liggen.
- PDF-afmetingen zijn maximaal 17 x 17 inch, wat overeenkomt met de papiergrootte Juridisch of A3 of kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
- Als uw PDF-bestanden met een wachtwoord zijn vergrendeld, moet u de vergrendeling verwijderen voordat u ze indient.
- Voor leren zonder supermomenten (zonder gelabelde gegevens):
- Gegevens moeten sleutels en waarden bevatten.
- Sleutels moeten boven of links van de waarden worden weergegeven; ze kunnen niet onder of rechts worden weergegeven.
Notitie
Het voorbeeldhulpprogramma voor labelen biedt geen ondersteuning voor de BMP-bestandsindeling. Dit is een beperking van het hulpprogramma, niet van Form Recognizer Service.
Ondersteunde talen en talen v2.1
| Model | Taal: taalcode | Standaard |
|---|---|---|
| Id-document |
|
Engels (Verenigde Staten)— en-US |
Veldextractie
| Naam | Type | Description | Gestandaardiseerde uitvoer |
|---|---|---|---|
| CountryRegion | countryRegion | Land- of regiocode die voldoet aan de ISO 3166-standaard | |
| DateOfBirth | Datum | DOB | jjjj-mm-dd |
| DateOfExpiration | Datum | Vervaldatum DOB | jjjj-mm-dd |
| DocumentNumber | Tekenreeks | Relevant paspoortnummer, licentienummer van de stuurprogramma, enzovoort. | |
| FirstName | Tekenreeks | Voornaam en middelste initiële geëxtraheerd, indien van toepassing | |
| LastName | Tekenreeks | Geëxtraheerde achternaam | |
| Nationaliteit | countryRegion | Land- of regiocode die voldoet aan de ISO 3166-standaard (alleen Passport) | |
| Sex | Tekenreeks | Mogelijke geëxtraheerde waarden zijn 'M', 'F' en 'X' | |
| MachineReadableZone | Object | Geëxtraheerde Passport MRZ met twee regels van elk 44 tekens | "P<USAOUSS<<<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F190505471000307<<<<<<<<<<<<<<<<<<<<<<< 6 715816" |
| DocumentType | Tekenreeks | Documenttype, bijvoorbeeld Passport, Driver's License | "passport" |
| Adres | Tekenreeks | Geëxtraheerd adres (alleen stuurprogrammalicentie) | |
| Regio | Tekenreeks | Geëxtraheerde regio, staat, provincie, enzovoort (alleen licentie voor stuurprogramma' s) |
Form Recognizer preview v3.0
De Form Recognizer preview introduceert verschillende nieuwe functies en mogelijkheden:
- Het model id-document (v3.0) ondersteunt goedkeuringen, beperkingen en extractie van voertuigclassificatie uit licenties van Amerikaanse stuurprogramma's.
Voorbeeld van veldextractie id-document
| Naam | Type | Description | Gestandaardiseerde uitvoer |
|---|---|---|---|
| 🆕-goedkeuringen | Tekenreeks | Aanvullende rijbevoegdheden verleend aan een stuurprogramma, zoals motor of schoolbus. | |
| 🆕 beperkingen | Tekenreeks | Beperkte rijbevoegdheden die van toepassing zijn op ingetrokken of ingetrokken licenties. | |
| 🆕VehicleClassification | Tekenreeks | Typen voertuigen die kunnen worden bestuurd door een stuurprogramma. | |
| CountryRegion | countryRegion | Land- of regiocode die voldoet aan de ISO 3166-standaard | |
| DateOfBirth | Datum | DOB | jjjj-mm-dd |
| DateOfExpiration | Datum | Vervaldatum DOB | jjjj-mm-dd |
| DocumentNumber | Tekenreeks | Relevant paspoortnummer, licentienummer van de stuurprogramma, enzovoort. | |
| FirstName | Tekenreeks | Voornaam en middelste initiële geëxtraheerd, indien van toepassing | |
| LastName | Tekenreeks | Geëxtraheerde achternaam | |
| Nationaliteit | countryRegion | Land- of regiocode die voldoet aan de ISO 3166-standaard (alleen Passport) | |
| Sex | Tekenreeks | Mogelijke geëxtraheerde waarden zijn 'M', 'F' en 'X' | |
| MachineReadableZone | Object | Geëxtraheerde Passport MRZ met twee regels van elk 44 tekens | "P<USAOUSS<<<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F190505471000307<<<<<<<<<<<<<<<<<<<<<<< 6 715816" |
| DocumentType | Tekenreeks | Documenttype, bijvoorbeeld Passport, Driver's License | "passport" |
| Adres | Tekenreeks | Geëxtraheerd adres (alleen stuurprogrammalicentie) | |
| Regio | Tekenreeks | Geëxtraheerde regio, staat, provincie, enzovoort (alleen licentie voor stuurprogramma' s) |
Migratiehandleiding en REST API v3.0
Volg onze Form Recognizer v3.0-migratiehandleiding voor meer informatie over het gebruik van de preview-versie in uw toepassingen en werkstromen.
Bekijk onze REST API (preview) voor meer informatie over de preview-versie en nieuwe mogelijkheden.
Volgende stappen
Voltooi een Form Recognizer quickstart:
Verken onze REST API: