Form Recognizer bonmodel
Het ontvangstbewijsmodel combineert krachtige OCR-mogelijkheden (Optical Character Recognition) met Deep Learning-modellen voor het analyseren en extraheren van belangrijke informatie uit verkoopbonnen. Ontvangstbewijzen kunnen verschillende indelingen en kwaliteit hebben, waaronder gedrukte en handgeschreven bonnen. De API extraheert belangrijke informatie zoals de naam van de winkel, het zakelijke telefoonnummer, de transactiedatum, de belasting en het transactietotaal en retourneert een gestructureerde JSON-gegevensweergave.
Voorbeeldbevestiging verwerkt Form Recognizer voorbeeldhulpprogramma voor labelen:
Ontwikkelingsopties
De volgende resources worden ondersteund door Form Recognizer v2.1:
| Functie | Resources |
|---|---|
| Ontvangstbewijsmodel |
De volgende resources worden ondersteund door Form Recognizer v3.0:
| Functie | Resources | Model-id |
|---|---|---|
| Ontvangstbewijsmodel | vooraf gemaakt ontvangstbewijs |
Form Recognizer proberen
Zie hoe gegevens, waaronder de tijd en datum van transacties, winkelgegevens en totaalbedragen, worden geëxtraheerd uit bonnen met behulp van Form Recognizer Studio of ons voorbeeldhulpprogramma voor labelen. U hebt het volgende nodig:
Een Azure-abonnement: u kunt er gratis een maken
Een Form Recognizer ) in de Azure Portal. U kunt de gratis prijscategorie (
F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar resource om uw API-sleutel en eindpunt op te halen.
Form Recognizer Studio (preview)
Notitie
Form Recognizer Studio is beschikbaar met de preview-API (v3.0).
Selecteer op Form Recognizer Studio-startpagina ontvangstbewijzen
U kunt het ontvangstbewijs van het voorbeeld analyseren of de knop + Toevoegen selecteren om uw eigen voorbeeld te uploaden.
Selecteer de knop Analyseren:
Voorbeeldhulpprogramma voor labelen
U hebt een ontvangstbewijsdocument nodig. U kunt ons voorbeeld van een ontvangstbewijsdocument gebruiken.
Selecteer op de startpagina van het voorbeeldhulpprogramma voor labelen de optie Vooraf gebouwd model gebruiken om gegevens op te halen.
Selecteer Ontvangstbewijs in de vervolgkeuzelijst Formuliertype:
Vereisten voor invoer
- Geef voor de beste resultaten één duidelijke foto of scan van hoge kwaliteit per document op.
- Ondersteunde bestandsindelingen: JPEG, PNG, BMP, TIFF en PDF (tekst ingesloten of gescand). Pdf-bestanden met ingesloten tekst kunnen het beste de mogelijkheid van een fout in tekenextractie en -locatie elimineren.
- Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- De afmetingen van afbeeldingen moeten tussen 50 x 50 en 10000 x 10000 pixels liggen.
- PDF-afmetingen zijn maximaal 17 x 17 inch, wat overeenkomt met de papiergrootte Juridisch of A3 of kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
- Als uw PDF-bestanden met een wachtwoord zijn vergrendeld, moet u de vergrendeling verwijderen voordat u ze indient.
- Voor leren zonder super supervised (zonder gelabelde gegevens):
- Gegevens moeten sleutels en waarden bevatten.
- Sleutels moeten boven of links van de waarden worden weergegeven; ze kunnen niet onder of rechts worden weergegeven.
Ondersteunde talen en talen v2.1
Notitie
Het is niet nodig om een locale op te geven. Dit is een optionele parameter. De Form Recognizer deep learning-technologie detecteert automatisch de taal van de tekst in uw afbeelding.
| Model | Taal: taalcode | Standaard |
|---|---|---|
| Ontvangst |
|
Automatisch gedetecteerd |
Veldextractie
| Naam | Type | Description | Gestandaardiseerde uitvoer |
|---|---|---|---|
| ReceiptType | Tekenreeks | Type ontvangstbewijs | Gespecificeerde |
| Naam van de winkel | Tekenreeks | Naam van de winkel die het ontvangstbewijs uit geven | |
| Winkeltelefoonnummer | phoneNumber | Vermeld telefoonnummer van winkel | +1 xxx xxx xxxx |
| Winkeladres | Tekenreeks | Vermeld adres van winkel | |
| TransactionDate | Datum | Datum waarop het ontvangstbewijs is uitgegeven | jjjj-mm-dd |
| TransactionTime | Tijd | Tijd dat het ontvangstbewijs is uitgegeven | hh-mm-ss (24-uurs) |
| Totaal | Getal (USD) | Volledig transactietotaal van ontvangst | Float met twee decimalen |
| Subtotaal | Getal (USD) | Subtotaal van ontvangstbewijs, vaak voordat er belastingen worden toegepast | Float met twee decimalen |
| Btw | Getal (USD) | Belasting op ontvangstbewijs (vaak omzetbelasting of gelijkwaardig) | Float met twee decimalen |
| Tip | Getal (USD) | Tip opgenomen door koper | Float met twee decimalen |
| Items | Matrix met objecten | Geëxtraheerde regelitems, met naam, hoeveelheid, eenheidsprijs en totale prijs geëxtraheerd | |
| Name | Tekenreeks | Itemnaam | |
| Hoeveelheid | Getal | Hoeveelheid van elk item | Geheel getal |
| Prijs | Aantal | Afzonderlijke prijs van elke artikeleenheid | Float met twee decimalen |
| Totale prijs | Aantal | Totale prijs van regelitem | Float met twee decimalen |
Form Recognizer preview v3.0
De Form Recognizer preview introduceert verschillende nieuwe functies en mogelijkheden. Het ontvangstbewijsmodel biedt ondersteuning voor de verwerking van hotelontvangstbewijzen van één pagina.
Extractie van het ontvangstbewijsveld van het hotel
| Naam | Type | Description | Gestandaardiseerde uitvoer |
|---|---|---|---|
| ArrivalDate | Datum | Datum van aankomst | jjjj-mm-dd |
| Valuta | Valuta | Valuta-eenheid van ontvangstbedragen. Bijvoorbeeld USD, EUR of MIXED als er meerdere waarden worden gevonden | |
| DepartureDate | Datum | Datum van vertrek | jjjj-mm-dd |
| Items | Matrix | ||
| Items.*. Categorie | Tekenreeks | Itemcategorie, bijvoorbeeld Ruimte, Belasting, enzovoort. | |
| Items.*. Datum | Datum | Itemdatum | jjjj-mm-dd |
| Items.*. Beschrijving | Tekenreeks | Beschrijving van item | |
| Items.*. TotalPrice | Aantal | Totaalprijs van item | Geheel getal |
| Landinstelling | Tekenreeks | De locale van het ontvangstbewijs, bijvoorbeeld en-US. | ISO language-county code |
| MerchantAddress | Tekenreeks | Vermeld adres van winkel | |
| MerchantAliases | Matrix | ||
| MerchantAliases.* | Tekenreeks | Alternatieve naam van de winkel | |
| Naam van de winkel | Tekenreeks | Naam van de winkel die het ontvangstbewijs uitkent | |
| MerchantPhoneNumber | phoneNumber | Vermeld telefoonnummer van winkel | +1 xxx xxx xxxx |
| ReceiptType | Tekenreeks | Type ontvangstbewijs, bijvoorbeeld Hotel, Itemized | |
| Totaal | Aantal | Volledig transactietotaal van ontvangst | Float met twee decimalen |
Ondersteunde talen en talen voor hotelontvangstbewijzen
| Model | Taal: taalcode | Standaard |
|---|---|---|
| Ontvangstbewijs (hotel) |
|
Engels (Verenigde Staten)— en-US |
Migratiehandleiding en REST API v3.0
Volg onze Form Recognizer v3.0-migratiehandleiding voor meer informatie over het gebruik van de preview-versie in uw toepassingen en werkstromen.
Bekijk onze REST API (preview) voor meer informatie over de preview-versie en nieuwe mogelijkheden.
Volgende stappen
Voltooi een Form Recognizer quickstart:
Verken onze REST API: