Rozpoznávání formulářů modelu faktur

Model faktur kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení, které analyzují a extrahují klíčová pole a řádkové položky z prodejních faktur. Faktury mohou mít různé formáty a kvalitu, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. Rozhraní API analyzuje text faktury. extrahuje klíčové informace, jako je jméno zákazníka, fakturační adresa, datum splatnosti a splatná částka. a vrací strukturovaná reprezentace dat JSON.

Ukázková faktura zpracuje Rozpoznávání formulářů Studio:

ukázková faktura

Možnosti vývoje

Následující prostředky podporuje Rozpoznávání formulářů verze 2.1:

Funkce Zdroje informací
Model faktur

Následující prostředky podporuje Rozpoznávání formulářů verze 3.0:

Funkce Zdroje informací ID modelu
Model faktur předem sestavená faktura

Zkuste Rozpoznávání formulářů

Podívejte se, jak se data, včetně informací o zákaznících, podrobnostech o dodavateli a řádcích, extrahují z faktur pomocí nástroje Rozpoznávání formulářů Studio nebo našeho ukázkového nástroje pro popisování. Budete potřebovat následující:

  • Předplatné Azure – můžete si ho vytvořit zdarma.

  • Instance Rozpoznávání formulářů v Azure Portal. K vyzkoušejí služby můžete použít bezplatnou cenovou úroveň ( F0 ). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod rozhraní API.

Snímek obrazovky: Klíče a umístění koncového bodu v Azure Portal

Rozpoznávání formulářů Studio (Preview)

  1. Na domovské Rozpoznávání formulářů Studio vyberte Faktury.

  2. Můžete analyzovat ukázkovou fakturu nebo vybrat tlačítko + Přidat a nahrát vlastní ukázku.

  3. Vyberte tlačítko Analyzovat:

    Snímek obrazovky: Analýza nabídky faktury

Ukázkový nástroj pro popisování

Budete potřebovat fakturu. Můžete použít náš ukázkový dokument faktury.

  1. Na domovské stránce nástroje Ukázkové popisování vyberte Použít předem připravený model k získání dat.

  2. V rozevírací nabídce Typ formuláře vyberte Faktura:

    Snímek obrazovky: Rozevírací nabídka nástroje Pro ukázkové popisování předem sestavená nabídka výběru modelu

Požadavky na vstup

  • Nejlepších výsledků dosáhnete, když pro každý dokument poskytnete jednu jasnou fotku nebo vysoce kvalitní sken.
  • Podporované formáty souborů: JPEG, PNG, BMP, TIFF a PDF (vložený nebo naskenovaný text). Soubory PDF s vloženým textem nejlépe eliminují možnost chyby při extrakci a umístění znaků.
  • V případě souborů PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).
  • Velikost souboru musí být menší než 50 MB.
  • Rozměry obrázku musí být v rozmezí 50 × 50 pixelů a 1 0000 × 1 0000 pixelů.
  • Rozměry PDF jsou až 17 x 17 palců, což odpovídá velikosti papíru Legal nebo A3 nebo menší.
  • Celková velikost trénovací dat je 500 stránek nebo méně.
  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním odebrat zámek.
  • Pro učení bez dohledu (bez označených dat):
    • Data musí obsahovat klíče a hodnoty.
    • Klíče se musí objevit nad nebo nalevo od hodnot. Nelze je zobrazit pod ani napravo.

Poznámka

Nástroj Ukázkové popisování nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Rozpoznávání formulářů Service.

Podporované jazyky a národní prostředí

Modelování Jazyk – kód národního prostředí Výchozí
Faktura
  • Angličtina (USA)– en-US
Angličtina (USA)– en-US

Extrakce polí

Název Typ Description Standardizovaný výstup
CustomerName Řetězec Fakturovaný zákazník
CustomerId Řetězec Referenční ID zákazníka
Nákupníobjednávky Řetězec Referenční číslo nákupní objednávky
InvoiceId Řetězec ID pro tuto konkrétní fakturu (často "číslo faktury")
InvoiceDate Date (Datum) Datum vystavení faktury rrrr-mm-dd
DueDate Date (Datum) Datum, kdy je platba za tuto fakturu splatná rrrr-mm-dd
Název dodavatele Řetězec Název dodavatele
Adresa dodavatele Řetězec Poštovní adresa dodavatele
VendorAddressRecipient Řetězec Název přidružený k vendoraddress
CustomerAddress Řetězec Poštovní adresa zákazníka
CustomerAddressRecipient Řetězec Název přidružený k zákazníkovi CustomerAddress
Fakturační_adresa Řetězec Explicitní fakturační adresa zákazníka
BillingAddressRecipient Řetězec Název přidružený k billingAddress
ShippingAddress Řetězec Explicitní dodací adresa zákazníka
ShippingAddressRecipient Řetězec Název přidružený k uzlu ShippingAddress
Dílčí součet Číslo Pole mezisoučtů identifikované na této faktuře Integer
TotalTax Číslo Pole celkové daně identifikované na této faktuře Integer
InvoiceTotal Číslo (USD) Celkové nové poplatky přidružené k této faktuře Integer
AmountDue Číslo (USD) Total Amount Due to the vendor Integer
Adresa služby Řetězec Explicitní adresa služby nebo adresa vlastnosti zákazníka
ServiceAddressRecipient Řetězec Název přidružený ke službě ServiceAddress
RemittanceAddress Řetězec Explicitní úhrada nebo platební adresa zákazníka
RemittanceAddressRecipient Řetězec Název přidružený k remittanceAddress
ServiceStartDate Date (Datum) První datum období služby (například období služby s vyúčtováním služeb) rrrr-mm-dd
Datum ukončení služby Date (Datum) Koncové datum období služby (například období služby s vyúčtováním služeb) rrrr-mm-dd
PředchozíUnpaidBalance Číslo Explicitní dříve nezaplacený zůstatek Integer

Řádkové položky

Níže jsou uvedené řádkové položky extrahované z faktury ve výstupní odpovědi JSON (následující výstup používá tuto ukázkovou fakturu).

Název Typ Description Text (položka řádku č. 1) Hodnota (standardizovaný výstup)
Položky Řetězec Celý textový řádek řádkové položky 4/3/2021 A123 Konzultační služby 2 hodiny 30,00 USD 10 % 60,00 USD
Částka Číslo Množství řádkové položky 60,00 USD 100
Description Řetězec Textový popis položky řádku faktury Konzultační služba Konzultační služba
Množství Číslo Množství pro tuto položku řádku faktury 2 2
UnitPrice Číslo Čistá nebo hrubá cena (v závislosti na nastavení hrubé faktury faktury) jedné jednotky této položky 30,00 USD 30
Productcode Řetězec Kód produktu, číslo produktu nebo SKU přidružené ke konkrétní řádkové položce A123
Jednotka Řetězec Jednotka řádkové položky, např. kg, lb atd. Hodiny
Datum Datum Datum odpovídající jednotlivým řádkové položce Často se jedná o datum odeslání řádkové položky. 3/4/2021 2021-03-04
Daň Číslo Daň přidružená ke každé řádkové položce. Mezi možné hodnoty patří částka daně, daň a daň od Y/N. 10 %

Extrahované páry klíč-hodnota faktury a extrahované řádkové položky jsou v documentResults oddílu výstupu JSON.

Rozpoznávání formulářů Preview verze 3.0

Verze Rozpoznávání formulářů Preview představuje několik nových funkcí a možností.

Další kroky