Rozpoznávání formulářů modelu faktur
Model faktur kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení, které analyzují a extrahují klíčová pole a řádkové položky z prodejních faktur. Faktury mohou mít různé formáty a kvalitu, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. Rozhraní API analyzuje text faktury. extrahuje klíčové informace, jako je jméno zákazníka, fakturační adresa, datum splatnosti a splatná částka. a vrací strukturovaná reprezentace dat JSON.
Ukázková faktura zpracuje Rozpoznávání formulářů Studio:
Možnosti vývoje
Následující prostředky podporuje Rozpoznávání formulářů verze 2.1:
| Funkce | Zdroje informací |
|---|---|
| Model faktur |
Následující prostředky podporuje Rozpoznávání formulářů verze 3.0:
| Funkce | Zdroje informací | ID modelu |
|---|---|---|
| Model faktur | předem sestavená faktura |
Zkuste Rozpoznávání formulářů
Podívejte se, jak se data, včetně informací o zákaznících, podrobnostech o dodavateli a řádcích, extrahují z faktur pomocí nástroje Rozpoznávání formulářů Studio nebo našeho ukázkového nástroje pro popisování. Budete potřebovat následující:
Předplatné Azure – můžete si ho vytvořit zdarma.
Instance Rozpoznávání formulářů v Azure Portal. K vyzkoušejí služby můžete použít bezplatnou cenovou úroveň (
F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod rozhraní API.
Rozpoznávání formulářů Studio (Preview)
Na domovské Rozpoznávání formulářů Studio vyberte Faktury.
Můžete analyzovat ukázkovou fakturu nebo vybrat tlačítko + Přidat a nahrát vlastní ukázku.
Vyberte tlačítko Analyzovat:
Ukázkový nástroj pro popisování
Budete potřebovat fakturu. Můžete použít náš ukázkový dokument faktury.
Na domovské stránce nástroje Ukázkové popisování vyberte Použít předem připravený model k získání dat.
V rozevírací nabídce Typ formuláře vyberte Faktura:
Požadavky na vstup
- Nejlepších výsledků dosáhnete, když pro každý dokument poskytnete jednu jasnou fotku nebo vysoce kvalitní sken.
- Podporované formáty souborů: JPEG, PNG, BMP, TIFF a PDF (vložený nebo naskenovaný text). Soubory PDF s vloženým textem nejlépe eliminují možnost chyby při extrakci a umístění znaků.
- V případě souborů PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).
- Velikost souboru musí být menší než 50 MB.
- Rozměry obrázku musí být v rozmezí 50 × 50 pixelů a 1 0000 × 1 0000 pixelů.
- Rozměry PDF jsou až 17 x 17 palců, což odpovídá velikosti papíru Legal nebo A3 nebo menší.
- Celková velikost trénovací dat je 500 stránek nebo méně.
- Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním odebrat zámek.
- Pro učení bez dohledu (bez označených dat):
- Data musí obsahovat klíče a hodnoty.
- Klíče se musí objevit nad nebo nalevo od hodnot. Nelze je zobrazit pod ani napravo.
Poznámka
Nástroj Ukázkové popisování nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Rozpoznávání formulářů Service.
Podporované jazyky a národní prostředí
| Modelování | Jazyk – kód národního prostředí | Výchozí |
|---|---|---|
| Faktura |
|
Angličtina (USA)– en-US |
Extrakce polí
| Název | Typ | Description | Standardizovaný výstup |
|---|---|---|---|
| CustomerName | Řetězec | Fakturovaný zákazník | |
| CustomerId | Řetězec | Referenční ID zákazníka | |
| Nákupníobjednávky | Řetězec | Referenční číslo nákupní objednávky | |
| InvoiceId | Řetězec | ID pro tuto konkrétní fakturu (často "číslo faktury") | |
| InvoiceDate | Date (Datum) | Datum vystavení faktury | rrrr-mm-dd |
| DueDate | Date (Datum) | Datum, kdy je platba za tuto fakturu splatná | rrrr-mm-dd |
| Název dodavatele | Řetězec | Název dodavatele | |
| Adresa dodavatele | Řetězec | Poštovní adresa dodavatele | |
| VendorAddressRecipient | Řetězec | Název přidružený k vendoraddress | |
| CustomerAddress | Řetězec | Poštovní adresa zákazníka | |
| CustomerAddressRecipient | Řetězec | Název přidružený k zákazníkovi CustomerAddress | |
| Fakturační_adresa | Řetězec | Explicitní fakturační adresa zákazníka | |
| BillingAddressRecipient | Řetězec | Název přidružený k billingAddress | |
| ShippingAddress | Řetězec | Explicitní dodací adresa zákazníka | |
| ShippingAddressRecipient | Řetězec | Název přidružený k uzlu ShippingAddress | |
| Dílčí součet | Číslo | Pole mezisoučtů identifikované na této faktuře | Integer |
| TotalTax | Číslo | Pole celkové daně identifikované na této faktuře | Integer |
| InvoiceTotal | Číslo (USD) | Celkové nové poplatky přidružené k této faktuře | Integer |
| AmountDue | Číslo (USD) | Total Amount Due to the vendor | Integer |
| Adresa služby | Řetězec | Explicitní adresa služby nebo adresa vlastnosti zákazníka | |
| ServiceAddressRecipient | Řetězec | Název přidružený ke službě ServiceAddress | |
| RemittanceAddress | Řetězec | Explicitní úhrada nebo platební adresa zákazníka | |
| RemittanceAddressRecipient | Řetězec | Název přidružený k remittanceAddress | |
| ServiceStartDate | Date (Datum) | První datum období služby (například období služby s vyúčtováním služeb) | rrrr-mm-dd |
| Datum ukončení služby | Date (Datum) | Koncové datum období služby (například období služby s vyúčtováním služeb) | rrrr-mm-dd |
| PředchozíUnpaidBalance | Číslo | Explicitní dříve nezaplacený zůstatek | Integer |
Řádkové položky
Níže jsou uvedené řádkové položky extrahované z faktury ve výstupní odpovědi JSON (následující výstup používá tuto ukázkovou fakturu).
| Název | Typ | Description | Text (položka řádku č. 1) | Hodnota (standardizovaný výstup) |
|---|---|---|---|---|
| Položky | Řetězec | Celý textový řádek řádkové položky | 4/3/2021 A123 Konzultační služby 2 hodiny 30,00 USD 10 % 60,00 USD | |
| Částka | Číslo | Množství řádkové položky | 60,00 USD | 100 |
| Description | Řetězec | Textový popis položky řádku faktury | Konzultační služba | Konzultační služba |
| Množství | Číslo | Množství pro tuto položku řádku faktury | 2 | 2 |
| UnitPrice | Číslo | Čistá nebo hrubá cena (v závislosti na nastavení hrubé faktury faktury) jedné jednotky této položky | 30,00 USD | 30 |
| Productcode | Řetězec | Kód produktu, číslo produktu nebo SKU přidružené ke konkrétní řádkové položce | A123 | |
| Jednotka | Řetězec | Jednotka řádkové položky, např. kg, lb atd. | Hodiny | |
| Datum | Datum | Datum odpovídající jednotlivým řádkové položce Často se jedná o datum odeslání řádkové položky. | 3/4/2021 | 2021-03-04 |
| Daň | Číslo | Daň přidružená ke každé řádkové položce. Mezi možné hodnoty patří částka daně, daň a daň od Y/N. | 10 % |
Extrahované páry klíč-hodnota faktury a extrahované řádkové položky jsou v documentResults oddílu výstupu JSON.
Rozpoznávání formulářů Preview verze 3.0
Verze Rozpoznávání formulářů Preview představuje několik nových funkcí a možností.
Postupujte podle průvodce Rozpoznávání formulářů v3.0 a zjistěte, jak používat verzi Preview ve vašich aplikacích a pracovních postupech.
Prozkoumejte naše REST API (Preview), abyste se dozvěděli další informace o verzi Preview a nových možnostech.
Další kroky
Dokončete rychlý Rozpoznávání formulářů startu:
Prozkoumejte naše REST API: