Model obchodních karet pro rozpoznávání formulářů

Model obchodní karty kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely obsáhlého učení, které analyzují a extrahuje informace o klíčích z obrázků z obchodních karet. Rozhraní API analyzuje tištěné vizitky. extrahuje klíčové informace, jako je křestní jméno, příjmení, název společnosti, e-mailová adresa a telefonní číslo. a vrací strukturované znázornění dat JSON.

Ukázková obchodní karta zpracovaná pomocí nástroje pro rozpoznávání formulářů Studio

Ukázka vizitky

Možnosti vývoje

Nástroj pro rozpoznávání formulářů v 2.1 podporuje následující zdroje:

Funkce Zdroje informací
Model čtečky vizitek

Nástroj pro rozpoznávání formulářů v 3.0 podporuje následující zdroje:

Funkce Zdroje informací ID modelu
Model čtečky vizitek předem sestavený – businessCard

Vyzkoušet Nástroj pro rozpoznávání formulářů

Podívejte se na informace o tom, jak se data, včetně názvu, názvu úlohy, adresy, e-mailu a názvu společnosti, extrahují z vizitek pomocí nástroje pro rozpoznávání formulářů nebo našeho nástroje pro popis ukázky. Budete potřebovat následující:

Snímek obrazovky: klíče a umístění koncového bodu v Azure Portal.

Rozpoznávání formulářů – Studio (Preview)

Poznámka

Nástroj pro rozpoznávání formulářů je k dispozici v rozhraní API Preview (v 3.0).

  1. Na domovské stránce nástroje pro rozpoznávání formulářů vyberte možnost obchodní karty .

  2. Můžete analyzovat ukázkovou obchodní kartu nebo vybrat tlačítko + Přidat a nahrát si tak vlastní ukázku.

  3. Vyberte tlačítko analyzovat :

    Snímek obrazovky: Analýza nabídky na vizitce

Ukázkový nástroj pro popisky

Budete potřebovat dokument obchodní karty. Můžete použít náš vzorový dokument vizitky.

  1. Na domovské stránce nástroje Sample labeling vyberte použít předem sestavený model k získání dat.

  2. V rozevírací nabídce typ formuláře vyberte Vizitka :

    Snímek obrazovky: Ukázka výběr nástrojů pro popisky v nabídce Výběr předem sestaveného modelu rozevíracího seznamu.

Požadavky na vstup

  • Nejlepších výsledků dosáhnete, když zadáte jednu z jasných fotografií nebo vysoce kvalitní kontrolu na dokument.
  • Podporované formáty souborů: JPEG, PNG, BMP, TIFF a PDF (text – vložený nebo naskenovaný). Soubory PDF vložené do textu jsou nejvhodnější pro odstranění možnosti chyby při extrakci a umístění znaků.
  • Pro PDF a TIFF se dají zpracovat až 2000 stránek (s předplatným úrovně Free, zpracovávají se jenom první dvě stránky).
  • Velikost souboru musí být menší než 50 MB.
  • Rozměry obrázku musí být mezi 50 × 50 pixelů a 10000 × 10000 pixelů.
  • Rozměry PDF jsou až 17 × 17 palců, které odpovídají právnímu nebo a3 velikosti papíru nebo jsou menší.
  • Celková velikost školicích dat je 500 stránek nebo méně.
  • Pokud jsou vaše soubory PDF zamčené heslem, je nutné před odesláním odebrat zámek.
  • Pro bezdohledový Learning (bez označení dat):
    • Data musí obsahovat klíče a hodnoty.
    • Klíče se musí nacházet nad nebo nalevo od hodnot. nemůžou se zobrazit níže nebo vpravo.

Poznámka

Nástroj pro označování ukázkových popisků nepodporuje formát souboru BMP. Toto je omezení nástroje, který není službou pro rozpoznávání formulářů.

Podporované jazyky a národní prostředí

Poznámka

Není nutné zadávat národní prostředí. Toto je volitelný parametr. Technologie pro hloubkové učení ve formuláři automaticky detekuje jazyk textu v imagi.

Modelování Jazyk – kód národního prostředí Výchozí
Vizitka
  • Angličtina (USA) – EN-US
  • Angličtina (Austrálie) – EN-AU
  • Angličtina (Kanada) – en-CA
  • Angličtina (Spojené království) – en-GB
  • Angličtina (Indie) – en-IN
Automaticky rozpoznáno

Extrakce polí

Název Typ Description Standardizovaný výstup
ContactNames Pole objektů Jméno kontaktu
FirstName Řetězec První (zadaný) jméno kontaktu
LastName Řetězec Poslední (rodina) jméno kontaktu
CompanyName Pole řetězců Názvy společností
Oddělení Pole řetězců Oddělení nebo organizace, kterých se kontaktuje
JobTitles Pole řetězců Uvedené názvy (e) úloh kontaktu
E-maily Pole řetězců Kontaktní e-mailová adresa (y)
Websites Pole řetězců Weby společnosti
Adresy Pole řetězců Adresa (y) extrahovaná z vizitky
MobilePhones Pole telefonních čísel Čísla mobilních telefonů z vizitky + 1 XXX XXX XXXX
Faxy Pole telefonních čísel Faxové telefonní číslo (e) z vizitky + 1 XXX XXX XXXX
WorkPhones Pole telefonních čísel Telefonní čísla (s) z vizitky + 1 XXX XXX XXXX
OtherPhones Pole telefonních čísel Jiná telefonní čísla z vizitky + 1 XXX XXX XXXX

Verze Preview nástroje pro rozpoznávání formulářů v 3.0

Verze Preview nástroje pro rozpoznávání formulářů přináší několik nových funkcí a možností.

Další kroky