Co je optické rozpoznávání znaků?

Optické rozpoznávání znaků (OCR) umožňuje extrahovat tištěný nebo ručně psaný text z obrázků, jako jsou fotky dopravních značek a produktů, a také z faktur na dokumenty, faktur, finančních sestav, článků a — dalších. Technologie OCR od Microsoftu podporují extrakci tištěných textů v několika jazycích. Pokud chcete začít, postupujte podle rychlého startu.

Ukázky OCR

Tato dokumentace obsahuje následující typy článků:

  • Rychlé starty jsou podrobné pokyny, které vám umožňují provádět volání služby a získat výsledky v krátkém časovém období.
  • Návody obsahují pokyny pro použití služby konkrétnějšími nebo přizpůsobenějšími způsoby.

Rozhraní API pro čtení

Rozhraní POČÍTAČOVÉ ZPRACOVÁNÍ OBRAZU Read API je nejnovější technologie OCR v Azure(dozvítese, co je nového), která extrahuje tištěný text (v několika jazycích), rukou psaný text (v několika jazycích), číslice a symboly měn z obrázků a vícestránkové dokumenty PDF. Je optimalizovaný pro extrakci textu z textových obrázků a vícestránkové dokumenty PDF se smíšenými jazyky. Podporuje rozpoznávání tištěných i ručně psaných textu na stejném obrázku nebo dokumentu.

Jak OCR převádí obrázky a dokumenty na strukturovaný výstup s extrahovaným textem

Požadavky na vstup

Volání read přijímá obrázky a dokumenty jako vstup. Mají následující požadavky:

  • Podporované formáty souborů: JPEG, PNG, BMP, PDF a TIFF
  • V případě souborů PDF a TIFF se zpracuje až 2 000 stránek (pouze první dvě stránky na úrovni Free).
  • Velikost souboru musí být menší než 50 MB (6 MB pro bezplatnou vrstvu) a musí mít velikost alespoň 50 x 50 pixelů a maximální velikost 1 0000 × 1 0000 pixelů.

Podporované jazyky

Rozhraní API pro čtení podporuje 122 jazyků pro tisk textu a 7 jazyků pro rukou psaný text, včetně jazyků a funkcí ve verzi Preview.

Technologie OCR pro tištěný text zahrnuje podporu pro angličtinu, francouzštinu, němčinu, italštinu, portugalštinu, španělštinu, čínštinu, japonštinu, korejštinu a ruštinu (Preview) spolu s nejnovější aktualizací Preview.

OCR pro rukou psaný text zahrnuje podporu pro angličtinu a verzi Preview pro francouzštinu, němčinu, italštinu, portugalštinu, španělštinu a čínštinu.

Viz Určení verze modelu pro použití jazyků a funkcí preview. Podívejte se na úplný seznam jazyků podporovaných pro OCR. Model Preview zahrnuje vylepšení aktuálně ga verze.

Klíčové funkce

Rozhraní API pro čtení zahrnuje následující funkce.

  • Extrakce textu ve 122 jazycích
  • Extrakce rukou psaného textu v sedmi jazycích
  • Textové řádky a slova s umístěním a skóre spolehlivosti
  • Nevyžaduje se identifikace jazyka
  • Podpora smíšených jazyků ve smíšeném režimu (tisk a rukou psaný)
  • Výběr stránek a rozsahů stránek z velkých vícestránkové dokumenty
  • Možnost přirozeného pořadí čtení pro výstup řádku textu (pouze latinka)
  • Klasifikace rukopisu pro textové řádky (jenom latinka)
  • K dispozici jako bezduchý kontejner Dockeru pro místní nasazení

Naučte se používat funkce OCR.

Použití cloudového rozhraní API nebo místní nasazení

Cloudová rozhraní API pro čtení 3.x jsou pro většinu zákazníků upřednostňovanou volbou, protože díky snadné integraci a rychlé produktivitě jsou k dispozici. Azure a Počítačové zpracování obrazu služby se zaměřují na potřeby škálování, výkonu, zabezpečení dat a dodržování předpisů, zatímco vy se zaměřujete na plnění potřeb vašich zákazníků.

Pro místní nasazení vám kontejner Read Docker (Preview) umožňuje nasadit nové funkce OCR ve vašem vlastním místním prostředí. Kontejnery jsou skvělé pro splnění určitých požadavků na zabezpečení a zásady správného řízení dat.

Upozornění

V Počítačové zpracování obrazu 2.0 se operace RecognizeText zakřesávají ve prospěch nového rozhraní API pro čtení, které popisuje tento článek. Stávající zákazníci by měli přejít na používání operací čtení.

Ochrana osobních údajů a zabezpečení dat

Stejně jako u všech Cognitive Services by vývojáři, kteří používají službu Počítačové zpracování obrazu, měli znát zásady Microsoftu týkající se zákaznických dat. Další informace Cognitive Services na stránce o zabezpečení v Centru zabezpečení Microsoftu.

Další kroky