Co je Azure AI Document Intelligence?

Důležité

  • Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji.
  • Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
  • Verze Public Preview klientských knihoven Document Intelligence ve výchozím nastavení je rest API verze 2024-02-29-preview.
  • Verze Public Preview 2024-02-29-preview je aktuálně dostupná jenom v následujících oblastech Azure:
  • USA – východ
  • USA – západ 2
  • Západní Evropa

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.1 (GA)modrá značka zaškrtnutív3.0 (GA)modrá značka zaškrtnutív2.1 (GA)

Tento obsah se vztahuje na:Zaškrtnutív3.1 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.0modrá značka zaškrtnutív2.1

Tento obsah se vztahuje na:Zaškrtnutív3.0 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview)nachová značka zaškrtnutív3.1 | Předchozí verze:modrá značka zaškrtnutív2.1

Tento obsah se vztahuje na:Zaškrtnutív2.1 | Nejnovější verze:modrá značka zaškrtnutív4.0 (Preview)

Poznámka:

Rozpoznávání formulářů je teď Azure AI Document Intelligence!

  • Od července 2023 zahrnují služby Azure AI všechny služby označované jako Cognitive Services a Aplikace Azure lied AI Services.
  • Ceny se nemění.
  • Názvy služeb Cognitive Services a Aplikace Azure lied AI se nadále používají ve fakturaci Azure, analýze nákladů, ceníku a cenových rozhraních API.
  • Před a včetně v3.1 nedošlo k žádným zásadním změnám aplikačních programovacích rozhraní (API) ani sad SDK. Od verze 4.0 se rozhraní API a sady SDK aktualizují na funkci Document Intelligence.
  • Některé platformy stále čekají na aktualizaci přejmenování. Všechny zmínky o Rozpoznávání formulářů nebo funkci Document Intelligence v naší dokumentaci odkazují na stejnou službu Azure.

Azure AI Document Intelligence je cloudová služba Azure AI, která umožňuje vytvářet inteligentní řešení pro zpracování dokumentů. Velké objemy dat, které pokrývají širokou škálu datových typů, se ukládají ve formulářích a dokumentech. Funkce Document Intelligence umožňuje efektivně spravovat rychlost shromažďování a zpracování dat a je klíčem ke zlepšení operací, informovaným rozhodnutím založeným na datech a podporujícím inovace.

| ✔️ Modely analýzy dokumentů | ✔️ Předem připravené modely | ✔️ Vlastní modely |

Modely analýzy dokumentů

Modely analýzy dokumentů umožňují extrakci textu z formulářů a dokumentů a vrací strukturovaný obsah připravený pro podnikovou činnost, použití nebo průběh vaší organizace.


Číst | Extrahujte tištěný a rukou psaný
text.


Rozložení | Extrahujte text,
tabulky a strukturu dokumentu.


Číst | Extrahujte tištěný a rukou psaný
text.


Rozložení | Extrahujte text,
tabulky a strukturu dokumentu.


Obecný dokument | Extrahujte páry textu,
struktury a klíč-hodnota.

Předem vytvořené modely

Předem připravené modely umožňují přidat inteligentní zpracování dokumentů do aplikací a toků, aniž byste museli trénovat a vytvářet vlastní modely.


Faktura | Extrahujte podrobnosti o zákazníci
a dodavateli.


Potvrzení | Extrahujte podrobnosti o prodejní
transakci.


Identita | Extrahujte údaje o identifikaci
a ověření.


1003 EULA | Extrahujte podrobnosti o hypotékě.


Formulář 1008 | Extrahujte podrobnosti o hypotékě.


Závěrečné zveřejnění | Extrahujte podrobnosti o hypotékě.


Zdravotní pojištění | Extrahujte podrobnosti o zdravotním
pojištění.


Smlouva | Extrahujte podrobnosti smlouvy
a strany.


Kreditní/debetní karta | Extrahujte informace z bankovních karet.


Manželství osvědčení | Extrahujte informace z manželství certifikátů.


Us Tax W-2 form | Extrahování podrobností o kompenzaci k
dani.


Formulář pro daň z USA 1098 | Extrahujte podrobnosti o hypotékách.


Us Tax 1098-E form | Extrahujte podrobnosti o úrokech studentů z půjčky.


Us Tax 1098-T form | Extrahujte kvalifikované podrobnosti o výuce.


Formulář pro daň z USA 1099 | Extrahujte informace z variant formuláře 1099.


Us Tax 1040 form | Extrahujte informace z variant formuláře 1040.


Faktura | Extrahujte podrobnosti o zákazníci
a dodavateli.


Potvrzení | Extrahujte podrobnosti o prodejní
transakci.


Identita | Extrahujte údaje o identifikaci
a ověření.


Zdravotní pojištění | Extrahujte podrobnosti o zdravotním pojištění.


Vizitka | Extrahujte podrobnosti obchodních kontaktů.


Smlouva | Extrahujte podrobnosti smlouvy
a strany.


Us Tax W-2 form | Extrahování podrobností o kompenzaci k
dani.


Formulář pro daň z USA 1098 | Extrahujte podrobnosti o hypotékách.


Us Tax 1098-E form | Extrahujte podrobnosti o úrokech studentů z půjčky.


Us Tax 1098-T form | Extrahujte kvalifikované podrobnosti o výuce.

Vlastní modely

  • Vlastní modely se trénují pomocí označených datových sad k extrahování odlišných dat z formulářů a dokumentů, které jsou specifické pro vaše případy použití.
  • Samostatné vlastní modely je možné kombinovat a vytvářet složené modely.
  • Modely extrakce Vlastní modely
    ✔️ extrakce jsou trénovány k extrakci označených polí z dokumentů.


Vlastní šablona | Extrahujte data ze statických rozložení.


Vlastní neurální | Extrahujte data z dokumentů se smíšeným typem.


Vlastní složené | Extrahujte data pomocí kolekce modelů.

  • Klasifikátory klasifikačního modelu
    ✔️ identifikují typy dokumentů před vyvoláním modelu extrakce.


Vlastní klasifikátor | Před vyvoláním modelu extrakce identifikujte určené typy dokumentů (třídy
).

Možnosti doplňků

Funkce Document Intelligence podporuje volitelné funkce, které je možné povolit a zakázat v závislosti na scénáři extrakce dokumentů. Pro a novější verze jsou k dispozici 2023-07-31 (GA) následující možnosti doplňku:

Funkce Document Intelligence podporuje volitelné funkce, které je možné povolit a zakázat v závislosti na scénáři extrakce dokumentů. Pro a novější verze jsou k dispozici2024-02-29-preview2023-10-31-preview následující možnosti doplňku:

Funkce analýzy

ID modelu Extrakce obsahu Pole dotazu Odstavce Role odstavce Značky výběru Tabulky Páry klíč-hodnota Jazyky Čárové kódy Analýza dokumentů Vzorce* Písmo stylu* Vysoké rozlišení*
předem připravená čtení O O O O O
předem připravené rozložení O O O O O
předem připravený dokument O O O O O
předem připravená vizitka
předem připravená smlouva O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
předem připravená faktura O O O O O O
předem připravená potvrzení O O O O O
prebuilt-marriageCertificate.us O O O O O
předem připravená platební karta O O O O O
předem připravená hypotéka.us.1003 O O O O O
předem připravená hypotéka.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
předem připravená-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(varianty) O O O O O
prebuilt-tax.us.1040(varianty) O O O O O
{ customModelName } O O O O O

%% - Enabled
O - Optional
* - Premium features incur extra costs

Modely a možnosti vývoje

Poznámka:

Služba Document Intelligence v3.0 podporuje následující modely a možnosti vývoje.

Pomocí funkce Document Intelligence můžete automatizovat zpracování dokumentů v aplikacích a pracovních postupech, vylepšit strategie řízené daty a rozšířit možnosti hledání dokumentů. Pomocí odkazů v tabulce se dozvíte více o jednotlivých modelech a procházení možností vývoje.

Čteno

Snímek obrazovky se čtením analýzy modelu pomocí nástroje Document Intelligence Studio

ID modelu Popis Případy použití automatizace Možnosti vývoje
předem připravená čtení ● Extrahujte text z dokumentů.
Extrakce dat
● Digitalizace libovolného dokumentu.
● Dodržování předpisů a auditování.
● Zpracování rukou psaných poznámek před překladem.
Document Intelligence Studio
REST API
C# SDK
Python SDK● Java SDK

JavaScript

Rozložení

Snímek obrazovky s analýzou modelu rozložení pomocí nástroje Document Intelligence Studio

ID modelu Popis Případy použití automatizace Možnosti vývoje
předem připravené rozložení ● Extrahujte informace o textu a rozložení z dokumentů.
Extrakce dat
● Indexování a načítání dokumentů podle struktury.
● Analýza finanční a lékařské zprávy.
Document Intelligence Studio
REST API
C# SDK
Python SDK● Java SDK

JavaScript

Obecný dokument (zastaralý ve verzi 2023-10-31-preview)

Snímek obrazovky s analýzou obecného modelu dokumentu pomocí nástroje Document Intelligence Studio

ID modelu Popis Případy použití automatizace Možnosti vývoje
předem připravený dokument ● Extrahujte text, rozložení a páry klíč-hodnota z dokumentů.
Extrakce dat a polí
● Extrakce páru klíč-hodnota.
● Zpracování formulářů.
● Shromažďování a analýza dat průzkumu.
● Document Intelligence Studio
REST API

Faktura

Snímek obrazovky s analýzou modelu faktury pomocí nástroje Document Intelligence Studio

ID modelu Popis Případy použití automatizace Možnosti vývoje
předem připravená faktura ● Extrahujte klíčové informace z faktur.
Extrakce dat a polí
● Zpracování závazků.
● Automatizované daňové záznamy a vykazování.
Document Intelligence Studio
REST API
C# SDK
Python SDK● Java SDK

JavaScript

Potvrzení

Snímek obrazovky s analýzou modelu příjmu pomocí nástroje Document Intelligence Studio

ID modelu Popis Případy použití automatizace Možnosti vývoje
předem připravená potvrzení ● Extrahujte klíčové informace z účtenek.
● Data a extrakce
polí●
Model účtenky v3.0 podporuje zpracování jednostránkových účtenek.
● Správa výdajů.
● Analýza dat chování spotřebitelů.
● Program zákaznické věrnosti.
● Zpracování vrácení zboží.
● Automatizované daňové záznamy a vykazování.
Document Intelligence Studio
REST API
C# SDK
Python SDK● Java SDK

JavaScript

Identita (ID)

Snímek obrazovky s analýzou modelu dokumentu identity (ID) pomocí nástroje Document Intelligence Studio

ID modelu Popis Případy použití automatizace Možnosti vývoje
prebuilt-idDocument ● Extrahujte klíčové informace z pasů a ID karet.
● Typy
dokumentů●
Extrahujte doporučení, omezení a klasifikace vozidel z licencí řidiče v USA.
● Znalost dodržování předpisů pro finanční služby zákazníka (KYC).
● Správa lékařských účtů.
● Kontrolní body a brány identit.
● Registrace hotelu.
Document Intelligence Studio
REST API
C# SDK
Python SDK● Java SDK

JavaScript

Zdravotní pojištění

Snímek obrazovky s analýzou modelu zdravotní karty pomocí nástroje Document Intelligence Studio

ID modelu Popis Případy použití automatizace Možnosti vývoje
prebuilt-healthInsuranceCard.us ● Extrahujte klíčové informace z amerických zdravotních pojištění.
Extrakce dat a polí
● Pokrytí a ověření způsobilosti.
● Prediktivní modelování.
● Analýza založená na hodnotách.
Document Intelligence Studio
REST API
C# SDK
Python SDK● Java SDK

JavaScript

Model kontraktů

Snímek obrazovky extrakce modelu kontraktu pomocí nástroje Document Intelligence Studio

ID modelu Popis Možnosti vývoje
předem připravená smlouva Extrahujte smlouvu o smlouvě a podrobnosti strany. ● Document Intelligence Studio
REST API

Us Tax W-2 model

Snímek obrazovky s analýzou modelu W-2 pomocí nástroje Document Intelligence Studio

ID modelu Popis Případy použití automatizace Možnosti vývoje
prebuilt-tax.us.W-2 ● Extrahujte klíčové informace z daňových formulářů IRS US W2 (rok 2018–2021).
Extrakce dat a polí
● Automatizovaná správa daňových dokumentů.
● Zpracování žádosti o hypotéku.
Document Intelligence Studio
REST API
C# SDK
Python SDK● Java SDK

JavaScript

Formulář pro daň z USA 1098

Snímek obrazovky s daňovým formulářem pro USA 1098 analyzovaným v nástroji Document Intelligence Studio

ID modelu Popis Možnosti vývoje
předem připravená-tax.us.1098 Extrahujte informace a podrobnosti o hypotékách. ● Document Intelligence Studio
REST API

Us tax 1098-E form

Snímek obrazovky s formulářem pro daň z USA 1098-E analyzovaným v nástroji Document Intelligence Studio

ID modelu Popis Možnosti vývoje
prebuilt-tax.us.1098E Extrahujte informace o půjčkách studentů a podrobnosti. ● Document Intelligence Studio
REST API

Us tax 1098-T form

Snímek obrazovky s formulářem pro daň z USA 1098-T analyzovaným v nástroji Document Intelligence Studio

ID modelu Popis Možnosti vývoje
prebuilt-tax.us.1098T Extrahujte informace o výuce a podrobnosti. ● Document Intelligence Studio
REST API

Formulář pro daň z USA 1099 (a varianty)

Snímek obrazovky s daňovým formulářem pro USA 1099 analyzovaným v nástroji Document Intelligence Studio

ID modelu Popis Možnosti vývoje
prebuilt-tax.us.1099(Varianty) Extrahujte informace z variant ve formátu 1099. ● Document Intelligence Studio
REST API

Vizitka

Snímek obrazovky s analýzou modelu vizitky pomocí nástroje Document Intelligence Studio

ID modelu Popis Případy použití automatizace Možnosti vývoje
předem připravená vizitka ● Extrahujte klíčové informace z vizitek.
Extrakce dat a polí
● Prodejní zájemce a marketingová správa. Document Intelligence Studio
REST API
C# SDK
Python SDK● Java SDK

JavaScript

Přehled vlastního modelu

Snímek obrazovky s trénováním vlastních modelů pomocí nástroje Document Intelligence Studio

Informace Popis Případy použití automatizace Možnosti vývoje
Vlastní model Extrahuje informace z formulářů a dokumentů do strukturovaných dat na základě modelu vytvořeného ze sady reprezentativních trénovacích sad dokumentů. Extrahujte různá data z formulářů a dokumentů specifických pro vaše obchodní případy a případy použití. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK● Python SDK● Python SDK

Vlastní šablona

Snímek obrazovky s analýzou modelu vlastní šablony pomocí nástroje Document Intelligence Studio

Poznámka:

Pokud chcete vytrénovat vlastní model šablony, nastavte buildMode vlastnost na templatehodnotu . Další informace najdete v tématuTrénování modelu šablony.

Informace Popis Případy použití automatizace Možnosti vývoje
Vlastní model šablony Model vlastní šablony extrahuje hodnoty a pole s popisky ze strukturovaných a částečně strukturovaných dokumentů.
Extrahujte klíčová data z vysoce strukturovaných dokumentů s definovanými vizuálními šablonami nebo běžnými vizuálními rozloženími a formuláři. ● Document Intelligence Studio
REST API

C# SDK
Python SDK● Java SDK
● JavaScript SDK● JavaScript SDK

Vlastní neurální

Snímek obrazovky s analýzou vlastního neurálního modelu pomocí nástroje Document Intelligence Studio

Poznámka:

Pokud chcete vytrénovat vlastní neurální model, nastavte buildMode vlastnost na neuralhodnotu . Další informace najdete v tématuTrénování neurálního modelu.

Informace Popis Případy použití automatizace Možnosti vývoje
Vlastní neurální model Vlastní neurální model se používá k extrakci označených dat ze strukturovaných (průzkumů, dotazníků), částečně strukturovaných (faktur, nákupních objednávek) a nestrukturovaných dokumentů (kontrakty, dopisy). Extrahujte textová data, zaškrtávací políčka a tabulková pole ze strukturovaných a nestrukturovaných dokumentů. Document Intelligence Studio
● REST API
sada C# SDK
Java SDK
JavaScript SDK● Python SDK● Python SDK

Vlastní složené

Snímek obrazovky se seznamem složených vlastních modelů v nástroji Document Intelligence Studio

Informace Popis Případy použití automatizace Možnosti vývoje
Složené vlastní modely Složený model se vytvoří tak, že vezme kolekci vlastních modelů a přiřadí je k jednomu modelu vytvořenému z vašich typů formulářů. Užitečné při trénování několika modelů a chcete je seskupit za účelem analýzy podobných typů formulářů, jako jsou nákupní objednávky. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK● Python SDK● Python SDK

Vlastní klasifikační model

{alt-text}

Informace Popis Případy použití automatizace Možnosti vývoje
Složený klasifikační model Vlastní klasifikační modely kombinují rozložení a jazykové funkce, které umožňují detekovat, identifikovat a klasifikovat dokumenty ve vstupním souboru. ● Žádost o půjčku zabalená s formulářem žádosti, platebními tečkami a bankovní výpis.
● Kolekce naskenovaných faktur.
● Document Intelligence Studio
REST API

Azure AI Document Intelligence je cloudová služba Azure AI, která vývojářům umožňuje vytvářet inteligentní řešení pro zpracování dokumentů. Funkce Document Intelligence používá optické rozpoznávání znaků založené na strojovém učení (OCR) a technologie pro porozumění dokumentům k extrakci textu, tabulek, struktur a párů klíč-hodnota z dokumentů. Můžete také označit a trénovat vlastní modely pro automatizaci extrakce dat ze strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů. Další informace o jednotlivýchmodelch

Typ modelu Název modelu
Model analýzy dokumentů Model analýzy rozložení
Předem připravené modely ● Model
faktury●
Model účtenky
Model
dokladu identity (ID) model● Model vizitky
Vlastní modely ● Vlastní model
Složený model

Tento obsah se vztahuje na:Zaškrtnutív2.1 | Nejnovější verze:modrá značka zaškrtnutív4.0 (Preview)

Modely document Intelligence a možnosti vývoje

Tip

  • Pro vylepšené prostředí a pokročilou kvalitu modelu vyzkoušejte sadu Document Intelligence v3.0 Studio.
  • Sada v3.0 Studio podporuje jakýkoli model natrénovaný s daty označenými v2.1.
  • Podrobné informace o migraci z verze 2.1 na verzi 3.0 najdete v průvodci migrací rozhraní API.

Poznámka:

Služba Document Intelligence verze 2.1 podporuje následující modely a možnosti vývoje.

Pomocí odkazů v tabulce se dozvíte více o jednotlivých modelech a projděte si odkazy na rozhraní API:

Model Popis Možnosti vývoje
Analýza rozložení Extrakce a analýza textu, značek výběru, tabulek a souřadnic ohraničujícího rámečku z formulářů a dokumentů Nástroj pro
popisování document intelligence● ROZHRANÍ REST API
Sada SDK
klientské knihovny● Kontejner Document Intelligence Dockeru
Vlastní model Extrakce a analýza dat z formulářů a dokumentů specifických pro odlišné obchodní data a případy použití ● Nástroj pro
popisování dokumentace● ROZHRANÍ REST API
Ukázkový nástroj
pro popisování● Kontejner Dockeru v nástroji Document Intelligence
Model faktury Automatizované zpracování a extrakce klíčových informací z prodejních faktur. Nástroj pro
popisování document intelligence● ROZHRANÍ REST API
Sada SDK
klientské knihovny● Kontejner Document Intelligence Dockeru
Model účtenek Automatizované zpracování a extrakce klíčových informací z prodejních účtenek. Nástroj pro
popisování document intelligence● ROZHRANÍ REST API
Sada SDK
klientské knihovny● Kontejner Document Intelligence Dockeru
Model dokumentu identity (ID) Automatizované zpracování a extrakce klíčových informací z licencí a mezinárodních pasů v USA. Nástroj pro
popisování document intelligence● ROZHRANÍ REST API
Sada SDK
klientské knihovny● Kontejner Document Intelligence Dockeru
Model vizitek Automatizované zpracování a extrakce klíčových informací z vizitek. Nástroj pro
popisování document intelligence● ROZHRANÍ REST API
Sada SDK
klientské knihovny● Kontejner Document Intelligence Dockeru

Ochrana osobních údajů a zabezpečení dat

Stejně jako u všech služeb umělé inteligence by vývojáři používající službu Document Intelligence měli vědět o zásadách Microsoftu na zákaznických datech. Podívejte se na stránku Data, ochrana osobních údajů a zabezpečení pro funkci Document Intelligence .

Další kroky

  • Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.

  • Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.