Vad är Azure AI dokumentintelligens?
Viktigt!
- Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling.
- Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
- Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-02-29-preview.
- Förhandsversion 2024-02-29-preview är för närvarande endast tillgänglig i följande Azure-regioner:
- USA, östra
- USA, västra 2
- Europa, västra
Det här innehållet gäller för:v4.0 (förhandsversion) | Tidigare versioner:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Det här innehållet gäller för:v3.1 (GA) | Senaste version:v4.0 (förhandsversion) | Tidigare versioner:v3.0v2.1
Det här innehållet gäller för:v3.0 (GA) | Senaste versionerna:v4.0 (förhandsversion)v3.1 | Tidigare version:v2.1
Det här innehållet gäller för:v2.1 | Senaste version:v4.0 (förhandsversion)
Kommentar
Formigenkänning är nu Azure AI Document Intelligence!
- Från och med juli 2023 omfattar Azure AI-tjänster alla vad som tidigare kallades Cognitive Services och Azure Applied AI Services.
- Det finns inga ändringar i prissättningen.
- Namnen Cognitive Services och Azure Applied AI fortsätter att användas i Azure-fakturering, kostnadsanalys, prislista och pris-API:er.
- Det finns inga icke-bakåtkompatibla ändringar i programprogrammeringsgränssnitt (API:er) eller SDK:er före och inklusive v3.1. Från och med v4.0 uppdateras API:er och SDK:er till Dokumentinformation.
- Vissa plattformar väntar fortfarande på uppdatering av namnbytet. Alla omnämnanden av Formigenkänning eller dokumentinformation i vår dokumentation avser samma Azure-tjänst.
Azure AI Document Intelligence är en molnbaserad Azure AI-tjänst som gör att du kan skapa intelligenta lösningar för dokumentbearbetning. Enorma mängder data, som omfattar en mängd olika datatyper, lagras i formulär och dokument. Med Dokumentinformation kan du effektivt hantera den hastighet med vilken data samlas in och bearbetas och är nyckeln till förbättrade åtgärder, välgrundade datadrivna beslut och upplyst innovation.
| ✔️ Modeller för dokumentanalys | ✔️ Fördefinierade modeller | ✔️ Anpassade modeller |
Modeller för dokumentanalys
Dokumentanalysmodeller möjliggör textextrahering från formulär och dokument och returnerar strukturerat affärsklart innehåll som är redo för din organisations åtgärd, användning eller utveckling.
Läs | Extrahera tryckt
och handskriven text.
Layout | Extrahera text,
tabeller och dokumentstruktur.
Läs | Extrahera tryckt
och handskriven text.
Layout | Extrahera text,
tabeller och dokumentstruktur.
Allmänt dokument | Extrahera text-,
struktur- och nyckel/värde-par.
Inbyggda modeller
Med fördefinierade modeller kan du lägga till intelligent dokumentbearbetning i dina appar och flöden utan att behöva träna och skapa egna modeller.
Faktura | Extrahera kund- och leverantörsinformation.
Kvitto | Extrahera information om försäljningstransaktioner.
Amerikansk inteckning 1003 | Extrahera låneprograminformation.
Amerikanska inteckning 1008 | Extrahera låneöverföringsinformation.
Upplysning om amerikanska hypotekslån | Extrahera slutgiltiga lånevillkor.
Sjukförsäkringskort | Extrahera försäkringsskyddsinformation.
Kontrakt | Extrahera avtals- och partinformation.
Kredit-/debetkort | Extrahera information om betalkort.
Äktenskapscertifikat | Extrahera certifierad äktenskapsinformation.
Formulär för US Tax W-2 | Extrahera information om beskattningsbar kompensation.
Formulär för US Tax 1098 | Extrahera information om bolåneräntor.
Formulär för US Tax 1098-E | Extrahera ränteinformation för studielån.
Formulär för US Tax 1098-T | Extrahera kvalificerad undervisningsinformation.
Formulär för US Tax 1099 | Extrahera formulär 1099 variantinformation.
Formulär för US Tax 1040 | Extrahera formulär 1040-variantinformation.
Faktura | Extrahera kund-
och leverantörsinformation.
Kvitto | Extrahera information om försäljningstransaktioner
.
Sjukförsäkringskort | Extrahera sjukförsäkringsinformation.
Visitkort | Extrahera kontaktuppgifter för företag.
Kontrakt | Extrahera avtals-
och partinformation.
Formulär för US Tax W-2 | Extrahera information om beskattningsbar
kompensation.
Formulär för US Tax 1098 | Extrahera information om bolåneräntor.
Formulär för US Tax 1098-E | Extrahera ränteinformation för studielån.
Formulär för US Tax 1098-T | Extrahera kvalificerad undervisningsinformation.
Anpassade modeller
- Anpassade modeller tränas med dina märkta datauppsättningar för att extrahera distinkta data från formulär och dokument, specifika för dina användningsfall.
- Fristående anpassade modeller kan kombineras för att skapa sammansatta modeller.
- Extraheringsmodeller
✔️ Anpassade extraheringsmodeller tränas att extrahera märkta fält från dokument.
Anpassad mall | Extrahera data från statiska layouter.
Anpassad neural | Extrahera data från dokument av blandad typ.
Anpassad sammansatt | Extrahera data med hjälp av en samling modeller.
- Klassificeringsmodell
✔️ Anpassade klassificerare identifierar dokumenttyper innan de anropar en extraheringsmodell.
Anpassad klassificerare | Identifiera avsedda dokumenttyper (klasser)
innan du anropar en extraheringsmodell.
Tilläggsfunktioner
Dokumentinformation stöder valfria funktioner som kan aktiveras och inaktiveras beroende på scenariot för dokumentextrahering. Följande tilläggsfunktioner är tillgängliga för 2023-07-31 (GA)
och senare versioner:
Dokumentinformation stöder valfria funktioner som kan aktiveras och inaktiveras beroende på scenariot för dokumentextrahering. Följande tilläggsfunktioner är tillgängliga för2024-02-29-preview
, 2023-10-31-preview
och senare versioner:
Analysfunktioner
Model ID | Extrahering av innehåll | Frågefält | Punkterna | Styckeroller | Markeringsmarkeringar | Tabeller | Nyckel/värde-par | Språk | Streckkoder | Dokumentanalys | Formler* | Formatmallsteckensnitt* | Högupplöst* |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read | ✓ | O | O | O | O | O | |||||||
fördefinierad layout | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
prebuilt-document | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |
prebuilt-businessCard | ✓ | ✓ | ✓ | ||||||||||
prebuilt-contract | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
fördefinierad faktura | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | ||
fördefinierad kvitto | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-creditCard | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1099(variationer) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1040(variations) | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
√ - Aktiverad
O - Valfritt
* - Premium-funktioner medför extra kostnader
Modeller och utvecklingsalternativ
Kommentar
Följande dokumenttolkningsmodeller och utvecklingsalternativ stöds av Document Intelligence Service v3.0.
Du kan använda Dokumentinformation för att automatisera dokumentbearbetning i program och arbetsflöden, förbättra datadrivna strategier och utöka funktionerna för dokumentsökning. Använd länkarna i tabellen för att lära dig mer om varje modell och bläddra bland utvecklingsalternativ.
Lästa
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
prebuilt-read | ● Extrahera text från dokument. ● Extrahering av data |
● Digitalisera alla dokument. ● Efterlevnad och granskning. ● Bearbeta handskrivna anteckningar före översättning. |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Layout
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
fördefinierad layout | ● Extrahera text- och layoutinformation från dokument. ● Extrahering av data |
● Dokumentera indexering och hämtning efter struktur. ● Analys av finansiella och medicinska rapporter. |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Allmänt dokument (inaktuellt 2023-10-31-preview)
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
prebuilt-document | ● Extrahera text,layout och nyckel/värde-par från dokument. ● Extrahering av data och fält |
● Extrahering av nyckel/värde-par. ● Formulärbearbetning. ● Undersökningsdatainsamling och analys. |
● Document Intelligence Studio ● REST API |
Faktura
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
fördefinierad faktura | ● Extrahera viktig information från fakturor. ● Extrahering av data och fält |
● Leverantörsreskontrabearbetning. ● Automatisk skatteregistrering och rapportering. |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Kvitto
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
fördefinierad kvitto | ● Extrahera nyckelinformation från kvitton. ● Data och fältextrahering ● Kvittomodell v3.0 stöder bearbetning av hotellkvitton på en sida. |
● Kostnadshantering. ● Dataanalys av konsumentbeteende. ● Kundlojalitetsprogram. ● Returbearbetning av varor. ● Automatisk skatteregistrering och rapportering. |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Identitet (ID)
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
prebuilt-idDocument | ● Extrahera nyckelinformation från pass och ID-kort. ● Dokumenttyper ● Extrahera godkännanden, begränsningar och fordonsklassificeringar från amerikanska körkort. |
● Känna till kundens (KYC) riktlinjer för finansiella tjänster efterlevnad. ● Hantering av medicinska konton. ● Identitetskontroller och gatewayer. ● Hotellregistrering. |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulär för amerikanska hypotekslån 1003
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
prebuilt-mortgage.us.1003 | ● Extrahera viktig information från 1003 låneansökningar. ● Extrahering av data och fält |
● Dokumentationskrav för Fannie Mae och Freddie Mac. | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Us mortgage 1008 form
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
prebuilt-mortgage.us.1008 | ● Extrahera viktig information från enhetlig underskrift och överföringssammanfattning. ● Extrahering av data och fält |
● Låneskrivningsbearbetning med hjälp av sammanfattningsdata. | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulär för upplysning av amerikanska hypotekslån
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
prebuilt-mortgage.us.closingDisclosure | ● Extrahera viktig information från enhetlig underskrift och överföringssammanfattning. ● Extrahering av data och fält |
● Krav på slutinformation för hypotekslån. | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Sjukförsäkringskortet
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
prebuilt-healthInsuranceCard.us | ● Extrahera viktig information från amerikanska sjukförsäkringskort. ● Extrahering av data och fält |
● Verifiering av täckning och berättigande. ● Förutsägande modellering. ● Värdebaserad analys. |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Kontraktsmodell
Model ID | beskrivning | Utvecklingsalternativ |
---|---|---|
prebuilt-contract | Extrahera avtals- och partinformation. ● Extrahering av data och fält |
● Document Intelligence Studio ● REST API ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Kreditkortsmodell
Model ID | beskrivning | Utvecklingsalternativ |
---|---|---|
prebuilt-creditCard | Extrahera avtals- och partinformation. ● Extrahering av data och fält |
● Document Intelligence Studio ● REST API ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Modell för äktenskapscertifikat
Model ID | beskrivning | Utvecklingsalternativ |
---|---|---|
prebuilt-marriageCertificate.us | Extrahera avtals- och partinformation. ● Extrahering av data och fält |
● Document Intelligence Studio ● REST API ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Us Tax W-2-modell
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
prebuilt-tax.us.W-2 | ● Extrahera viktig information från IRS US W2 skatteformulär (år 2018-2021). ● Extrahering av data och fält |
● Automatiserad hantering av skattedokument. ● Behandling av inteckningslån. |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulär för amerikansk skatt 1098
Model ID | beskrivning | Utvecklingsalternativ |
---|---|---|
prebuilt-tax.us.1098 | Extrahera information och information om inteckningsränta. ● Extrahering av data och fält |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulär för amerikansk skatt 1098-E
Model ID | beskrivning | Utvecklingsalternativ |
---|---|---|
prebuilt-tax.us.1098E | Extrahera studielånsinformation och information. ● Extrahering av data och fält |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Us tax 1098-T-formulär
Model ID | beskrivning | Utvecklingsalternativ |
---|---|---|
prebuilt-tax.us.1098T | Extrahera undervisningsinformation och information. ● Extrahering av data och fält |
● Document Intelligence Studio ● REST API |
Formulär för amerikansk skatt 1099 (och variationer)
Model ID | beskrivning | Utvecklingsalternativ |
---|---|---|
prebuilt-tax.us.1099{variation } |
Extrahera information från 1099-formulärvariationer. ● Extrahering av data och fält |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulär för AMERIKANSK skatt 1040
Model ID | beskrivning | Utvecklingsalternativ |
---|---|---|
prebuilt-tax.us.1040 | Extrahera information från 1040-formulärvariationer. ● Extrahering av data och fält |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Visitkort
Model ID | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
prebuilt-businessCard | ● Extrahera viktig information från visitkort. ● Extrahering av data och fält |
● Säljledning och marknadsföringsledning. | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Översikt över anpassad modell
Om | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
Anpassad modell | Extraherar information från formulär och dokument till strukturerade data baserat på en modell som skapats från en uppsättning representativa utbildningsdokumentuppsättningar. | Extrahera distinkta data från formulär och dokument som är specifika för ditt företag och användningsfall. | ● Document Intelligence Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
Anpassad mall
Kommentar
Om du vill träna en anpassad mallmodell anger du egenskapen buildMode
till template
.
Mer information finns iTräna en mallmodell
Om | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
Anpassad mallmodell | Den anpassade mallmodellen extraherar märkta värden och fält från strukturerade och halvstrukturerade dokument. |
Extrahera viktiga data från mycket strukturerade dokument med definierade visuella mallar eller vanliga visuella layouter, formulär. | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript SDK |
Anpassad neural
Kommentar
Om du vill träna en anpassad neural modell anger du egenskapen buildMode
till neural
.
Mer information finns iTräna en neural modell
Om | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
Anpassad neural modell | Den anpassade neurala modellen används för att extrahera märkta data från strukturerade (undersökningar, enkäter), halvstrukturerade (fakturor, inköpsorder) och ostrukturerade dokument (kontrakt, bokstäver). | Extrahera textdata, kryssrutor och tabellfält från strukturerade och ostrukturerade dokument. | ● Document Intelligence Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
Anpassad sammansatt
Om | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
Sammansatta anpassade modeller | En sammansatt modell skapas genom att ta en samling anpassade modeller och tilldela dem till en enda modell som skapats från dina formulärtyper. | Användbart när du tränar flera modeller och vill gruppera dem för att analysera liknande formulärtyper som inköpsorder. | ● Document Intelligence Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
Anpassad klassificeringsmodell
Om | beskrivning | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
Sammansatt klassificeringsmodell | Anpassade klassificeringsmodeller kombinerar layout- och språkfunktioner för att identifiera, identifiera och klassificera dokument i en indatafil. | ● En låneansökan paketerad med ansökningsformulär, lönebesked och bankutdrag. ● En samling skannade fakturor. |
● Document Intelligence Studio ● REST API |
Azure AI Document Intelligence är en molnbaserad Azure AI-tjänst som utvecklare kan använda för att skapa intelligenta lösningar för dokumentbearbetning. Dokumentinformation tillämpar maskininlärningsbaserad optisk teckenigenkänning (OCR) och tekniker för dokumenttolkning för att extrahera text, tabeller, struktur och nyckel/värde-par från dokument. Du kan också märka och träna anpassade modeller för att automatisera dataextrahering från strukturerade, halvstrukturerade och ostrukturerade dokument. Mer information om varje modell finns i artiklarna Begrepp:
Modelltyp | Modellnamn |
---|---|
Modell för dokumentanalys | ● Layoutanalysmodell |
Fördefinierade modeller | ● Fakturamodell ● Kvittomodell ● Identitetsdokumentmodell (ID) ● Visitkortsmodell |
Anpassade modeller | ● Anpassad modell ● Sammansatt modell |
Det här innehållet gäller för:v2.1 | Senaste version:v4.0 (förhandsversion)
Modeller och utvecklingsalternativ för dokumentinformation
Dricks
- För en förbättrad upplevelse och avancerad modellkvalitet kan du prova Document Intelligence v3.0 Studio.
- v3.0 Studio stöder alla modeller som tränats med v2.1-märkta data.
- Du kan läsa api-migreringsguiden för detaljerad information om migrering från v2.1 till v3.0.
Kommentar
Följande modeller och utvecklingsalternativ stöds av Document Intelligence Service v2.1.
Använd länkarna i tabellen för att lära dig mer om varje modell och bläddra i API-referenserna:
Modell | beskrivning | Utvecklingsalternativ |
---|---|---|
Layoutanalys | Extrahering och analys av text, markeringsmarkeringar, tabeller och koordinater för avgränsningsrutor från formulär och dokument. | ● Etikettverktyg för dokumentinformation● REST API ● SDK för klientbiblioteket● Docker-container för dokumentinformation |
Anpassad modell | Extrahering och analys av data från formulär och dokument som är specifika för distinkta affärsdata och användningsfall. | ● Etikettverktyg för dokumentinformation● REST API ● Exempeletikettverktyg ● Docker-container för dokumentinformation |
Fakturamodell | Automatiserad databearbetning och extrahering av viktig information från försäljningsfakturor. | ● Etikettverktyg för dokumentinformation● REST API ● SDK för klientbiblioteket● Docker-container för dokumentinformation |
Kvittomodell | Automatiserad databehandling och extrahering av viktig information från försäljningskvitton. | ● Etikettverktyg för dokumentinformation● REST API ● SDK för klientbiblioteket● Docker-container för dokumentinformation |
Modell för identitetsdokument (ID) | Automatiserad databehandling och extrahering av viktig information från amerikanska körkort och internationella pass. | ● Etikettverktyg för dokumentinformation● REST API ● SDK för klientbiblioteket● Docker-container för dokumentinformation |
Visitkortsmodell | Automatiserad databehandling och extrahering av viktig information från visitkort. | ● Etikettverktyg för dokumentinformation● REST API ● SDK för klientbiblioteket● Docker-container för dokumentinformation |
Datasekretess och säkerhet
Precis som med alla AI-tjänster bör utvecklare som använder document intelligence-tjänsten vara medvetna om Microsofts principer för kunddata. Se sidan Data, sekretess och säkerhet för Dokumentinformation .
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.
Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.