Mogelijkheden van de invoegtoepassing Document Intelligence
Belangrijk
- Openbare preview-versies van Document Intelligence bieden vroegtijdige toegang tot functies die actief zijn in ontwikkeling.
- Functies, benaderingen en processen kunnen veranderen, vóór algemene beschikbaarheid (GA), op basis van feedback van gebruikers.
- De openbare preview-versie van Document Intelligence-clientbibliotheken is standaard ingesteld op REST API-versie 2024-02-29-preview.
- Openbare preview-versie 2024-02-29-preview is momenteel alleen beschikbaar in de volgende Azure-regio's:
- VS - oost
- VS - west 2
- Europa -west
Deze inhoud is van toepassing op:v4.0 (preview) | Vorige versies:v3.1 (GA)
Deze inhoud is van toepassing op:v3.1 (GA) | Nieuwste versie:v4.0 (preview)
Notitie
Mogelijkheden voor invoegtoepassingen zijn beschikbaar in alle modellen, met uitzondering van het visitekaartjesmodel.
Functies
Document Intelligence biedt ondersteuning voor geavanceerdere en modulaire analysemogelijkheden. Gebruik de invoegtoepassingsfuncties om de resultaten uit te breiden met meer functies die zijn geëxtraheerd uit uw documenten. Voor sommige invoegtoepassingsfuncties worden extra kosten in rekening gebracht. Deze optionele functies kunnen worden ingeschakeld en uitgeschakeld, afhankelijk van het scenario van de documentextractie. Als u een functie wilt inschakelen, voegt u de bijbehorende functienaam toe aan de eigenschap van de features
queryreeks. U kunt meer dan één invoegtoepassingsfunctie inschakelen op een aanvraag door een door komma's gescheiden lijst met functies op te geven. De volgende uitbreidingsmogelijkheden zijn beschikbaar voor 2023-07-31 (GA)
en latere versies.
Notitie
Niet alle mogelijkheden voor invoegtoepassingen worden ondersteund door alle modellen. Ziemodelgegevensextractie voor meer informatie.
De volgende mogelijkheden voor invoegtoepassingen zijn beschikbaar voor2024-02-29-preview
, 2024-02-29-preview
en latere versies:
Notitie
De implementatie van queryvelden in de API 2023-10-30-preview verschilt van de laatste preview-versie. De nieuwe implementatie is goedkoper en werkt goed met gestructureerde documenten.
Beschikbaarheid van versie
Mogelijkheid voor invoegtoepassingen | Invoegtoepassing/gratis | 2024-02-29-preview | 2023-07-31 (GA) |
2022-08-31 (GA) |
v2.1 (GA) |
---|---|---|---|---|---|
Extractie van lettertype-eigenschap | Add-on | ✔️ | ✔️ | N.v.t. | N.v.t. |
Formuleextractie | Add-on | ✔️ | ✔️ | N.v.t. | N.v.t. |
Extractie met hoge resolutie | Add-on | ✔️ | ✔️ | N.v.t. | N.v.t. |
Streepjescode-extractie | Gratis | ✔️ | ✔️ | N.v.t. | N.v.t. |
Taaldetectie | Gratis | ✔️ | ✔️ | N.v.t. | N.v.t. |
Sleutel-waardeparen | Gratis | ✔️ | N.v.t. | n.v.t. | N.v.t. |
Queryvelden | Add-on* | ✔️ | N.v.t. | n.v.t. | N.v.t. |
✱ Invoegtoepassing - Queryvelden zijn anders geprijsd dan de andere invoegtoepassingsfuncties. Zie prijzen voor meer informatie.
Ondersteunde bestandsindelingen
PDF
Afbeeldingen:
JPEG
/JPG
,PNG
,BMP
, ,TIFF
HEIF
✱ Microsoft Office-bestanden worden momenteel niet ondersteund.
Extractie met hoge resolutie
De taak van het herkennen van kleine tekst uit grote documenten, zoals technische tekeningen, is een uitdaging. De tekst wordt vaak gemengd met andere grafische elementen en heeft verschillende lettertypen, grootten en afdrukstanden. Bovendien kan de tekst worden opgesplitst in afzonderlijke delen of worden verbonden met andere symbolen. Document Intelligence biedt nu ondersteuning voor het extraheren van inhoud uit deze typen documenten met de ocr.highResolution
mogelijkheid. U krijgt verbeterde kwaliteit van inhoudextractie uit A1/A2/A3-documenten door deze invoegtoepassing in te schakelen.
REST-API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=ocrHighResolution
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=ocrHighResolution
Formuleextractie
Met de ocr.formula
mogelijkheid worden alle geïdentificeerde formules, zoals wiskundige vergelijkingen, in de verzameling geëxtraheerd als een object op het formulas
hoogste niveau onder content
. Binnen content
worden gedetecteerde formules weergegeven als :formula:
. Elke vermelding in deze verzameling vertegenwoordigt een formule met het formuletype als inline
of display
, en de LaTeX-weergave, samen value
met de polygon
coördinaten. In eerste instantie worden formules weergegeven aan het einde van elke pagina.
Notitie
De confidence
score is in code vastgelegd.
"content": ":formula:",
"pages": [
{
"pageNumber": 1,
"formulas": [
{
"kind": "inline",
"value": "\\frac { \\partial a } { \\partial b }",
"polygon": [...],
"span": {...},
"confidence": 0.99
},
{
"kind": "display",
"value": "y = a \\times b + a \\times c",
"polygon": [...],
"span": {...},
"confidence": 0.99
}
]
}
]
REST-API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=formulas
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=formulas
Extractie van lettertype-eigenschap
De ocr.font
mogelijkheid extraheert alle lettertype-eigenschappen van tekst die in de styles
verzameling zijn geëxtraheerd als een object op het hoogste niveau onder content
. Elk stijlobject specificeert één lettertype-eigenschap, de tekst waarop het van toepassing is en de bijbehorende betrouwbaarheidsscore. De bestaande stijleigenschap wordt uitgebreid met meer lettertype-eigenschappen, zoals similarFontFamily
voor het lettertype van de tekst, fontStyle
voor stijlen zoals cursief en normaal, fontWeight
voor vet of normaal, color
voor kleur van de tekst en backgroundColor
voor kleur van het tekstbegrenzingsvak.
"content": "Foo bar",
"styles": [
{
"similarFontFamily": "Arial, sans-serif",
"spans": [ { "offset": 0, "length": 3 } ],
"confidence": 0.98
},
{
"similarFontFamily": "Times New Roman, serif",
"spans": [ { "offset": 4, "length": 3 } ],
"confidence": 0.98
},
{
"fontStyle": "italic",
"spans": [ { "offset": 1, "length": 2 } ],
"confidence": 0.98
},
{
"fontWeight": "bold",
"spans": [ { "offset": 2, "length": 3 } ],
"confidence": 0.98
},
{
"color": "#FF0000",
"spans": [ { "offset": 4, "length": 2 } ],
"confidence": 0.98
},
{
"backgroundColor": "#00FF00",
"spans": [ { "offset": 5, "length": 2 } ],
"confidence": 0.98
}
]
REST-API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=styleFont
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=styleFont
Extractie van streepjescode-eigenschap
Met de ocr.barcode
mogelijkheid worden alle geïdentificeerde streepjescodes in de verzameling geëxtraheerd als een object op het barcodes
hoogste niveau onder content
. Binnen de content
gedetecteerde streepjescodes worden weergegeven als :barcode:
. Elke vermelding in deze verzameling vertegenwoordigt een streepjescode en bevat het type streepjescode als kind
en de inhoud van de ingesloten streepjescode, samen value
met polygon
de coördinaten. In eerste instantie worden streepjescodes weergegeven aan het einde van elke pagina. De confidence
code is vastgelegd voor als 1.
Ondersteunde streepjescodetypen
Type streepjescode | Voorbeeld |
---|---|
QR Code |
|
Code 39 |
|
Code 93 |
|
Code 128 |
|
UPC (UPC-A & UPC-E) |
|
PDF417 |
|
EAN-8 |
|
EAN-13 |
|
Codabar |
|
Databar |
|
Databar Uitgebreid |
|
ITF |
|
Data Matrix |
REST-API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=barcodes
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=barcodes
Taaldetectie
Als u de languages
functie toevoegt aan de analyzeResult
aanvraag, wordt de gedetecteerde primaire taal voor elke tekstregel voorspeld, samen met de confidence
in de languages
verzameling eronder analyzeResult
.
"languages": [
{
"spans": [
{
"offset": 0,
"length": 131
}
],
"locale": "en",
"confidence": 0.7
},
]
REST-API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=languages
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=languages
Sleutel-waardeparen
In eerdere API-versies heeft het vooraf samengestelde documentmodel sleutel-waardeparen uit formulieren en documenten geëxtraheerd. Met de toevoeging van de keyValuePairs
functie aan vooraf gedefinieerde indeling produceert het indelingsmodel nu dezelfde resultaten.
Sleutel-waardeparen zijn specifieke spanten binnen het document waarmee een label of sleutel en de bijbehorende reactie of waarde worden geïdentificeerd. In een gestructureerd formulier kunnen deze paren het label zijn en de waarde die de gebruiker voor dat veld heeft ingevoerd. In een ongestructureerd document kunnen ze de datum zijn waarop een contract is uitgevoerd op basis van de tekst in een alinea. Het AI-model is getraind om identificeerbare sleutels en waarden te extraheren op basis van een groot aantal documenttypen, indelingen en structuren.
Sleutels kunnen ook geïsoleerd bestaan wanneer het model detecteert dat er een sleutel bestaat, zonder gekoppelde waarde of bij het verwerken van optionele velden. In sommige gevallen kan bijvoorbeeld een veld met een middelste naam leeg blijven in een formulier. Sleutel-waardeparen zijn tekstbereiken in het document. Voor documenten waarbij dezelfde waarde op verschillende manieren wordt beschreven, bijvoorbeeld klant/gebruiker, is de bijbehorende sleutel klant of gebruiker (op basis van context).
REST-API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=keyValuePairs
Queryvelden
Queryvelden zijn een invoegtoepassingsmogelijkheid om het schema uit te breiden dat is geëxtraheerd uit een vooraf samengesteld model of om een specifieke sleutelnaam te definiëren wanneer de sleutelnaam variabel is. Als u queryvelden wilt gebruiken, stelt u de functies queryFields
in op een door komma's gescheiden lijst met veldnamen in de queryFields
eigenschap.
Document Intelligence ondersteunt nu extracties van queryvelden. Met extractie van queryvelden kunt u velden toevoegen aan het extractieproces met behulp van een queryaanvraag zonder dat u extra training nodig hebt.
Gebruik queryvelden wanneer u het schema van een vooraf gedefinieerd of aangepast model wilt uitbreiden of een paar velden wilt extraheren met de uitvoer van de indeling.
Queryvelden zijn een premium-invoegtoepassingsmogelijkheid. Voor de beste resultaten definieert u de velden die u wilt extraheren met behulp van kameel- of Pascal-hoofdletterveldnamen voor veldnamen met meerdere woorden.
Queryvelden ondersteunen maximaal 20 velden per aanvraag. Als het document een waarde voor het veld bevat, worden het veld en de waarde geretourneerd.
Deze release heeft een nieuwe implementatie van de mogelijkheid voor queryvelden die lager is dan de eerdere implementatie en moet worden gevalideerd.
Notitie
Queryveldextractie van Document Intelligence Studio is momenteel beschikbaar met de API voor indelings- en vooraf samengestelde modellen 2024-02-29-preview
2023-10-31-preview
en latere versies, met uitzondering van de US tax
modellen (W2, 1098s en 1099s).
Queryveldextractie
Geef voor extractie van queryvelden de velden op die u wilt extraheren en Document Intelligence analyseert het document dienovereenkomstig. Hier volgt een voorbeeld:
Als u een contract in Document Intelligence Studio verwerkt, gebruikt u de
2024-02-29-preview
of2023-10-31-preview
versies:U kunt een lijst met veldlabels
Party1
zoals ,Party2
,TermsOfUse
, enPaymentDate
PaymentTerms
TermEndDate
als onderdeel van deanalyze document
aanvraag doorgeven.Document Intelligence kan de veldgegevens analyseren en extraheren en de waarden retourneren in een gestructureerde JSON-uitvoer.
Naast de queryvelden bevat het antwoord tekst, tabellen, selectiemarkeringen en andere relevante gegevens.
REST-API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=queryFields&queryFields=TERMS
Volgende stappen
Meer informatie: Modelindelingsmodellezen
SDK-voorbeelden: python