Form Recognizer algemeen documentmodel (preview)

Het previewmodel voor algemene documenten combineert krachtige OCR-mogelijkheden (Optical Character Recognition) met Deep Learning-modellen om sleutel-waardeparen en entiteiten uit documenten te extraheren. Algemeen document is alleen beschikbaar met de preview-API (v3.0). Zie onze migratiehandleiding voor meer informatie over het gebruik van de preview-API (v3.0).

De algemene document-API ondersteunt de meeste formuliertypen en analyseert uw documenten en koppelt waarden aan sleutels en vermeldingen aan tabellen die worden ontdekt. Het is ideaal voor het extraheren van algemene sleutel-waardeparen uit documenten. U kunt het algemene documentmodel gebruiken als alternatief voor het trainen van een aangepast model zonder labels.

Algemene documentfuncties

  • U hoeft geen aangepast model te trainen om sleutel-waardeparen te extraheren.

  • Er wordt één API gebruikt om sleutelwaardeparen, entiteiten, tekst, tabellen en structuur uit documenten te extraheren.

  • Het is een vooraf getraind model dat periodiek wordt getraind op nieuwe gegevens om de dekking en nauwkeurigheid te verbeteren.

  • Het algemene documentmodel ondersteunt gestructureerde, semi-gestructureerde en ongestructureerde gegevens.

Voorbeelddocument verwerkt in Form Recognizer Studio

Schermopname: algemene documentanalyse in Form Recognizer Studio.

Ontwikkelingsopties

De volgende resources worden ondersteund door Form Recognizer v3.0:

Functie Resources
🆕 algemeen documentmodel

Form Recognizer proberen

Zie hoe gegevens, inclusief tabellen, waarden en entiteiten, worden geëxtraheerd uit formulieren en documenten met behulp van Form Recognizer Studio of ons voorbeeldhulpprogramma voor labelen. U hebt het volgende nodig:

  • Een Azure-abonnement: u kunt er gratis een maken

  • Een Form Recognizer-exemplaar in de Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar resource om uw API-sleutel en eindpunt op te halen.

Schermopname: sleutels en eindpuntlocatie in de Azure Portal.

Form Recognizer Studio (preview)

Notitie

Form Recognizer Studio en het algemene documentmodel zijn beschikbaar met de preview-API (v3.0).

  1. Selecteer op Form Recognizer Studio-startpagina de optie Algemene documenten

  2. U kunt het voorbeelddocument analyseren of de knop + Toevoegen selecteren om uw eigen voorbeeld te uploaden.

  3. Selecteer de knop Analyseren:

    Schermopname: het menu Algemeen document analyseren.

Sleutel-waardeparen

Sleutel-waardeparen zijn specifieke omspannen binnen het document die een label of sleutel en de bijbehorende reactie of waarde identificeren. In een gestructureerde vorm kan dit het label zijn en de waarde die de gebruiker heeft ingevoerd voor dat veld of in een ongestructureerd document. Dit kan de datum zijn waarop een contract is uitgevoerd op basis van de tekst in een alinea. Het AI-model is getraind om identificeerbare sleutels en waarden te extraheren op basis van een groot aantal documenttypen, indelingen en structuren.

Sleutels kunnen ook geïsoleerd bestaan wanneer het model detecteert dat er een sleutel bestaat, zonder gekoppelde waarde of bij het verwerken van optionele velden. In sommige gevallen kan een veld voor de middelste naam bijvoorbeeld leeg worden gelaten op een formulier. Sleutel-waardeparen zijn altijd een reeks tekst in het document. Als u documenten hebt waarin dezelfde waarde op verschillende manieren wordt beschreven, bijvoorbeeld een klant of een gebruiker, is de gekoppelde sleutel klant of gebruiker op basis van wat het document bevat.

Entiteiten

Natuurlijke taalverwerkingsmodellen kunnen delen van spraak identificeren en elk token of woord classificeren. Het model voor herkenning van benoemde entiteiten kan entiteiten zoals personen, locaties en datums identificeren om een rijkere ervaring te bieden. Door entiteiten te identificeren, kunt u onderscheid maken tussen klanttypen, bijvoorbeeld een individu of een organisatie. Het extractiemodel voor sleutel-waardeparen en het model voor entiteitsidentificatie worden parallel uitgevoerd op het hele document en niet alleen op de waarden van de geëxtraheerde sleutelwaardeparen. Dit zorgt ervoor dat complexe structuren waar een sleutel niet kan worden geïdentificeerd, nog steeds worden verrijkt door de entiteiten waarnaar wordt verwezen te identificeren. U kunt nog steeds sleutels of waarden matchen met entiteiten op basis van de verschuivingen van de geïdentificeerde omspannen.

  • Het algemene document is een vooraf getraind model en kan rechtstreeks worden aangeroepen via de REST API.

  • Het algemene documentmodel ondersteunt HERKENNING van benoemde entiteiten (NER) voor verschillende entiteitscategorieën. NER is de mogelijkheid om verschillende entiteiten in tekst te identificeren en deze te categoriseren in vooraf gedefinieerde klassen of typen, zoals persoon, locatie, gebeurtenis, product en organisatie. Het extraheren van entiteiten kan nuttig zijn in scenario's waarin u geëxtraheerde waarden wilt valideren. De entiteiten worden geëxtraheerd uit de volledige inhoud en niet alleen uit de geëxtraheerde waarden.

Algemene extractie van documentmodelgegevens

Model Tekstextractie Sleutel-waardeparen Selectiemarkeringen Tabellen Entiteiten
Algemeen document

Vereisten voor invoer

  • Geef voor de beste resultaten één duidelijke foto of scan van hoge kwaliteit per document op.
  • Ondersteunde bestandsindelingen: JPEG, PNG, BMP, TIFF en PDF (tekst ingesloten of gescand). Pdf-bestanden met ingesloten tekst kunnen het beste de mogelijkheid van een fout in tekenextractie en -locatie elimineren.
  • Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).
  • De bestandsgrootte moet kleiner zijn dan 50 MB.
  • De afmetingen van afbeeldingen moeten tussen 50 x 50 en 10000 x 10000 pixels liggen.
  • PDF-afmetingen zijn maximaal 17 x 17 inch, overeenkomend met juridische of A3 papiergrootte of kleiner.
  • De totale grootte van de trainingsgegevens is 500 pagina's of minder.
  • Als uw PDF-bestanden met een wachtwoord zijn vergrendeld, moet u de vergrendeling verwijderen voordat u ze indient.
  • Voor leren zonder super supervised (zonder gelabelde gegevens):
    • Gegevens moeten sleutels en waarden bevatten.
    • Sleutels moeten boven of links van de waarden worden weergegeven; ze kunnen niet onder of rechts worden weergegeven.

Ondersteunde talen en talen

Model Taal: taalcode Standaard
Algemeen document
  • Engels (Verenigde Staten)— en-US
Engels (Verenigde Staten)— en-US

NER-categorieën (Named Entity Recognition)

Categorie Type Description
Person Tekenreeks De gedeeltelijke of volledige naam van een persoon.
PersonType Tekenreeks Het type of de rol van een persoon.
Locatie Tekenreeks Natuurlijke en door de mens gemaakte oriëntatiepunten, structuren, geografische kenmerken en geopolitieke entiteiten.
Organisatie Tekenreeks Bedrijven, politieke groepen, muziekgroepen, sportbedrijven, overheidsinstanties en openbare organisaties.
Gebeurtenis Tekenreeks Historische, sociale en natuurlijk voorkomende gebeurtenissen.
Product Tekenreeks Fysieke objecten van verschillende categorieën.
Vaardigheid Tekenreeks Een mogelijkheid, vaardigheid of expertise.
Adres Tekenreeks Volledige adressen.
Telefoonnummer Tekenreeks Telefoon getallen.
E-mail Tekenreeks E-mailadres.
URL Tekenreeks Website-URL's en koppelingen.
IP-adres Tekenreeks IP-adressen van het netwerk.
DateTime Tekenreeks Datums en tijden van de dag.
Aantal Tekenreeks Numerieke metingen en eenheden.

Overwegingen

  • Het extraheren van entiteiten kan nuttig zijn in scenario's waarin u geëxtraheerde waarden wilt valideren. De entiteiten worden geëxtraheerd op de volledige inhoud van de documenten en niet alleen de geëxtraheerde waarden.

  • Sleutels zijn reeksen tekst die uit het document worden geëxtraheerd. Voor semi-gestructureerde documenten moeten sleutels mogelijk worden toe te staan aan een bestaande woordenlijst met sleutels.

  • Verwacht sleutel-waardeparen met een sleutel te zien, maar geen waarde. Bijvoorbeeld als een gebruiker ervoor heeft gekozen geen e-mailadres op het formulier op te geven.

Volgende stappen