Form Recognizer lay-outmodel

Azure de Form Recognizer Layout-API extraheert tekst, tabellen, selectiemarkeringen en structuurgegevens uit documenten (PDF, TIFF) en afbeeldingen (JPG, PNG, BMP). Het indelingsmodel combineert een verbeterde versie van onze krachtige OCR-mogelijkheden (Optical Character Recognition) met Deep Learning-modellen voor het extraheren van tekst, tabellen, selectiemarkeringen en documentstructuur.

Voorbeeldformulier dat wordt verwerkt Form Recognizer de indelingsfunctie voorbeeldhulpprogramma voor labelen

Schermopname: voorbeeldhulpprogramma voor labelen dat GIF verwerkt.

Functies voor gegevensextractie

Indelingsmodel Tekstextractie Selectiemarkeringen Tabellen
Layout

Ontwikkelingsopties

De volgende resources worden ondersteund door Form Recognizer v2.1:

Functie Resources
Indelings-API

De volgende resources worden ondersteund door Form Recognizer v3.0:

Functie Resources Model-id
Indelingsmodel vooraf gebouwde indeling

Form Recognizer proberen

Zie hoe gegevens, inclusief tabellen, selectievakjes en tekst, worden geëxtraheerd uit formulieren en documenten met behulp van Form Recognizer Studio of ons voorbeeldhulpprogramma voor labelen. U hebt het volgende nodig:

  • Een Azure-abonnement: u kunt er gratis een maken

  • Een Form Recognizer-exemplaar in de Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar resource om uw API-sleutel en eindpunt op te halen.

Schermopname: sleutels en eindpuntlocatie in de Azure Portal.

Form Recognizer Studio (preview)

Notitie

Form Recognizer Studio is beschikbaar met de preview-API (v3.0).

Voorbeeldformulier verwerkt met Form Recognizer Studio

Schermopname: documentverwerking in Form Recognizer Studio.

  1. Selecteer Op de Form Recognizer Studio-startpagina de optie Indeling

  2. U kunt het voorbeelddocument analyseren of de knop + Toevoegen selecteren om uw eigen voorbeeld te uploaden.

  3. Selecteer de knop Analyseren:

    Schermopname: indelingsmenu analyseren.

Voorbeeldhulpprogramma voor labelen

U hebt een formulierdocument nodig. U kunt ons voorbeeldformulierdocument gebruiken.

  1. Selecteer op de startpagina voorbeeldhulpprogramma voor labelen Lay-out gebruiken om tekst, tabellen en selectiemarkeringen op te halen.

  2. Selecteer Lokaal bestand in de vervolgkeuzelijst.

  3. Upload bestand en selecteer Run Layout

    Schermopname: Schermopname: voorbeeldhulpprogramma voor labelen vervolgkeuzelijst indeling bestand bronmenu.

Vereisten voor invoer

  • Geef voor de beste resultaten één duidelijke foto of scan van hoge kwaliteit per document op.
  • Ondersteunde bestandsindelingen: JPEG, PNG, BMP, TIFF en PDF (tekst ingesloten of gescand). Pdf's met ingesloten tekst zijn het beste om de mogelijkheid van fout in tekenextractie en -locatie te elimineren.
  • Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).
  • De bestandsgrootte moet kleiner zijn dan 50 MB.
  • De afmetingen van afbeeldingen moeten tussen 50 x 50 en 10000 x 10000 pixels liggen.
  • PDF-afmetingen zijn maximaal 17 x 17 inch, overeenkomend met juridische of A3 papiergrootte of kleiner.
  • De totale grootte van de trainingsgegevens is 500 pagina's of minder.
  • Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.
  • Voor leren zonder supermomenten (zonder gelabelde gegevens):
    • Gegevens moeten sleutels en waarden bevatten.
    • Sleutels moeten boven of links van de waarden worden weergegeven; ze kunnen niet onder of rechts worden weergegeven.

Notitie

Het voorbeeldhulpprogramma voor labelen biedt geen ondersteuning voor de BMP-bestandsindeling. Dit is een beperking van het hulpprogramma dat niet de Form Recognizer Service.

Ondersteunde talen en talen

Form Recognizer preview-versie introduceert aanvullende taalondersteuning voor het indelingsmodel. Zie onze taalondersteuning voor een volledige lijst met ondersteunde handgeschreven en gedrukte tekst.

Functies

Tabellen en tabelkoppen

Indelings-API extraheert tabellen in pageResults de sectie van de JSON-uitvoer. Documenten kunnen worden gescand, gedimd of gedigitaliseerd. Tabellen kunnen complex zijn met samengevoegde cellen of kolommen, met of zonder randen en met afwijkende hoeken. Geëxtraheerde tabelgegevens omvatten het aantal kolommen en rijen, de rijspanne en de kolomspanne. Elke cel met het begrenzingsvak wordt uitgevoerd, samen met informatie of deze wordt herkend als onderdeel van een koptekst of niet. De door het model voorspelde koptekstcellen kunnen meerdere rijen omspannen en zijn niet noodzakelijkerwijs de eerste rijen in een tabel. Ze werken ook met geruleerde tabellen. Elke tabelcel bevat ook de volledige tekst met verwijzingen naar de afzonderlijke woorden in de readResults sectie.

Uitvoer van indelingstabelkoppen

Selectiemarkeringen

Indelings-API extraheert ook selectiemarkeringen uit documenten. Geëxtraheerde selectiemarkeringen bevatten het begrenzingsvak, de betrouwbaarheid en de status (geselecteerd/uitgeschakeld). Selectiemerkgegevens worden geëxtraheerd in readResults de sectie van de JSON-uitvoer.

Indelingsselectie markeert uitvoer

Tekstregels en woorden

Indelings-API extraheert tekst uit documenten en afbeeldingen met meerdere teksthoeken en kleuren. Het accepteert foto's van documenten, faxen, gedrukte en/of handgeschreven (alleen Engelse) tekst en gemengde modi. Tekst wordt geëxtraheerd met informatie over regels, woorden, begrenzendvakken, betrouwbaarheidsscores en stijl (handgeschreven of andere). Alle tekstinformatie is opgenomen in de readResults sectie van de JSON-uitvoer.

Uitvoer voor tekstextractie van lay-out

Natuurlijke leesorde voor tekstregels (alleen Latijns)

U kunt de volgorde opgeven waarin de tekstregels worden uitgevoerd met de readingOrder queryparameter. Gebruik natural voor een meer human-friendly leesvolgorde-uitvoer, zoals wordt weergegeven in het volgende voorbeeld. Deze functie wordt alleen ondersteund voor Latijnse talen.

Voorbeeld van leesorder voor lay-out

Handgeschreven classificatie voor tekstregels (alleen Latijns)

Het antwoord omvat het classificeren of elke tekstregel een handschriftstijl heeft, samen met een betrouwbaarheidsscore. Deze functie wordt alleen ondersteund voor Latijnse talen. In het volgende voorbeeld ziet u de handgeschreven classificatie voor de tekst in de afbeelding.

voorbeeld van de classificatie van handschriften

Paginanummers of -bereik selecteren voor tekstextractie

Gebruik voor grote documenten met meerdere pagina's de queryparameter om specifieke paginanummers of paginabereiken voor pages tekstextractie aan te geven. In het volgende voorbeeld ziet u een document met 10 pagina's, met tekst geëxtraheerd voor beide gevallen: alle pagina's (1-10) en geselecteerde pagina's (3-6).

Uitvoer van geselecteerde pagina's in indeling

Form Recognizer preview v3.0

De Form Recognizer preview introduceert verschillende nieuwe functies en mogelijkheden.

Volgende stappen