Aan de slag: Form Recognizer Studio | Voorbeeld
Notitie
Form Recognizer Studio is momenteel beschikbaar als openbare preview. Sommige functies worden mogelijk niet ondersteund of hebben beperkte mogelijkheden.
Form Recognizer Studio Preview is een online hulpprogramma voor het visueel verkennen, begrijpen en integreren van functies van de Form Recognizer-service in uw toepassingen. Ga aan de slag met het verkennen van de vooraf getrainde modellen met voorbeelddocumenten of uw eigen. Maak projecten om aangepaste formuliermodellen te bouwen en verwijs naar de modellen in uw toepassingen met behulp van de Python SDK-preview en andere quickstarts.
Migreren vanuit het voorbeeldhulpprogramma voor labelen
Als u een eerdere gebruiker bent van het voorbeeldhulpprogramma voor labelen,slaat u de vereisten over om u aan te melden bij de Studio Preview om uw bestaande Azure-account en Form Recognizer- of Cognitive Services-resources met studio te gebruiken.
Als u uw bestaande aangepaste projecten wilt migreren naar Studio, gaat u naar de sectie Aan de slag met aangepast model om een nieuw project te maken en dit te laten wijzen naar dezelfde Azure Blob Storage-locatie, ervan uitgaande dat u er toegang toe hebt in Azure. Zodra u een nieuw project hebt geconfigureerd, laadt studio alle documenten en tussentijdse bestanden voor labelen en training.
Minimale vereisten voor nieuwe gebruikers
- Een actief Azure-account. Als u nog geen account hebt, kunt u een gratis account maken.
- Een Form Recognizer of Cognitive Services resource voor meerdere service.
Aanvullende vereisten voor aangepaste projecten
Naast het Azure-account en een Form Recognizer of Cognitive Services resource hebt u het volgende nodig:
Azure Blob Storage container
Een Azure Blob-account met standaardprestaties Storage. U maakt containers om uw blobgegevens in uw opslagaccount op te slaan en te organiseren. Als u niet weet hoe u een Azure-opslagaccount met een container moet maken, volgt u deze quickstarts:
- Maak een opslagaccount. Zorg er bij het maken van uw opslagaccount voor dat u Standaardprestaties selecteert in het veld → prestaties.
- Maak een container. Stel bij het maken van uw container het veld Openbaar toegangsniveau in op Container (anonieme leestoegang voor containers en blobs) in het venster Nieuwe container.
CORS configureren
CORS (Cross Origin Resource Sharing) moet worden geconfigureerd in uw Azure-opslagaccount om deze toegankelijk te maken vanuit Form Recognizer Studio. Als u CORS wilt configureren in Azure Portal, hebt u toegang nodig tot de CORS-blade van uw opslagaccount.
- Selecteer de blade CORS voor het opslagaccount.
- Begin met het maken van een nieuwe CORS-vermelding in Blob service.
- Stel Toegestane oorsprongen in op https://formrecognizer.appliedai.azure.com .
- Selecteer alle beschikbare 8 opties voor Toegestane methoden.
- Keur alle toegestane headers en zichtbare headers goed door in elk veld een * in te geven.
- Stel de Maximale leeftijd in op 120 seconden of een acceptabele waarde.
- Klik op de knop Opslaan bovenaan de pagina om de wijzigingen op te slaan.
CORS moet nu worden geconfigureerd voor het gebruik van het opslagaccount van Form Recognizer Studio.
Set voorbeelddocumenten
Ga naar de Azure Portal en navigeer als volgt: Uw opslagaccount → Data storage → Containers
Selecteer een container in de lijst.
Selecteer Upload in het menu bovenaan de pagina.
Het Upload blob wordt weergegeven.
Selecteer de bestanden die u wilt uploaden.
Notitie
Studio gebruikt standaard formulierdocumenten die zich in de hoofdmap van uw container bevinden. U kunt echter gegevens gebruiken die zijn geordend in mappen als deze zijn opgegeven in de stappen voor het maken van een aangepast formulierproject. Zie Uw gegevens organiseren in submappen
Meld u aan bij Form Recognizer Studio Preview
Nadat u aan de vereisten hebt voltooid, gaat u naar de Form Recognizer Studio Preview.
Selecteer een Form Recognizer servicefunctie op de startpagina van Studio.
Selecteer uw Azure-abonnement, resourcegroep en resource. (U kunt de resources op elk gewenst moment wijzigen in 'Instellingen' in het bovenste menu.)
Controleer en bevestig uw selecties.
Layout
In de weergave Indeling:
Selecteer de opdracht Analyseren om Lay-outanalyse uit te voeren op het voorbeelddocument of probeer uw document uit met behulp van de opdracht Toevoegen.
Bekijk de gemarkeerde geëxtraheerde tekst, de tabelpictogrammen met de uitgepakte tabellocaties en gemarkeerde selectiemarkeringen.
Gebruik de besturingselementen onderaan het scherm om in- en uit te zoomen en de documentweergave te draaien.
De lagen voor tekst, tabellen en selectie worden weergeven en verborgen om op elk van deze lagen tegelijk te focussen.
Blader in het tabblad Resultaat van de uitvoersectie door de JSON-uitvoer om de indeling van het service-antwoord te begrijpen. Kopieer en download naar jumpstart-integratie.
Vooraf gemaakte modellen
Er zijn verschillende vooraf gebouwde modellen waaruit u kunt kiezen, die elk een eigen set ondersteunde velden hebben. Het model dat voor de analysebewerking moet worden gebruikt, is afhankelijk van het type document dat moet worden geanalyseerd. Hier zijn vooraf gebouwde modellen die momenteel worden ondersteund door de Form Recognizer service:
- 🆕 document : tekst,tabellen, structuur, sleutel-waardeparen en benoemde entiteiten analyseren en extraheren.
- Factuur:extraheert tekst, selectiemarkeringen, tabellen, sleutel-waardeparen en sleutelgegevens van facturen.
- Ontvangstbewijs:extraheert tekst- en sleutelgegevens uit ontvangstbewijzen.
- Id-document:extraheert tekst- en sleutelgegevens uit stuurprogrammalicenties en internationale passports.
- Visitekaartje:extraheert tekst- en sleutelgegevens uit visitekaartjes.
In de vooraf gebouwde weergave:
Selecteer in de Start van Studio een van de vooraf gebouwde modellen. In dit voorbeeld gebruiken we het factuurmodel.
Selecteer de opdracht Analyseren om een analyse uit te voeren op het voorbeelddocument of probeer uw factuur met behulp van de opdracht Toevoegen.
Bekijk in de sectie Visualisatie de gemarkeerde velden, waarden en factuurregelitems. Alle geëxtraheerde tekst en tabellen worden ook weergegeven.
Noteer de vermelde velden en waarden op het tabblad Velden van de uitvoersectie en selecteer de regelitems die u wilt weergeven in een tabel-achtige indeling.
Blader in het tabblad Resultaat van de uitvoersectie door de JSON-uitvoer om de indeling van het service-antwoord te begrijpen. Kopieer en download naar jumpstart-integratie.
Basisbeginselen van aangepast model
Aan de slag
Als u aangepaste modellen wilt maken, begint u met het configureren van uw project:
Selecteer in de Startpagina van Studio het project Aangepast formulier om de startpagina Aangepast formulier te openen.
Gebruik de opdracht 'Een project maken' om de wizard voor het configureren van het nieuwe project te starten.
Voer projectdetails in, selecteer het Azure-abonnement en de resource en de Azure Blob Storage-container die uw gegevens bevat.
Controleer en verzend uw instellingen om het project te maken.
Basisstroom
Na de stap voor het maken van het project, in de fase aangepast model:
Definieer in de labelweergave de labels en de typen die u wilt extraheren.
Selecteer de tekst in het document en selecteer het label in de vervolgkeuzelijst of het deelvenster Labels.
Label nog vier documenten om ten minste vijf documenten te labelen.
Selecteer de opdracht Trainen en voer de naam en beschrijving van het model in om te beginnen met het trainen van uw aangepaste model.
Zodra het model gereed is, gebruikt u de opdracht Testen om het te valideren met uw testdocumenten en de resultaten te observeren.
Andere functies
Bekijk bovendien al uw modellen met behulp van het tabblad Modellen aan de linkerkant. Selecteer in de lijstweergave een of meer modellen om de volgende acties uit te voeren:
Test het model in de lijstweergave.
Gebruik de opdracht Verwijderen om modellen te verwijderen die niet vereist zijn.
Download modeldetails voor offlineweergave.
Selecteer meerdere modellen en stel deze samen in een nieuw model dat in uw toepassingen moet worden gebruikt.
Labelen als tabellen
Tijdens het maken van uw aangepaste modellen moet u mogelijk gegevensverzamelingen extraheren uit uw documenten. Deze kunnen in een aantal indelingen worden weergegeven. Tabellen gebruiken als het visuele patroon:
Dynamisch of variabel aantal waarden (rijen) voor een bepaalde set velden (kolommen)
Specifieke verzameling waarden voor een bepaalde set velden (kolommen en/of rijen)
Labelen als dynamische tabel
Gebruik dynamische tabellen om het aantal waarden (rijen) van variabelen voor een bepaalde set velden (kolommen) te extraheren:
Voeg een nieuw typelabel 'Tabel' toe, selecteer Het type Dynamische tabel en geef uw label een naam.
Voeg het aantal kolommen (velden) en rijen (voor gegevens) toe dat u nodig hebt.
Selecteer de tekst op de pagina en kies vervolgens de cel die u aan de tekst wilt toewijzen. Herhaal dit voor alle rijen en kolommen in alle pagina's in alle documenten.
Labelen als vaste tabel
Gebruik vaste tabellen om een specifieke verzameling waarden voor een bepaalde set velden (kolommen en/of rijen) te extraheren:
Maak een nieuw typelabel 'Tabel', selecteer 'Vast tabeltype' en noem het.
Voeg het aantal kolommen en rijen toe dat u nodig hebt voor de twee sets velden.
Selecteer de tekst op de pagina en kies vervolgens de cel om deze toe te wijzen aan de tekst. Herhaal dit voor andere documenten.
Labelen voor handtekeningdetectie
Labelen voor handtekeningdetectie:
Maak in de labelweergave een nieuw typelabel 'Handtekening' en noem het label.
Gebruik de opdracht Regio om een rechthoekige regio te maken op de verwachte locatie van de handtekening.
Selecteer de getekende regio en kies het label Handtekeningtype om het toe te wijzen aan uw getekende regio. Herhaal dit voor andere documenten.
Volgende stappen
- Volg onze Form Recognizer v3.0-migratiehandleiding voor meer informatie over de verschillen met de vorige versie van de REST API.
- Bekijk onze preview-SDK-quickstarts om de preview-functies in uw toepassingen te proberen met behulp van de nieuwe SDK's.
- Raadpleeg onze preview-REST API om de preview-functies uit te proberen met behulp van de nieuwe RESt-API.