Share via


Aan de slag: Document Intelligence Studio

Deze inhoud is van toepassing op:Vinkjev4.0 (preview) | Vorige versies:blauw-vinkjev3.1 (GA)blauw-vinkjev3.0 (GA)

Document Intelligence Studio is een onlinehulpprogramma voor het visueel verkennen, begrijpen en integreren van functies van de Document Intelligence-service in uw toepassingen. U kunt aan de slag door de vooraf getrainde modellen te verkennen met voorbeeld of uw eigen documenten. U kunt ook projecten maken om aangepaste sjabloonmodellen te maken en te verwijzen naar de modellen in uw toepassingen met behulp van de Python SDK en andere quickstarts.

Vereisten voor nieuwe gebruikers

Tip

Maak een Azure AI-servicesresource als u van plan bent om toegang te krijgen tot meerdere Azure AI-services onder één eindpunt/sleutel. Voor alleen toegang tot Document Intelligence maakt u een Document Intelligence-resource. Houd er rekening mee dat u een resource met één service nodig hebt als u Microsoft Entra-verificatie wilt gebruiken.

Azure-roltoewijzingen

Voor documentanalyse en vooraf samengestelde modellen zijn de volgende roltoewijzingen vereist voor verschillende scenario's.

  • Basic
    • Cognitive Services-gebruiker: u hebt deze rol nodig voor de Resource Document Intelligence of Azure AI-services om de analysepagina in te voeren.
  • Geavanceerde
    • Inzender: u hebt deze rol nodig om resourcegroep, Document Intelligence-service of Azure AI-servicesresource te maken.

ZieDocument Intelligence Studio-autorisatiebeleidsregels voor meer informatie over autorisatie.

Modellen

Met vooraf samengestelde modellen kunt u Document Intelligence-functies toevoegen aan uw apps zonder uw eigen modellen te hoeven bouwen, trainen en publiceren. U kunt kiezen uit verschillende vooraf gedefinieerde modellen, die elk een eigen set ondersteunde gegevensvelden hebben. De keuze van het model dat moet worden gebruikt voor de analysebewerking, is afhankelijk van het type document dat moet worden geanalyseerd. Document Intelligence ondersteunt momenteel de volgende vooraf gedefinieerde modellen:

Documentanalyse

  • Indeling: tekst, tabellen, selectiemarkeringen en structuurinformatie extraheren uit documenten (PDF, TIFF) en afbeeldingen (JPG, PNG, BMP).
  • Lezen: tekstregels, woorden, hun locaties, gedetecteerde talen en handgeschreven stijl extraheren als deze zijn gedetecteerd uit documenten (PDF, TIFF) en afbeeldingen (JPG, PNG, BMP).

Vooraf gebouwd

  • Factuur: tekst, selectiemarkeringen, tabellen, sleutel-waardeparen en sleutelgegevens extraheren uit facturen.
  • Ontvangstbewijs: tekst en belangrijke informatie extraheren uit ontvangstbevestigingen.
  • Zorgverzekeringskaart: verzekeraar, lid, recept, groepsnummer en andere belangrijke informatie uit amerikaanse gezondheidsverzekeringskaarten extraheren.
  • W-2: tekst en belangrijke informatie extraheren uit W-2 belastingformulieren.
  • Id-document: tekst en belangrijke informatie extraheren uit rijbewijs en internationale paspoorten.

Aanpassen

  • Aangepaste extractiemodellen: gegevens extraheren uit formulieren en documenten met aangepaste extractiemodellen. Train snel een model door slechts vijf voorbeelddocumenten te labelen.
  • Aangepast classificatiemodel: train een aangepaste classificatie om onderscheid te maken tussen de verschillende documenttypen in uw toepassingen. Train snel een model met slechts twee klassen en vijf voorbeelden per klasse.

Nadat u de vereisten hebt voltooid, gaat u naar Document Intelligence Studio.

  1. Selecteer een Document Intelligence-servicefunctie op de startpagina van Studio.

  2. Deze stap is een eenmalig proces, tenzij u de serviceresource al eerder hebt geselecteerd. Selecteer uw Azure-abonnement, resourcegroep en resource. (U kunt de resources op elk gewenst moment wijzigen in 'Instellingen' in het bovenste menu.) Controleer en bevestig uw selecties.

  3. Selecteer de knop Analyseren om analyse uit te voeren op het voorbeelddocument of probeer uw document met behulp van de opdracht Toevoegen.

  4. Gebruik de besturingselementen onder aan het scherm om in en uit te zoomen en de documentweergave te draaien.

  5. Bekijk de gemarkeerde geëxtraheerde inhoud in de documentweergave. Beweeg de muisaanwijzer over de toetsen en waarden om details weer te geven.

  6. Blader in het tabblad Resultaat van de uitvoersectie door de JSON-uitvoer om inzicht te verkrijgen in de indeling van de servicereactie.

  7. Blader op het tabblad Code door de voorbeeldcode voor integratie. Kopieer en download om aan de slag te gaan.

Vereisten toegevoegd voor aangepaste projecten

Naast het Azure-account en een Document Intelligence- of Azure AI-servicesresource hebt u het volgende nodig:

Azure Blob Storage-container

Een Azure Blob Storage-account met standaardprestaties. U maakt containers voor het opslaan en organiseren van uw trainingsdocumenten in uw opslagaccount. Als u niet weet hoe u een Azure-opslagaccount maakt met een container, volgt u deze quickstarts:

  • Een opslagaccount maken. Zorg ervoor dat u bij het maken van uw opslagaccount Standard-prestaties selecteert in het veld Exemplaardetails → Prestatieveld.
  • Maak een container. Wanneer u uw container maakt, stelt u het veld Openbaar toegangsniveau in op Container (anonieme leestoegang voor containers en blobs) in het venster Nieuwe container .

Azure-roltoewijzingen

Voor aangepaste projecten zijn de volgende roltoewijzingen vereist voor verschillende scenario's.

  • Basic
    • Cognitive Services-gebruiker: u hebt deze rol nodig voor documentinformatie of Azure AI-servicesresource om het aangepaste model te trainen of analyses uit te voeren met getrainde modellen.
    • Inzender voor opslagblobgegevens: u hebt deze rol nodig voor het opslagaccount om een project en labelgegevens te maken.
  • Geavanceerde
    • Inzender voor opslagaccounts: u hebt deze rol nodig voor het opslagaccount om CORS-instellingen in te stellen (dit is een eenmalige inspanning als hetzelfde opslagaccount opnieuw wordt gebruikt).
    • Inzender: u hebt deze rol nodig om een resourcegroep en resources te maken.

CORS configureren

CORS (Cross Origin Resource Sharing) moet worden geconfigureerd in uw Azure-opslagaccount, zodat deze toegankelijk is vanuit Document Intelligence Studio. Als u CORS wilt configureren in Azure Portal, hebt u toegang nodig tot het CORS-tabblad van uw opslagaccount.

  1. Selecteer het CORS-tabblad voor het opslagaccount.

    Schermopname van het CORS-instellingsmenu in Azure Portal.

  2. Begin met het maken van een nieuwe CORS-vermelding in de Blob-service.

  3. Stel de toegestane oorsprongen in op https://documentintelligence.ai.azure.com.

    Schermopname van CORS-configuratie voor een opslagaccount.

    Tip

    U kunt het jokerteken '*' gebruiken in plaats van een opgegeven domein om alle oorspronkelijke domeinen toe te staan aanvragen te doen via CORS.

  4. Selecteer alle beschikbare 8 opties voor toegestane methoden.

  5. Alle toegestane headers en weergegeven headers goedkeuren door een * in elk veld in te voeren.

  6. Stel de maximale leeftijd in op 120 seconden of een acceptabele waarde.

  7. Selecteer de knop Opslaan boven aan de pagina om de wijzigingen op te slaan.

CORS moet nu worden geconfigureerd voor het gebruik van het opslagaccount van Document Intelligence Studio.

Set voorbeelddocumenten

  1. Meld u aan bij Azure Portal en navigeer naar Opslagcontainers voor uw opslagaccount>>.

    Schermopname van het menu Gegevensopslag in Azure Portal.

  2. Selecteer een container in de lijst.

  3. Selecteer Uploaden in het menu bovenaan de pagina.

    Schermopname van de knop Container uploaden in Azure Portal.

  4. Het venster Blob uploaden wordt weergegeven.

  5. Selecteer uw bestand(en) dat u wilt uploaden.

    Schermopname van het venster Blob uploaden in Azure Portal.

Notitie

Standaard gebruikt Studio documenten die zich in de hoofdmap van uw container bevinden. U kunt echter gegevens in mappen gebruiken door het mappad op te geven in de stappen voor het maken van een aangepast formulierproject. ZieUw gegevens ordenen in submappen

Aangepaste modellen

Als u aangepaste modellen wilt maken, begint u met het configureren van uw project:

  1. Selecteer in de startpagina van Studio de kaart Aangepast model om de pagina Aangepaste modellen te openen.

  2. Gebruik de opdracht Een project maken om de wizard nieuwe projectconfiguratie te starten.

  3. Voer projectgegevens in, selecteer het Azure-abonnement en de resource en de Azure Blob Storage-container die uw gegevens bevat.

  4. Controleer en verzend uw instellingen om het project te maken.

  5. Als u snel aan de slag wilt met het labelproces, gebruikt u de functie voor automatisch labelen om te labelen met behulp van al getraind model of een van onze vooraf samengestelde modellen.

  6. Definieer de labels en de typen die u wilt extraheren voor handmatige labels.

  7. Selecteer de tekst in het document en selecteer het label in de vervolgkeuzelijst of het deelvenster Labels.

  8. Geef nog vier documenten een label om ten minste vijf documenten te labelen.

  9. Selecteer de opdracht Trainen en voer de modelnaam in, selecteer of u het neurale (aanbevolen) of sjabloonmodel wilt laten beginnen met het trainen van uw aangepaste model.

  10. Zodra het model klaar is, gebruikt u de opdracht Testen om het te valideren met uw testdocumenten en bekijkt u de resultaten.

Demo van aangepast document intelligence-model

Labelen als tabellen

Notitie

  1. Gebruik de opdracht Verwijderen om modellen te verwijderen die niet vereist zijn.

  2. Download modeldetails voor offlineweergave.

  3. Selecteer meerdere modellen en stel deze samen in een nieuw model dat in uw toepassingen moet worden gebruikt.

Tabellen gebruiken als het visuele patroon:

Voor aangepaste formuliermodellen moet u tijdens het maken van uw aangepaste modellen mogelijk gegevensverzamelingen uit uw documenten extraheren. Gegevensverzamelingen kunnen in een aantal indelingen worden weergegeven. Tabellen gebruiken als het visuele patroon:

  • Dynamisch of variabel aantal waarden (rijen) voor een bepaalde set velden (kolommen)

  • Specifieke verzameling waarden voor een bepaalde set velden (kolommen en/of rijen)

Labelen als dynamische tabel

Gebruik dynamische tabellen om het aantal waarden (rijen) voor een bepaalde set velden (kolommen) te extraheren:

  1. Voeg een nieuw label voor het type Tabel toe, selecteer Dynamisch tabeltype en geef uw label een naam.

  2. Voeg het aantal kolommen (velden) en rijen (voor gegevens) toe dat u nodig hebt.

  3. Selecteer de tekst op de pagina en kies vervolgens de cel die u wilt toewijzen aan de tekst. Herhaal dit voor alle rijen en kolommen op alle pagina's in alle documenten.

Document Intelligence-labeling als dynamisch tabelvoorbeeld

Label als vaste tabel

Gebruik vaste tabellen om een specifieke verzameling waarden te extraheren voor een bepaalde set velden (kolommen en/of rijen):

  1. Maak een nieuw label voor het type Tabel, selecteer Vast tabeltype en geef het een naam.

  2. Voeg het aantal kolommen en rijen toe dat u nodig hebt voor de twee sets velden.

  3. Selecteer de tekst op de pagina en kies vervolgens de cel om deze toe te wijzen aan de tekst. Herhaal dit voor andere documenten.

Document Intelligence Labeling als voorbeeld van een vaste tabel

Handtekeningdetectie

Notitie

Handtekeningvelden worden momenteel alleen ondersteund voor aangepaste sjabloonmodellen. Bij het trainen van een aangepast neuraal model worden gelabelde handtekeningvelden genegeerd.

Labelen voor handtekeningdetectie: (alleen aangepast formulier)

  1. Maak in de labelweergave een nieuw 'Handtekening'-typelabel en geef het een naam.

  2. Gebruik de opdracht Regio om een rechthoekige regio te maken op de verwachte locatie van de handtekening.

  3. Selecteer het getekende gebied en kies het label Handtekeningtype om het toe te wijzen aan uw getekende regio. Herhaal dit voor andere documenten.

Voorbeeld van documentinformatielabels voor handtekeningdetectie

Volgende stappen

  • Volg onze migratiehandleiding voor Document Intelligence v3.1 voor meer informatie over de verschillen in de vorige versie van de REST API.
  • Bekijk onze quickstarts voor v3.0 SDK om de v3.0-functies in uw toepassingen uit te proberen met behulp van de nieuwe SDK's.
  • Raadpleeg onze quickstarts voor v3.0 REST API om de v3.0-functies uit te proberen met behulp van de nieuwe REST API.

Ga aan de slag met Document Intelligence Studio.