Document Intelligence-visitekaartjesmodel

Belangrijk

Vanaf Document Intelligence v4.0 (preview) en in de toekomst wordt het visitekaartjesmodel (vooraf gedefinieerde businessCard) afgeschaft. Als u gegevens wilt extraheren uit visitekaartjes, gebruikt u het volgende:

Functie version Model-id
Visitekaartjesmodel • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

Deze inhoud is van toepassing op:Vinkjev3.1 (GA) | Vorige versies:blauw-vinkjev3.0blauw-vinkjev2.1

Deze inhoud is van toepassing op:Vinkjev3.0 (GA) | Nieuwste versies:paars vinkjev4.0 (preview)paars vinkjev3.1 | Vorige versie:blauw-vinkjev2.1

Deze inhoud is van toepassing op:Vinkjev2.1 | Nieuwste versie:blauw-vinkjev4.0 (preview)

Het Document Intelligence-visitekaartjesmodel combineert krachtige OCR-mogelijkheden (Optical Character Recognition) met deep learning-modellen voor het analyseren en extraheren van gegevens uit visitekaartjesafbeeldingen. De API analyseert afgedrukte visitekaartjes; extraheert belangrijke informatie, zoals voornaam, achternaam, bedrijfsnaam, e-mailadres en telefoonnummer; en retourneert een gestructureerde JSON-gegevensweergave.

Gegevensextractie van visitekaartjes

Visitekaartjes zijn een uitstekende manier om een bedrijf of een professional te vertegenwoordigen. Het bedrijfslogo, lettertypen en achtergrondafbeeldingen in visitekaartjes helpen de huisstijl van het bedrijf te promoten en te onderscheiden van anderen. Het toepassen van OCR- en machine learning-technieken om het scannen van visitekaartjes te automatiseren, is een veelvoorkomend scenario voor het verwerken van afbeeldingen. Bedrijfssystemen die door verkoop- en marketingteams worden gebruikt, hebben doorgaans mogelijkheden voor het extraheren van visitekaartjesgegevens in ten behoeve van hun gebruikers.

Voorbeeld van visitekaartje verwerkt met Document Intelligence Studio

Schermopname van een voorbeeld van een visitekaartje dat is geanalyseerd in Document Intelligence Studio.

Voorbeeld van bedrijf dat is verwerkt met het hulpprogramma Document Intelligence-voorbeeldlabels

Schermopname van een voorbeeld van een visitekaartje dat is geanalyseerd met het hulpprogramma Document Intelligence-voorbeeldlabels.

Ontwikkelingsopties

Document Intelligence v3.1:2023-07-31 (GA) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Visitekaartjesmodel Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
vooraf samengestelde businessCard

Document Intelligence v3.0:2022-08-31 (GA) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Visitekaartjesmodel Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
vooraf samengestelde businessCard

Document Intelligence v2.1 (GA) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources
Visitekaartjesmodel Hulpprogramma voor documentinformatielabels
REST API
Clientbibliotheek-SDK
Document Intelligence Docker-container

Visitekaartjesgegevensextractie proberen

Bekijk hoe gegevens, waaronder naam, functie, adres, e-mailadres en bedrijfsnaam, worden geëxtraheerd uit visitekaartjes. U hebt de volgende resources nodig:

  • Een Azure-abonnement: u kunt er gratis een maken

  • Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.

Schermopname van sleutels en eindpuntlocatie in Azure Portal.

Document Intelligence Studio

Notitie

Document Intelligence Studio is beschikbaar met v3.1- en v3.0-API's.

  1. Selecteer Visitekaartjes op de startpagina van Document Intelligence Studio.

  2. U kunt het voorbeeld visitekaartje analyseren of uw eigen bestanden uploaden.

  3. Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties Analyseren:

    Schermopname van de knoppen Analyse uitvoeren en Opties analyseren in Document Intelligence Studio.

Document Intelligence-voorbeeldhulpprogramma voor labelen

  1. Navigeer naar het voorbeeldprogramma documentinformatie.

  2. Selecteer op de startpagina van het voorbeeldhulpprogramma het vooraf samengestelde model gebruiken om de gegevenstegel op te halen.

    Schermopname van de analysebewerking van het indelingsmodel.

  3. Selecteer het formuliertype dat u wilt analyseren in de vervolgkeuzelijst.

  4. Kies een URL voor het bestand dat u wilt analyseren uit de onderstaande opties:

  5. Selecteer in het veld Bron de URL in de vervolgkeuzelijst, plak de geselecteerde URL en selecteer de knop Ophalen.

    Schermopname van het vervolgkeuzemenu bronlocatie.

  6. Plak in het veld Eindpunt van de Document Intelligence-service het eindpunt dat u hebt verkregen met uw Document Intelligence-abonnement.

  7. Plak in het sleutelveld de sleutel die u hebt verkregen uit uw Document Intelligence-resource.

    Schermopname van het vervolgkeuzemenu select-form-type.

  8. Selecteer Analyse uitvoeren. Met het hulpprogramma Document Intelligence-voorbeeldlabels wordt de vooraf samengestelde API analyseren aangeroepen en het document geanalyseerd.

  9. Bekijk de resultaten: zie de sleutel-waardeparen die zijn geëxtraheerd, regelitems, gemarkeerde tekst die is geëxtraheerd en tabellen gedetecteerd.

    Schermopname van het visitekaartjesmodel voor het analyseren van de resultatenbewerking.

Notitie

Het hulpprogramma Voorbeeldlabeling biedt geen ondersteuning voor de BMP-bestandsindeling. Dit is een beperking van het hulpprogramma niet van de Document Intelligence-service.

Vereisten voor invoer

  • Geef voor de beste resultaten één duidelijke foto of een hoogwaardige scan per document op.

  • Ondersteunde bestandsindelingen:

    Model PDF Afbeelding:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) en HTML
    Read
    Indeling ✔ (2024-02-29-preview, 2023-10-31-preview)
    Algemeen document
    Vooraf gebouwd
    Aangepaste extractie
    Aangepaste classificatie ✔ (2024-02-29-preview)
  • Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een abonnement op de gratis laag worden alleen de eerste twee pagina's verwerkt).

  • De bestandsgrootte voor het analyseren van documenten is 500 MB voor betaalde (S0) laag en 4 MB gratis (F0).

  • De afmetingen van de afbeelding moeten tussen 50 x 50 pixels en 10.000 pixels x 10.000 pixels zijn.

  • Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.

  • De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met ongeveer 8-punttekst op 150 punten per inch (DPI).

  • Voor aangepaste modeltraining is het maximum aantal pagina's voor trainingsgegevens 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.

    • Voor het trainen van aangepaste extractiemodellen is de totale grootte van trainingsgegevens 50 MB voor het sjabloonmodel en 1G-MB voor het neurale model.

    • Voor het trainen van aangepast classificatiemodel is 1GB de totale grootte van trainingsgegevens maximaal 10.000 pagina's.

  • Ondersteunde bestandsindelingen: JPEG, PNG, PDF en TIFF
  • Voor PDF en TIFF worden maximaal 2000 pagina's verwerkt. Voor abonnees van de gratis laag worden alleen de eerste twee pagina's verwerkt.
  • De bestandsgrootte moet kleiner zijn dan 50 MB en de afmetingen ten minste 50 x 50 pixels en maximaal 10.000 x 10.000 pixels.

Ondersteunde talen en landinstellingen

Zie onze pagina Taalondersteuning voor een volledige lijst met ondersteunde talen.

Veldextracties

Name Type Description Gestandaardiseerde uitvoer
ContactNames Matrix van objecten Naam van contactpersoon
Voornaam String Voornaam (opgegeven) van contactpersoon
Achternaam String Achternaam (familie) van contactpersoon
CompanyNames Matrix tekenreeksen Bedrijfsnaam(en)
Afdelingen Matrix tekenreeksen Afdeling(en) of organisatie(s) van contactpersoon
JobTitles Matrix tekenreeksen Vermelde functie(s) van contactpersoon
E-mails Matrix tekenreeksen E-mailadres(en) van contactpersoon
Websites Matrix tekenreeksen Bedrijfswebsite(s)
Adressen Matrix tekenreeksen Adres(en) geëxtraheerd uit visitekaartje
Mobiel Telefoon s Matrix met telefoonnummers Mobiele telefoonnummer(s) vanaf visitekaartje +1 xxx xxx xxxx
Faxen Matrix met telefoonnummers Faxtelefoonnummer(s) vanaf visitekaartje +1 xxx xxx xxxx
Werk Telefoon s Matrix met telefoonnummers Telefoonnummer(s) werken vanaf visitekaartje +1 xxx xxx xxxx
Andere Telefoon s Matrix met telefoonnummers Andere telefoonnummers van visitekaartje +1 xxx xxx xxxx

Uitgepakte velden

Name Type Beschrijving Tekst
ContactNames matrix van objecten Naam van contactpersoon geëxtraheerd uit visitekaartje [{ "FirstName": "John", "LastName": "Doe" }]
Voornaam tekenreeks Voornaam (opgegeven) van contactpersoon "John"
Achternaam tekenreeks Achternaam (familie) van contactpersoon "Doe"
CompanyNames matrix tekenreeksen Bedrijfsnaam geëxtraheerd uit visitekaartje ["Contoso"]
Afdelingen matrix tekenreeksen Afdeling of organisatie van contactpersoon ["R&D"]
JobTitles matrix tekenreeksen Vermelde functie van contactpersoon ["Software Engineer"]
E-mails matrix tekenreeksen E-mailadres van contactpersoon geëxtraheerd uit visitekaartje [""johndoe@contoso.com]
Websites matrix tekenreeksen Website geëxtraheerd uit visitekaartje ["https://www.contoso.com"]
Adressen matrix tekenreeksen Adres geëxtraheerd uit visitekaartje ["123 Main Street, Redmond, WA 98052"]
Mobiel Telefoon s matrix met telefoonnummers Mobiel telefoonnummer geëxtraheerd uit visitekaartje ["+19876543210"]
Faxen matrix met telefoonnummers Faxtelefoonnummer geëxtraheerd uit visitekaartje ["+19876543211"]
Werk Telefoon s matrix met telefoonnummers Werktelefoonnummer geëxtraheerd uit visitekaartje ["+19876543231"]
Andere Telefoon s matrix met telefoonnummers Ander telefoonnummer geëxtraheerd uit visitekaartje ["+19876543233"]

Ondersteunde landinstellingen

Vooraf gemaakte visitekaartjes v2.1 ondersteunt de volgende landinstellingen:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • en-in

Migratiehandleiding en REST API v3.1

  • Volg onze migratiehandleiding voor Document Intelligence v3.1 voor meer informatie over het gebruik van de versie v3.0 in uw toepassingen en werkstromen.

Volgende stappen

  • Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio

  • Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.