Modèle de carte de visite Intelligence Documentaire

Article
11/21/2023

Important

À partir de Document Intelligence v4.0 (préversion)et à l’avenir, le modèle de carte de visite (prebuilt-businessCard) est déconseillé. Pour extraire des données à partir de formats de carte de visite, utilisez les éléments suivants :

Fonction	version	ID de modèle
Modèle de carte de visite	• v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA)	`prebuilt-businessCard`

Ce contenu s’applique à :v3.1 (GA) | Versions précédentes :v3.0v2.1

Ce contenu s’applique à :v3.0 (GA) | Dernières versions :v4.0 (préversion)v3.1 | Version précédente :v2.1

Ce contenu s’applique à :v2.1 | Dernière version :v4.0 (préversion)

Le modèle de carte de visite Intelligence documentaire combine de puissantes capacités de reconnaissance optique de caractères (OCR) à des modèles d’apprentissage automatique pour analyser et extraire des données à partir des images d’une carte de visite. L’API analyse les cartes de visite imprimées, extrait les informations clés telles que le prénom, le nom, le nom de l’entreprise, l’adresse e-mail et le numéro de téléphone, puis retourne une représentation structurée des données au format JSON.

Extraction de données de carte de visite

Les cartes de visite sont un excellent moyen de présenter une entreprise ou un professionnel. Le logo de l’entreprise, les polices et les images de fond utilisés sur les cartes de visite aident à promouvoir la marque de l’entreprise et à la démarquer des autres. L’application de techniques basées sur l’OCR et le machine learning pour automatiser l’analyse des cartes de visite est un scénario courant de traitement d’image. Les systèmes d’entreprise utilisés par les équipes de vente et de marketing intègrent généralement une fonctionnalité d’extraction des données de carte de visite qui est bénéfique pour leurs utilisateurs.

Exemple d’une carte de visite traitée avec le Studio Intelligence documentaire

Exemple d’une carte de visite traitée avec l’outil d’Étiquetage des exemples d’Intelligence documentaire

Capture d’écran d’un exemple de carte de visite analysée avec l’outil d’étiquetage des exemples Intelligence documentaire.

Options de développement

Document Intelligence v3.1 :2023-07-31 (GA) prend en charge les outils, applications et bibliothèques suivants :

Fonction	Ressources	ID de modèle
Modèle de carte de visite	• Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-businessCard

Document Intelligence v3.0 :2022-08-31 (GA) prend en charge les outils, applications et bibliothèques suivants :

Fonction	Ressources	ID de modèle
Modèle de carte de visite	• Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-businessCard

Document Intelligence v2.1 (GA) prend en charge les outils, applications et bibliothèques suivants :

Fonction	Ressources
Modèle de carte de visite	• Outil d’étiquetage Document Intelligence • API REST • Kit SDK Bibliothèque de client • Conteneur Docker d’Intelligence documentaire

Essayer l’extraction de données de carte de visite

Découvrez de quelle manière les données, dont le nom, le poste, l’adresse, l’e-mail et le nom de la société, sont extraites des cartes de visite. Vous avez besoin des ressources suivantes :

Un abonnement Azure : vous pouvez en créer un gratuitement
Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.

Capture d’écran de l’emplacement des clés et des points de terminaison dans le Portail Azure.

Document Intelligence Studio

Remarque

Le Studio d’Intelligence documentaire est disponible avec les API v3.1 et v3.0.

Dans la page d’accueil du Studio d’Intelligence documentaire, sélectionnez Cartes de visite.
Vous pouvez analyser l’exemple de carte de visite ou charger vos propres fichiers.
Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :

Essayer le Studio d’Intelligence documentaire

Outil d’étiquetage d’exemples d’Intelligence documentaire

Accédez à l’outil d’exemples Document Intelligence.
Dans la page d’accueil de l’outil d’étiquetage d’échantillon, sélectionnez la vignette Utiliser un modèle prédéfini pour obtenir des données.
Sélectionnez le Type de formulaire à analyser dans le menu déroulant.
Choisissez un URL pour le fichier que vous souhaitez analyser à partir des options ci-dessous :
Dans le champ Source, sélectionnez URL dans le menu déroulant, collez l’URL sélectionnée, puis sélectionnez le bouton Récupérer.
Dans le champ Point de terminaison du service Document Intelligence, collez le point de terminaison que vous avez obtenu avec votre abonnement Document Intelligence.
Dans le champ Clé, collez la clé que vous avez obtenue de votre ressource Document Intelligence.
Cliquez sur Exécuter l’analyse. L’outil d’étiquetage des exemples d’Intelligence Documentaire appelle l’API Analyze Prebuilt et analyse le document.
Afficher les résultats : consultez les paires clé/valeur extraites, les éléments de ligne, le texte mis en évidence extrait et les tableaux détectés.

Notes

L’outil d’étiquetage des exemples ne prend pas en charge le format de fichier BMP. Il s’agit d’une limite de l’outil et non du service d’Intelligence documentaire.

Critères des entrées

Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.

Formats de fichiers pris en charge :

Modèle	PDF	Image : JPEG/JPG, PNG, BMP, TIFF, HEIF	Microsoft Office : Word (DOCX), Excel (XLSX), PowerPoint (PPTX) et HTML
Lire	✔	✔	✔
Layout	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview)
Document général	✔	✔
Prédéfinie	✔	✔
Extraction personnalisée	✔	✔
Classification personnalisée	✔	✔	✔ (2024-02-29-preview)

Pour PDF et TIFF, il est possible de traiter jusqu’à 2 000 pages (avec un abonnement gratuit, seules les deux premières pages sont traitées).
La taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
Les dimensions des images doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.
La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce (PPP).
Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.
- Pour l’entraînement du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle et 1G-Mo pour le modèle neural.
- Pour l’entraînement du modèle de classification personnalisée, la taille totale des données de formation est 1GB, avec un maximum à 10 000 pages.

Formats de fichiers pris en charge : JPEG, PNG, PDF et TIFF
PDF et TIFF : jusqu’à 2 000 pages sont traitées. Abonnés du niveau Gratuit : seules les deux premières pages sont traitées.
La taille de fichier doit être inférieure à 50 Mo, et les dimensions comprises entre 50 × 50 pixels et 10 000 × 10 000 pixels.

Langues et régions prises en charge

Consultez notre page prise en charge des langages pour obtenir la liste complète des langages prises en charge.

Extractions de champs

Nom	Type	Description	Sortie standardisée
ContactNames	Tableau d’objets	Nom du contact
FirstName	String	Prénom du contact
LastName	String	Nom du contact
CompanyNames	Tableau de chaînes	Nom(s) de la société
Departments	Tableau de chaînes	Service(s) ou organisation(s) de contact
JobTitles	Tableau de chaînes	Poste(s) indiqué(s) du contact
E-mails	Tableau de chaînes	Adresse(s) e-mail du contact
Sites web	Tableau de chaînes	Site(s) web de la société
Adresses	Tableau de chaînes	Adresse(s) extraite(s) de la carte de visite
MobilePhones	Tableau des numéros de téléphone	Numéro(s) de téléphone mobile sur la carte de visite	+1 xxx xxx xxxx
Télécopies	Tableau des numéros de téléphone	Numéro(s) de fax sur la carte de visite	+1 xxx xxx xxxx
WorkPhones	Tableau des numéros de téléphone	Numéro(s) de téléphone du bureau sur la carte de visite	+1 xxx xxx xxxx
OtherPhones	Tableau des numéros de téléphone	Autre(s) numéro(s) de téléphone sur la carte de visite	+1 xxx xxx xxxx

Champs extraits

Nom	Type	Description	Texte
ContactNames	tableau d’objets	Nom de contact extrait de la carte de visite	[{ "FirstName": "John"`,` "LastName": "Doe" }]
FirstName	string	Prénom du contact	"John"
LastName	string	Nom du contact	"Doe"
CompanyNames	tableau de chaînes	Nom de société extrait de la carte de visite	["Contoso"]
Departments	tableau de chaînes	Service ou organisation de contact	["R&D"]
JobTitles	tableau de chaînes	Poste indiqué du contact	["Software Engineer"]
E-mails	tableau de chaînes	E-mail de contact extrait de la carte de visite	["johndoe@contoso.com"]
Sites web	tableau de chaînes	Site web extrait de la carte de visite	["https://www.contoso.com"]
Adresses	tableau de chaînes	Adresse extraite de la carte de visite	["123 Main Street, Redmond, WA 98052"]
MobilePhones	tableau de numéros de téléphone	Numéro de téléphone mobile extrait de la carte de visite	["+19876543210"]
Télécopies	tableau de numéros de téléphone	Numéro de télécopie extrait de la carte de visite	["+19876543211"]
WorkPhones	tableau de numéros de téléphone	Numéro de téléphone professionnel extrait de la carte de visite	["+19876543231"]
OtherPhones	tableau de numéros de téléphone	Autre numéro de téléphone extrait de la carte de visite	["+19876543233"]

Paramètres régionaux pris en charge

Prebuilt business cards v2.1 prend en charge les paramètres régionaux suivants :

fr-FR
en-au
en-ca
en-gb
en-in

Guide de migration et API REST v 3.1

Suivez notre Guide de migration Intelligence documentaire v3.1 pour découvrir comment utiliser la version 3.0 dans vos applications et workflows.

Étapes suivantes

Traitez vos propres formulaires et documents avec Studio Intelligence Documentaire.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.

Traitez vos propres formulaires et documents avec l’outil d’étiquetage des exemples Intelligence Documentaire.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.