Qu’est-ce qu’Azure AI Intelligence Documentaire ?

Important

  • Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif.
  • Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
  • La version d'aperçu publique des bibliothèques clientes Document Intelligence est par défaut la version 2024-02-29-preview de l'API REST.
  • La version d’évaluation publique 2024-02-29-preview est actuellement disponible uniquement dans les régions Azure suivantes :
  • USA Est
  • USA Ouest 2
  • Europe Ouest

Ce contenu s’applique à :cochev4.0 (préversion) | Versions précédentes :coche-bleuev3.1(GA)coche-bleuev3.0 (GA)coche-bleuev2.1 (GA)

Ce contenu s’applique à :cochev3.1 (GA) | Dernière version :coche violettev4.0 (préversion) | Versions précédentes :coche-bleuev3.0coche-bleuev2.1

Ce contenu s’applique à :cochev3.0 (GA) | Dernières versions :coche violettev4.0 (préversion)coche-violettev3.1 | Version précédente :coche-bleuev2.1

Ce contenu s’applique à :cochev2.1 | Dernière version :Coche bleuev4.0 (préversion)

Remarque

Form Recognizer est désormais Azure AI Intelligence Documentaire !

  • Depuis juillet 2023, les services Azure AI englobent tout ce qui était auparavant connu sous le nom Cognitive Services et Azure Applied AI Services.
  • Il n’y a aucune modification de la tarification.
  • Les noms Cognitive Services et Azure Applied AI continuent d’être utilisés dans la facturation Azure, l’analyse des coûts, la liste de prix et les API de prix.
  • Il n’existe aucun changement cassant des interfaces de programmation d’applications (API) ou des Kits de développement logiciel (SDK) antérieurs et jusqu’à la version v3.1. À partir de v4.0, les API et SDK sont mis à jour dans Intelligence documentaire.
  • Certaines plateformes attendent toujours la mise à jour du changement de nom. Toutes les mention de Form Recognizer ou Intelligence documentaire dans notre documentation font référence au même service Azure.

Azure AI Intelligence Documentaire est un service cloud Azure AI Services, qui permet aux développeurs de créer des solutions intelligentes de traitement de documents. Des quantités massives de données, couvrant une grande variété de types de données, sont stockées dans des formulaires et des documents. Intelligence Documentaire permet de gérer efficacement la vitesse à laquelle les données sont collectées et traitées, ce qui est essentiel pour améliorer les opérations, prendre des décisions fondées sur des données et innover de manière éclairée.

| ✔️ Modèles d’analyse de documents | ✔️ Modèles prédéfinis | ✔️ Modèles personnalisés |

Modèles d’analyse de documents

Les modèles d'analyse de documents permettent l'extraction de texte à partir de formulaires et de documents et renvoient un contenu structuré prêt à être utilisé par votre organisation.


Lire | Extraire du texte imprimé
et manuscrit


Disposition | Extrayez le texte, les tables
et la structure du document.


Lire | Extraire du texte imprimé
et manuscrit


Disposition | Extrayez le texte, les tables
et la structure du document.


Document général : extrait le texte,
les tableaux, la structure, les paires clé-valeur.

Modèles prédéfinis

Les modèles préconstruits vous permettent d'ajouter un traitement intelligent des documents à vos applications et flux sans avoir à former et construire vos propres modèles.


Facture | Extrayez les détails du client
et du fournisseur.


Reçu | Extraire les détails de la
transaction de vente.


Identité | Extrayez les détails d’identification
et de vérification.


1003 EULA | Extrayez les détails de l’hypothèque.


Formulaire 1008 | Extrayez les détails de l’hypothèque.


Divulgation de fermeture | Extrayez les détails de l’hypothèque.


Carte d’assurance maladie | Extraire les détails de
l’assurance maladie.


Contrat | Extrayez les détails des contrats
et des parties.


Carte de crédit/débit | Extrayez les informations à partir de cartes bancaires.


Acte de mariage | Extrayez les informations à partir des actes de mariage.


Formulaire US Tax W-2 | Extraire les détails
de la rémunération imposable.


Formulaire US Tax 1098 | Extrayez les détails des intérêts hypothécaires.


Formulaire US Tax 1098-E | Extraire les détails des intérêts du prêt étudiant.


Formulaire US Tax 1098-T | Extrayez les détails des frais de scolarité qualifiés.


Formulaire de taxe américaine 1099 | Extraire des informations à partir des variantes du formulaire 1099.


Formulaire fiscal américain 1040 | Extrayez les informations à partir des variantes du formulaire 1040.


Facture | Extrayez les détails du client
et du fournisseur.


Reçu | Extraire les détails de la
transaction de vente.


Identité | Extrayez les détails d’identification
et de vérification.


Carte d’assurance maladie | Extraire les détails de l’assurance maladie.


Carte de visite | Extrayez les informations de contact professionnelles.


Contrat | Extrayez les détails des contrats
et des parties.


Formulaire US Tax W-2 | Extraire les détails
de la rémunération imposable.


Formulaire US Tax 1098 | Extrayez les détails des intérêts hypothécaires.


Formulaire US Tax 1098-E | Extraire les détails des intérêts du prêt étudiant.


Formulaire US Tax 1098-T | Extrayez les détails des frais de scolarité qualifiés.

Modèles personnalisés

  • Des modèles personnalisés sont formés à l'aide de vos ensembles de données étiquetés pour extraire des données distinctes à partir de formulaires et de documents, en fonction de vos cas d'utilisation.
  • Ces modèles personnalisés autonomes peuvent être combinés pour créer des modèles composés.
  • Modèles d’extraction
    ✔️ Les modèles d’extraction personnalisés sont entraînés pour extraire des champs étiquetés à partir de documents.


Modèle personnalisé | Extrayez des données à partir de dispositions statiques.


Neuronal personnalisé | Extrayez des données à partir de documents de type mixte.


Composition personnalisée | Extrayez des données à l’aide d’une collection de modèles.

  • Modèle de classification
    ✔️ Les classifieurs personnalisés identifient les types de documents avant d’appeler un modèle d’extraction.


Classifieur personnalisé | Identifier les types de documents (classes) désignés
avant d’appeler un modèle d’extraction.

Fonctionnalités du module complémentaire

Document Intelligence prend en charge des fonctionnalités facultatives qui peuvent être activées et désactivées en fonction du scénario d’extraction de document. Les fonctionnalités de module complémentaire suivantes sont disponibles pour 2023-07-31 (GA) et les versions ultérieures :

Document Intelligence prend en charge des fonctionnalités facultatives qui peuvent être activées et désactivées en fonction du scénario d’extraction de document. Les fonctionnalités suivantes du module complémentaire sont disponibles pour 2024-02-29-preview, 2023-10-31-preview et les versions ultérieures :

Fonctionnalités d’analyse

ID de modèle Extraction de contenu Champs de requête Paragraphes Rôles de paragraphe Marques de sélection Tables Paires clé-valeur Langages Codes-barres Analyse de documents Formules* Police de style* Haute résolution*
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
prebuilt-contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
Facture prédéfinie O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(variations) O O O O O
prebuilt-tax.us.1040(variations) O O O O O
{ customModelName } O O O O O

✓ - Activé
O - Facultatif
* - Les fonctionnalités Premium entraînent des coûts supplémentaires

Modèles et options de développement

Notes

Les modèles de compréhension de documents et les options de développement ci-après sont pris en charge par le service Intelligence Documentaire v3.0.

Utilisez Intelligence Documentaire pour automatiser le traitement de documents dans les applications et les workflows, afin d’améliorer les stratégies pilotées par les données, puis pour enrichir les fonctionnalités de recherche de documents. Utilisez les liens du tableau pour en savoir plus sur chaque modèle et parcourir les options de développement.

Lire

Capture d’écran de l’analyse du modèle de lecture à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Cas d'utilisation de l'automatisation Options de développement
prebuilt-read ● Extraire du texte à partir de documents.
Extraction de données
● Numériser n’importe quel document.
● Conformité et audit.
● Traitement des notes manuscrites avant la traduction.
● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Python
● SDK Java
● JavaScript

Layout

Capture d’écran de l’analyse du modèle de layout à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Cas d'utilisation de l'automatisation Options de développement
prebuilt-layout ● Extraire des informations de texte et de disposition à partir de documents.
Extraction de données
● Indexation et récupération de documents par structure.
● Analyse de rapports financiers et médicaux.
● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Python
● SDK Java
● JavaScript

Document général (déconseillé dans 2023-10-31-preview)

Capture d’écran de l’analyse du modèle de document général à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Cas d'utilisation de l'automatisation Options de développement
prebuilt-document ● Extraire les informations de texte, disposition et paires clé-valeur des documents.
Extraction de données et de champs
● Extraction de paire clé-valeur.
● Traitement des formulaires.
● Collecte et analyse des données d’enquête.
● Studio Intelligence Documentaire
● API REST

Facture

Capture d’écran de l’analyse du modèle de facturation à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Cas d'utilisation de l'automatisation Options de développement
Facture prédéfinie ● Extraire les informations clés des factures.
Extraction de données et de champs
● Traitement des comptes fournisseurs.
● Enregistrement et rapports fiscaux automatisés.
● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Python
● SDK Java
● JavaScript

Réception

Capture d’écran de l’analyse du modèle de réception à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Cas d'utilisation de l'automatisation Options de développement
prebuilt-receipt ● Extraire les informations clés des reçus.
Extraction de données et de champs
● Le modèle de reçu v3.0 prend en charge le traitement des reçus d'hôtel d'une seule page.
● Gestion des dépenses.
● Analyse des données de comportement des consommateurs.
● Programme de fidélisation de la clientèle.
● Traitement des retours de marchandises.
● Enregistrement et rapports fiscaux automatisés.
● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Python
● SDK Java
● JavaScript

Identité (ID)

Capture d’écran de l’analyse du modèle de document d’identité (ID) à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Cas d'utilisation de l'automatisation Options de développement
prebuilt-idDocument ● Extraire les informations clés des passeports et des cartes d'identité.
Types de documents
● Extraire les mentions, les restrictions et les classifications de véhicules des permis de conduire américains.
● Conformité aux directives des services financiers KYC (Know Your Customer).
● Gestion des comptes médicaux.
● Points de contrôle et passerelles d’identité.
● Inscription à un hôtel.
● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Python
● SDK Java
● JavaScript

Carte d’assurance maladie

Capture d’écran de l’analyse du modèle de carte d’assurance maladie à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Cas d'utilisation de l'automatisation Options de développement
prebuilt-healthInsuranceCard.us ● Extraire les informations clés des cartes d’assurance maladie américaines.
Extraction de données et de champs
● Vérification de la couverture et de l’éligibilité.
● Modélisation prédictive.
● Analytique basée sur les valeurs.
● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Python
● SDK Java
● JavaScript

Modèle de contrat

Capture d’écran de l’extraction d’un modèle de contrat à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Options de développement
prebuilt-contract Extrayez les détails du contrat et de la partie. ● Studio Intelligence Documentaire
● API REST

Modèle fiscal américain W-2

Capture d’écran de l’analyse du modèle W-2 à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Cas d'utilisation de l'automatisation Options de développement
prebuilt-tax.us.W-2 ● Extraire les informations clés des formulaires fiscaux IRS US W2 (année 2018-2021).
Extraction de données et de champs
● Gestion automatisée des documents fiscaux.
● Traitement des demandes de prêt hypothécaire.
● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Python
● SDK Java
● JavaScript

Formulaire fiscal américain 1098

Capture d’écran du formulaire fiscal américain 1098 analysé dans Studio Intelligence Documentaire.

ID de modèle Description Options de développement
prebuilt-tax.us.1098 Extrayez des informations et des détails sur les intérêts hypothécaires. ● Studio Intelligence Documentaire
● API REST

Formulaire fiscal américain 1098-E

Capture d’écran du formulaire fiscal américain 1098-E analysé dans Studio Intelligence Documentaire.

ID de modèle Description Options de développement
prebuilt-tax.us.1098E Extrayez des informations et des détails sur les prêts étudiants. ● Studio Intelligence Documentaire
● API REST

Formulaire fiscal américain 1098-T

Capture d’écran du formulaire fiscal américain 1098-T analysé dans Studio Intelligence Documentaire.

ID de modèle Description Options de développement
prebuilt-tax.us.1098T Extrayez des informations et des détails sur les frais de scolarité. ● Studio Intelligence Documentaire
● API REST

Formulaire de taxe américaine 1099 (et variantes)

Capture d’écran du formulaire fiscal américain 1099 analysé dans Studio Intelligence Documentaire.

ID de modèle Description Options de développement
prebuilt-tax.us.1099(Variations) Extraire des informations à partir des variantes du formulaire 1099. ● Studio Intelligence Documentaire
● API REST

Carte de visite

Capture d’écran de l’analyse du modèle de carte de visite à l’aide de Studio Intelligence Documentaire.

ID de modèle Description Cas d'utilisation de l'automatisation Options de développement
prebuilt-businessCard ● Extraire les informations clés des cartes de visite.
Extraction de données et de champs
● Gestion des prospects et du marketing. ● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Python
● SDK Java
● JavaScript

Aperçu du modèle personnalisé

Capture d’écran de l’entraînement du modèle personnalisé à l’aide de Studio Intelligence Documentaire.

À propos de Description Cas d'utilisation de l'automatisation Options de développement
Modèle personnalisé Extraction d'informations à partir de formulaires et de documents en données structurées sur la base d'un modèle créé à partir d'un ensemble de documents de formation représentatifs. Extrayez des données distinctes à partir de formulaires et de documents spécifiques à votre entreprise et à vos cas d'utilisation. ● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Java
● SDK JavaScript
● SDK Python

Modèle personnalisé

Capture d’écran de l’analyse du modèle de gabarit personnalisé à l’aide de Studio Intelligence Documentaire.

Notes

Pour former un modèle personnalisé, définissez la buildModepropriété sur template. Pour plus d’informations, consultezFormation d’un modèle de modèle

À propos de Description Cas d'utilisation de l'automatisation Options de développement
Modèle personnalisé Le modèle de modèle personnalisé extrait des valeurs et des champs étiquetés à partir de documents structurés et semi-structurés.
Extraire des données clés à partir de documents hautement structurés avec des modèles visuels définis ou des mises en page visuelles communes, des formulaires. ● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Python
● SDK Java
● SDK JavaScript

Modèle neuronal personnalisé

Capture d’écran de l’analyse du modèle neural personnalisé à l’aide de Studio Intelligence Documentaire.

Notes

Pour former un modèle personnalisé, définissez la buildModepropriété sur neural. Pour plus d’informations, consultezFormation d’un modèle de modèle

À propos de Description Cas d'utilisation de l'automatisation Options de développement
Modèle neuronal personnalisé Le modèle neuronal personnalisé est utilisé pour extraire des données étiquetées à partir de documents structurés (enquêtes, questionnaires), semi-structurés (factures, bons de commande) et non structurés (contrats, lettres). Extrayez des données textuelles, des cases à cocher et des champs tabulaires à partir de documents structurés et non structurés. Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Java
● SDK JavaScript
● SDK Python

Composé sur mesure

Capture d’écran de la liste des modèles personnalisés composés de Studio Intelligence Documentaire.

À propos de Description Cas d'utilisation de l'automatisation Options de développement
Modèles personnalisés composés Pour créer un modèle composé, vous associez une collection de modèles personnalisés à un modèle unique créé à partir de vos types de formulaire. Utile lorsque vous formulez plusieurs modèles et que vous souhaitez les regrouper pour analyser des types de formulaires similaires, tels que les bons de commande. ● Studio Intelligence Documentaire
● API REST
● SDK C#
● SDK Java
● SDK JavaScript
● SDK Python

Modèle de classification personnalisé

{alt-text}

À propos de Description Cas d'utilisation de l'automatisation Options de développement
Modèles de classification composés Les modèles de classification personnalisés combinent des caractéristiques de mise en page et de langue pour détecter, identifier et classer les documents dans un fichier d'entrée. ● Un dossier de demande de prêt contenant un formulaire de demande, un bulletin de salaire et un relevé bancaire.
● Une collection de factures numérisées.
● Studio Intelligence Documentaire
● API REST

Azure AI Intelligence Documentaire est un service cloud Azure AI Services, qui permet aux développeurs de créer des solutions intelligentes de traitement de documents. Intelligence Documentaire applique des technologies de reconnaissance optique de caractères (OCR) et de compréhension de documents basées sur le machine learning pour extraire le texte, les tableaux, la structure et les paires clé-valeur des documents. Vous pouvez également étiqueter et entraîner des modèles personnalisés pour automatiser l’extraction de données à partir de documents structurés, semi-structurés et non structurés. Pour en savoir plus sur chaque modèle, consultez les articles sur les concepts :

Type de modèle Nom du modèle
Modèle d’analyse de documents Modèle d’analyse de disposition
Modèles prédéfinis Modèle de facture
Modèle de reçu
Modèle de document d’identité (ID)
Modèle de carte de visite
Modèles personnalisés Modèle
personnalisé● Modèle composé

Ce contenu s’applique à :cochev2.1 | Dernière version :Coche bleuev4.0 (préversion)

Modèles et options de développement d’Intelligence Documentaire

Conseil

  • Pour une expérience améliorée et une qualité de modèle avancée, essayez Studio Intelligence Documentaire v3.0.
  • V3.0 Studio prend en charge n’importe quel modèle entraîné avec des données étiquetées v2.1.
  • Vous pouvez consulter le guide de migration d’API pour obtenir des informations détaillées sur la migration de v2.1 vers v3.0.

Notes

Les modèles et les options de développement ci-après sont pris en charge par le service Intelligence Documentaire v2.1.

Utilisez les liens du tableau pour en savoir plus sur chaque modèle et parcourir les références d’API :

Modèle Description Options de développement
Analyse de disposition Extraction et analyse de texte, de marques de sélection, de tableaux et de coordonnées de cadre englobant à partir de formulaires et de documents. ● Outil d’étiquetage Intelligence Documentaire
● API REST
● SDK Bibliothèque client
● Conteneur Docker Intelligence Documentaire
Modèle personnalisé Extraction et analyse des données des formulaires et documents spécifiques à des données métier et à des cas d’usage distincts. ● Outil d’étiquetage Intelligence Documentaire
● API REST
● Outil d’étiquetage des exemples
● Conteneur Docker Intelligence Documentaire
Modèle de facture Traitement automatisé des données et extraction des informations clés des factures de vente. ● Outil d’étiquetage Intelligence Documentaire
● API REST
● SDK Bibliothèque client
● Conteneur Docker Intelligence Documentaire
Modèle de reçu Traitement automatisé des données et extraction des informations clés des reçus. ● Outil d’étiquetage Intelligence Documentaire
● API REST
● SDK Bibliothèque client
● Conteneur Docker Intelligence Documentaire
Modèle de document d’identité (ID) Traitement automatisé des données et extraction des informations clés des passeports internationaux et des permis de conduire émis aux États-Unis. ● Outil d’étiquetage Intelligence Documentaire
● API REST
● SDK Bibliothèque client
● Conteneur Docker Intelligence Documentaire
Modèle de carte de visite Traitement automatisé des données et extraction d’informations clés à partir de cartes de visite. ● Outil d’étiquetage Intelligence Documentaire
● API REST
● SDK Bibliothèque client
● Conteneur Docker Intelligence Documentaire

Sécurité et confidentialité des données

Comme pour tous les autres services IA, les développeurs qui utilisent le service Intelligence Documentaire doivent connaître la politique de Microsoft relative aux données client. Consultez notre page Données, confidentialité et sécurité avec Intelligence Documentaire.

Étapes suivantes