Modèle de modèle personnalisé Intelligence documentaire

Article
11/21/2023

Important

Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif.
Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
La version d'aperçu publique des bibliothèques clientes Document Intelligence est par défaut la version 2024-02-29-preview de l'API REST.
La version d’évaluation publique 2024-02-29-preview est actuellement disponible uniquement dans les régions Azure suivantes :
USA Est
USA Ouest 2
Europe Ouest

Ce contenu s’applique à :v4.0 (préversion) | Versions précédentes :v3.1(GA)v3.0 (GA)v2.1 (GA)

Ce contenu s’applique à :v3.1 (GA) | Dernière version :v4.0 (préversion) | Versions précédentes :v3.0v2.1

Ce contenu s’applique à :v3.0 (GA) | Dernières versions :v4.0 (préversion)v3.1 | Version précédente :v2.1

Ce contenu s’applique à :v2.1 | Dernière version :v4.0 (préversion)

Un modèle personnalisé (anciennement formulaire personnalisé) est un modèle de document facile à entraîner qui extrait avec précision des paires clé-valeur, marques de sélection, tables, régions et signatures étiquetées à partir de documents. Les modèles utilisent des indications de disposition pour extraire des valeurs de documents et permettent d’extraire des champs de documents hautement structurés avec des modèles visuels définis.

Les modèles personnalisés partagent le même format et la même stratégie d’étiquetage que les modèles neuronaux personnalisés, avec la prise en charge d’un plus grand nombre de types de champs et de langues.

Fonctionnalités des modèles

Les modèles personnalisés prennent en charge les paires clé-valeur, les marques de sélection, les tables, les champs de signature et certaines régions.

Champs de formulaire	Marques de sélection	Champs tabulaires (tables)	Signature	Zones concernées
Prise en charge	Prise en charge	Prise en charge	Prise en charge	Prise en charge

Champs tabulaires

Avec la version d’API 2022-06-30-préversion et versions ultérieures, les modèles personnalisés ajoutent la prise en charge des champs tabulaires sur plusieurs pages (tables) :

Pour étiqueter une table qui s’étend sur plusieurs pages, étiquetez chaque ligne de la table sur les différentes pages d’une seule table.
En guise de bonne pratique, assurez-vous que votre jeu de données contient quelques exemples des variations attendues. Par exemple, incluez des exemples dans lesquels la table entière se trouve sur une seule page et où les tables s’étendent sur deux pages ou plus si vous prévoyez de voir ces variations dans les documents.

Les champs tabulaires sont également utiles lors de l’extraction d’informations répétées dans un document qui n’est pas reconnu comme une table. Par exemple, une section répétée d’expériences de travail dans un CV peut être étiquetée et extraite en tant que champ tabulaire.

Gestion des variations

Les modèles s’appuient sur un modèle visuel défini et les modifications apportées aux résultats du modèle entraînent une moindre précision. Dans ces cas, fractionnez votre jeu de données d’entraînement pour inclure au moins cinq échantillons de chaque modèle et entraînez un modèle pour chacune des variations. Vous pouvez ensuite composer les modèles en un seul point de terminaison. Pour les modifications subtiles, comme les images et les documents PDF numériques, il est préférable d’inclure au moins cinq exemples de chaque type dans le même jeu de données d’entraînement.

Critères des entrées

Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.

Formats de fichiers pris en charge :

Modèle	PDF	Image : JPEG/JPG, PNG, BMP, TIFF, HEIF	Microsoft Office : Word (DOCX), Excel (XLSX), PowerPoint (PPTX) et HTML
Lire	✔	✔	✔
Layout	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview ou version ultérieure)
Document général	✔	✔
Prédéfinie	✔	✔
Custom	✔	✔

✱ Les fichiers Microsoft Office ne sont actuellement pas pris en charge pour d’autres modèles ou versions.

Pour PDF et TIFF, il est possible de traiter jusqu’à 2 000 pages (avec un abonnement gratuit, seules les deux premières pages sont traitées).
La taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
Les dimensions des images doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.
La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce (PPP).
Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.
Pour l’entraînement du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle et 1G-Mo pour le modèle neural.
Pour l’entraînement du modèle de classification personnalisée, la taille totale des données de formation est 1GB, avec un maximum à 10 000 pages.

Training a model

Les modèles personnalisés sont généralement disponibles avec l’API v4.0. Si vous démarrez un nouveau projet ou disposez d’un jeu de données étiqueté existant, utilisez l’API v3.1 ou v3.0 avec le Studio Intelligence documentaire pour effectuer l’apprentissage d’un modèle de modèle personnalisé.

Modèle	API REST	Kit SDK	Étiquetage et test des modèles
Modèle personnalisé	v3.1 API	Kit de développement logiciel (SDK) Document Intelligence	Document Intelligence Studio

Avec l’API v3.0 et les versions ultérieures, l’opération de build pour effectuer l'apprentissage du modèle prend en charge une nouvelle propriété buildMode. Pour l’entraînement d’un modèle personnalisé, affectez la valeur buildMode à template.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-02-29-preview

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Les modèles personnalisés sont généralement disponibles avec l’API v3.1. Si vous démarrez un nouveau projet ou disposez d’un jeu de données étiqueté existant, utilisez l’API v3.1 ou v3.0 avec le Studio Intelligence documentaire pour effectuer l’apprentissage d’un modèle de modèle personnalisé.

Modèle	API REST	Kit SDK	Étiquetage et test des modèles
Modèle personnalisé	v3.1 API	Kit de développement logiciel (SDK) Document Intelligence	Document Intelligence Studio

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Langues et régions prises en charge

Consultez notre pagemodèles personnalisés - Language Support pour obtenir la liste complète des langages pris en charge.

Les modèles de modèles personnalisés sont généralement disponibles avec l’API v2.1.

Modèle	API REST	Kit SDK	Étiquetage et test des modèles
Modèle personnalisé (modèle)	Intelligence documentaire 2.1	Kit de développement logiciel (SDK) Intelligence documentaire	Exemple d’outil d’étiquetage Intelligence documentaire

Étapes suivantes

Apprenez à créer et à composer des modèles personnalisés :

Générer un modèle personnaliséComposer des modèles personnalisés