Modifier

Share via


Modèles de traitement de documents personnalisés sur Azure

Azure AI Document Intelligence
Azure AI services
Azure Logic Apps
Azure Machine Learning Studio
Stockage Azure

Cet article décrit les solutions Azure pour la création, l’entraînement, le déploiement et l’utilisation de modèles de traitement de documents personnalisés. Ces services Azure offrent également des fonctionnalités d’interface utilisateur pour effectuer l’étiquetage ou le balisage destiné au traitement du texte.

Architecture

Architecture diagram showing several alternatives for a custom document processing model build and deployment process.

Téléchargez un fichier Visio de cette architecture.

Dataflow

  1. Les orchestrateurs comme Azure Logic Apps, Azure Data Factory ou Azure Functions ingèrent des messages et des pièces jointes provenant de serveurs de messagerie ainsi que des fichiers provenant de serveurs FTP ou d’applications web.

    • Azure Functions et Logic Apps permettent des charges de travail serverless. Le service que vous choisissez dépend de vos préférences pour les fonctionnalités des services, comme le développement, les connecteurs, la gestion et le contexte d’exécution. Pour plus d’informations, consultez Comparer Azure Functions et Azure Logic Apps.

    • Envisagez d’utiliser Azure Data Factory pour le déplacement de données en bloc.

  2. Les orchestrateurs envoient des données ingérées à Stockage Blob Azure ou Data Lake Storage, en organisant les données entre les magasins de données en fonction de caractéristiques comme les extensions de fichier ou les clients.

  3. Form Recognizer Studio, Language Studio ou Azure Machine Learning studio étiquettent et balisent les données textuelles et génèrent les modèles personnalisés. Vous pouvez utiliser ces trois services indépendamment ou dans différentes combinaisons pour traiter différents cas d’usage.

    • Si le document nécessite l’extraction de paires clé-valeur ou la création d’une table personnalisée à partir d’un format d’image ou d’un fichier PDF, utilisez Form Recognizer Studio pour étiqueter les données et entraîner le modèle personnalisé.

    • Pour la classification de documents basée sur le contenu ou pour l’extraction d’entités spécifiques à un domaine, vous pouvez entraîner une classification de texte personnalisée ou un modèle de reconnaissance d’entité nommée (NER, Named Entity Recognition) dans Language Studio.

    • Azure Machine Learning studio peut également effectuer un étiquetage pour la classification de texte ou l’extraction d’entités avec des frameworks open source comme PyTorch ou TensorFlow.

  4. Pour déployer les modèles personnalisés et les utiliser pour l’inférence :

Components

  • Logic Apps fait partie d’Azure Integration Services. Logic Apps crée des workflows automatisés qui intègrent des applications, des données, des services et des systèmes. Avec des connecteurs managés pour des services comme Stockage Azure et Office 365, vous pouvez déclencher des workflows quand un fichier arrive dans le compte de stockage ou quand un e-mail est reçu.

  • Data Factory est un service d’extraction, de transformation, de chargement (ETL) cloud managé pour l’intégration et la transformation des données. Data Factory peut ajouter des activités de transformation à un pipeline qui incluent l’appel d’un point de terminaison REST ou l’exécution d’un notebook sur les données ingérées.

  • Azure Functions est un service de calcul serverless qui peut héberger des charges de travail pilotées par les événements avec des processus de courte durée.

  • Stockage Blob est la solution de stockage d’objets pour les fichiers bruts dans ce scénario. Stockage Blob prend en charge les bibliothèques pour plusieurs langages, comme .NET, Node.js et Python. Les applications peuvent accéder aux fichiers sur Stockage Blob via HTTP/HTTPS. Stockage Blob a des niveaux d’accès chaud, froid et archive pour prendre en charge l’optimisation des coûts de stockage de grandes quantités de données.

  • Data Lake Storage est un ensemble de fonctionnalités basées sur Stockage Blob Azure pour l’analytique Big Data. Data Lake Storage conserve le rapport coût-efficacité de Stockage Blob, et offre des fonctionnalités comme la sécurité au niveau des fichiers et la sémantique du système de fichiers avec un espace de noms hiérarchique.

  • Form Recognizer, qui fait partie d’Azure Applied AI Services, a des fonctionnalités d’analyse de documents intégrées pour extraire du texte imprimé et manuscrit, des tableaux et des paires clé-valeur. Form Recognizer a des modèles prédéfinis pour extraire des données à partir de factures, de documents, de reçus, de cartes d’identité et de cartes de visite. Form Recognizer peut aussi entraîner et déployer des modèles personnalisés en utilisant un modèle de formulaire personnalisé ou un modèle de document neuronal personnalisé.

    Form Recognizer Studio fournit une interface utilisateur permettant d’explorer les fonctionnalités et les modèles de Form Recognizer ainsi que de créer, étiqueter, entraîner et déployer des modèles personnalisés.

  • Azure Cognitive Service for Language regroupe les services de traitement en langage naturel d’Azure. La suite offre des options prédéfinies et personnalisables. Pour plus d’informations, consultez Fonctionnalités disponibles de Cognitive Service for Language.

    Language Studio fournit une interface utilisateur permettant d’explorer et d’analyser les fonctionnalités d’Azure Cognitive Service for Language. Language Studio fournit également des options pour la création, l’étiquetage, l’entraînement et le déploiement de modèles personnalisés.

  • Azure Machine Learning est une plateforme ouverte permettant de gérer le développement et le déploiement de modèles Machine Learning à grande échelle.

    • Azure Machine Learning studio fournit des options d’étiquetage des données pour les images et le texte.
    • Exportez des données étiquetées sous forme de jeux de données COCO ou Azure Machine Learning. Vous pouvez utiliser les jeux de données pour l’entraînement et le déploiement de modèles dans des notebooks Azure Machine Learning.
    • Déployez des modèles sur AKS en tant que service web pour l’inférence en temps réel à grande échelle, ou en tant que points de terminaison managés pour l’inférence en temps réel et par lots.

Autres solutions

Vous pouvez ajouter d’autres workflows à ce scénario en fonction de cas d’usage spécifiques.

  • Si le document est au format image ou PDF, vous pouvez extraire les données en utilisant Vision par ordinateur Azure, l’API Read de Form Recognizer ou des bibliothèques open source.

  • Vous pouvez produire un résumé de documents et de conversations en utilisant le modèle prédéfini dans Azure Cognitive Service for Language.

  • Utilisez le code de prétraitement pour effectuer des étapes de traitement du texte, comme le nettoyage, la suppression des mots d’arrêt, la lemmatisation, la recherche de radical et le résumé du texte sur les données extraites, selon les exigences de traitement des documents. Vous pouvez exposer le code en tant qu’API REST pour l’automatisation. Effectuez ces étapes manuellement ou automatisez-les en les intégrant au processus d’ingestion de Logic Apps ou d’Azure Functions.

Détails du scénario

Le traitement de documents est un vaste domaine. Il peut être difficile de répondre à tous vos besoins de traitement de documents avec les modèles prédéfinis disponibles dans Azure Form Recognizer et Azure Cognitive Service for Language. Il peut être nécessaire de créer des modèles personnalisés pour automatiser le traitement des documents pour d’autres applications et domaines.

Les principales problématiques de la personnalisation des modèles sont les suivants :

  • L’étiquetage ou le balisage des données texte avec des entités de paire clé-valeur pertinentes afin de classifier du texte pour l’extraction.
  • Le déploiement de modèles de façon sécurisée à grande échelle pour faciliter l’intégration aux applications consommatrices.

Cas d’usage potentiels

Les cas d’usage suivants peuvent tirer parti des modèles personnalisés pour le traitement de documents :

  • Créer des modèles personnalisés de reconnaissance d’entité nommée et de classification de texte basés sur des frameworks open source.
  • Extraire des paires clé-valeur personnalisées des documents pour différents secteurs d’activité verticaux, comme l’assurance et la santé.
  • Étiqueter et extraire des entités dépendant de domaines spécifiques au-delà des modèles de reconnaissance d’entité nommée prédéfinis pour des domaines comme la sécurité ou la finance.
  • Créer des tableaux personnalisées à partir de documents.
  • Extraire des signatures.
  • Étiqueter et classifier des e-mails ou d’autres documents en fonction du contenu.

Considérations

Ces considérations implémentent les piliers d’Azure Well-Architected Framework qui est un ensemble de principes directeurs qui permettent d’améliorer la qualité d’une charge de travail. Pour plus d’informations, consultez Microsoft Azure Well-Architected Framework.

Pour cet exemple de charge de travail, l’implémentation de chaque pilier dépend de la configuration et de l’utilisation optimales de chaque composant des services Azure.

Fiabilité

La fiabilité permet de s’assurer que votre application tient vos engagements auprès de vos clients. Pour plus d’informations, consultez la page Vue d’ensemble du pilier de fiabilité.

Disponibilité

Résilience

Sécurité

La sécurité fournit des garanties contre les attaques délibérées, et contre l’utilisation abusive de vos données et systèmes importants. Pour plus d’informations, consultez Vue d’ensemble du pilier Sécurité.

Optimisation des coûts

L’optimisation des coûts consiste à examiner les moyens de réduire les dépenses inutiles et d’améliorer l’efficacité opérationnelle. Pour plus d’informations, consultez Vue d’ensemble du pilier d’optimisation des coûts.

Le coût total de l’implémentation de cette solution dépend des prix des services que vous choisissez.

Les principaux coûts de cette solution sont les suivants :

Pour plus d’informations sur la tarification de composants spécifiques, consultez les ressources suivantes :

Utilisez la calculatrice de prix Azure pour ajouter vos choix de composants sélectionnés et estimer le coût global de la solution.

Efficacité des performances

L’efficacité des performances est la capacité de votre charge de travail à s’adapter à la demande des utilisateurs de façon efficace. Pour plus d’informations, consultez Vue d’ensemble du pilier d’efficacité des performances.

Extensibilité

Contributeurs

Cet article est géré par Microsoft. Il a été écrit à l’origine par les contributeurs suivants.

Auteur principal :

Pour afficher les profils LinkedIn non publics, connectez-vous à LinkedIn.

Étapes suivantes