Share via


Qu’est-ce que la synthèse ?

Important

Notre région de prévisualisation, Suède Centre, présente nos dernières techniques de réglage fin du LLM, en constante évolution, basées sur des modèles GPT. Nous vous invitons à les essayer avec une ressource Language de la région Suède Centre.

Le résumé de conversation est disponible uniquement à l’aide de :

  • API REST
  • Python
  • C#

Le résumé est l’une des fonctionnalités offertes par Azure AI Language, un ensemble d’algorithmes d’apprentissage automatique et d’IA dans le cloud pour le développement d’applications intelligentes qui impliquent du langage écrit. Utilisez cet article pour en savoir plus sur cette fonctionnalité et son utilisation dans vos applications.

Bien que les services soient étiquetés de synthèse de document et de conversation, le résumé du texte accepte uniquement les blocs de texte brut et la synthèse des conversations acceptent différents artefacts vocaux afin que le modèle en savoir plus. Si vous souhaitez traiter une conversation mais que vous ne vous souciez que du texte, vous pouvez utiliser le résumé de texte pour ce scénario.

Cette documentation contient les types d’articles suivants :

  • Les Démarrages rapides sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
  • Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.

La synthèse de texte utilise des techniques de traitement du langage naturel pour générer un résumé pour les documents. Il existe deux approches d’API prises en charge pour le résumé automatique : extractive et abstractive.

Un résumé extractif extrait des phrases qui représentent collectivement les informations les plus importantes ou pertinentes du contenu d’origine. Un résumé abstractif génère une synthèse avec des phrases concises et cohérentes, ou des mots qui ne sont pas des extraits mot pour mot de phrases du document d’origine. Cette fonctionnalité est conçue pour raccourcir un contenu pouvant être considéré comme trop long à lire.

Fonctionnalités clés pour la synthèse de texte

Il existe deux aspects de la synthèse de texte fourni par cette API :

  • Résumé extractif : produit un résumé en extrayant des phrases saillantes du document.

    • Multiples phrases extraites : ces phrases traduisent collectivement l’idée principale du document. Il s’agit de phrases d’origine extraites du contenu du document d’entrée.
    • Score de classement : Le scorede classement indique la pertinence d’une phrase par rapport à l’idée principale d’un document. La synthèse du texte classe les phrases extraites et vous pouvez déterminer si elles sont retournées dans l’ordre dans lequel elles apparaissent ou en fonction de leur classement.
    • Multiples phrases retournées : déterminez le nombre maximal de phrases à retourner. Par exemple, si vous demandez un résumé en trois phrases, le résumé extractif renvoie les trois phrases qui ont les scores les plus élevés.
    • Informations de position : position de départ et longueur des phrases extraites.
  • Résumé abstractif : génère un résumé n’utilisant pas nécessairement les mêmes mots que ceux du document, mais capture l’idée principale.

    • Textes récapitulatifs : un résumé abstractif retourne une synthèse pour chaque plage d’entrée contextuelle du document. Un document long peut être segmenté de façon à ce que plusieurs groupes de textes résumés puissent être renvoyés avec leur plage d’entrée contextuelle.
    • Plage d’entrée contextuelle : plage dans le document d’entrée qui a été utilisée pour générer le texte récapitulatif.

À titre d’exemple, examinez le paragraphe de texte suivant :

« Chez Microsoft, nous cherchons à faire progresser l’IA au-delà des techniques existantes, en adoptant une approche plus holistique et plus humaine de l’apprentissage et de la compréhension. En tant que directeur de la technologie d’Azure AI services, je collabore avec une équipe de scientifiques et d’ingénieurs exceptionnels pour faire de cette quête en réalité. Dans le cadre de mes fonctions, je bénéficie d’une perspective unique pour observer la relation entre trois attributs de la cognition humaine : le texte monolingue (X), les signaux sensoriels audio ou visuels (Y) et le texte multilingue (Z). La magie se produit à l’intersection de ces trois attributs : c’est ce que nous appelons le code XYZ, comme l’illustre la figure 1, une représentation conjointe permettant de créer une IA plus puissante, capable de mieux parler, entendre, voir et comprendre les humains. Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme : l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues. L’objectif est de disposer de modèles préentraînés capables d’apprendre conjointement des représentations pour prendre en charge un large éventail de tâches d’IA en aval, comme les humains le font aujourd’hui. Au cours des cinq dernières années, nous avons atteint des performances humaines dans des tests d’évaluation portant sur la reconnaissance vocale du langage courant, la traduction automatique, les réponses aux questions du langage courant, la compréhension de la lecture automatique et le sous-titrage d’images. Ces cinq percées nous ont fourni des signaux forts en direction de notre aspiration plus ambitieuse : faire un bond en avant dans les capacités de l’IA, en réalisant un apprentissage multisensoriel et multilingue plus proche de la façon dont les humains apprennent et comprennent. Je pense que le code XYZ conjoint constitue un élément fondamental de cette aspiration, s’il est fondé sur des sources de connaissances externes dans les tâches d’IA en aval.

La requête API de résumé de texte est traitée dès réception de la demande en créant une tâche pour le back-end de l’API. Si la tâche réussit, la sortie de l’API est retournée. La sortie peut être récupérée pendant 24 heures. après quoi elle est vidée. En raison de la prise en charge multilingue et des émojis, la réponse peut contenir des décalages de texte. Pour plus d’informations, consultez le guide pratique pour traiter les décalages.

Si nous utilisons l’exemple ci-dessus, l’API peut renvoyer ces phrases résumées :

Résumé extractif :

  • « Chez Microsoft, nous cherchons à faire progresser l’IA au-delà des techniques existantes, en adoptant une approche plus holistique et plus humaine de l’apprentissage et de la compréhension. »
  • «Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme   l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues.»
  • «L’objectif est de disposer de modèles pré-entraînés capables d’apprendre conjointement des représentations pour prendre en charge un large éventail de tâches d’IA en aval, comme les humains le font aujourd’hui.»

Résumé abstractif :

  • « Microsoft adopte une approche plus holistique et humaine de l’apprentissage et de la compréhension. Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme : l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues. Au cours des cinq dernières années, nous avons atteint des performances humaines dans des tests d’évaluation portant sur la reconnaissance vocale du langage courant. »

Un document natif fait référence au format de fichier utilisé pour créer le document d’origine, comme un fichier Microsoft Word (docx) ou un fichier de document portable (pdf). La prise en charge des documents natifs évite de prétraiter le texte pour pouvoir utiliser les fonctionnalités des ressources Azure AI Language. Actuellement, la prise en charge des documents natifs est disponible pour les deux fonctionnalités AbstractiveSummarization et ExtractiveSummarization.

Actuellement synthèse de texte prend en charge les formats de document natifs suivants :

Type de fichier Extension de fichier Description
Texte .txt Document texte non mis en forme.
Adobe PDF .pdf Document au format de fichier de document portable.
Microsoft Word .docx Fichier de document Microsoft Word.

Pour plus d’informations, consultezUtiliser des documents natifs pour le traitement du langage

Fonctionnalités clés pour la synthèse des conversations

Le résumé de conversation prend en charge les fonctionnalités suivantes :

  • Résumé de problème/résolution : fonctionnalité spécifique de centre d’appels qui fournit un résumé des problèmes et résolutions abordés dans des conversations entre des agents de service clientèle et des clients.
  • Résumé de titre de chapitre : permet de segmenter une conversation en chapitres basés sur les rubriques évoquées dans la conversation et vous suggère des titres de chapitres dans la conversation d’entrée.
  • Récapitulatif : permet de résumer une conversation sous forme de court paragraphe.
  • Résumé narratif : permet de générer des notes d’appel détaillées, des notes de réunion ou des résumés de discussion de la conversation d’entrée.
  • Tâches de suivi : permet d’offrir une liste des tâches de suivi évoquées dans la conversation d’entrée.

Quand utiliser un résumé de problème et résolution

  • Quand il y a des aspects de « problème » et « résolution » de type :
    • Motif d’une conversation ou d’un appel de service (problème)
    • Résolution du problème
  • Le résumé doit se concentrer uniquement sur les informations relatives aux problèmes et aux résolutions.
  • Lorsqu’il y a deux participants à la conversation et que vous voulez résumer ce que chacun d’entre eux a dit.

Prenons par exemple la conversation suivante :

Agent : « Bonjour, René à votre service. Comment puis-je vous aider ? »

Client : « Bonjour, j’essaie de configurer la connexion Wi-Fi de ma machine à expresso Smart Brew 300, mais cela ne fonctionne pas. »

Agent : « Je suis désolé. Voyons ce que nous pouvons faire pour résoudre ce problème. Pouvez-vous appuyer sur le bouton de connexion Wi-Fi en le maintenant enfoncé pendant 3 secondes, puis me dire si le voyant de l’alimentation clignote lentement ? »

Client :« Oui. J’ai appuyé le bouton de connexion Wi-Fi ; maintenant, la lumière de l’alimentation clignote lentement. »

Agent :« Parfait. Je vous remercie ! À présent, consultez votre application Contoso Coffee. Vous est-il demandé de vous connecter à la machine ? »

Client :« Non. Rien ne se passe. »

Agent : « Je vois. Nous vous remercions. Voyons si une réinitialisation aux paramètres d’usine peut résoudre le problème. Pouvez-vous appuyer longuement sur le bouton central pendant 5 secondes pour démarrer la réinitialisation aux paramètres d’usine. »

Client : « J’ai essayé la réinitialisation aux paramètres d’usine et j’ai suivi à nouveau cette procédure, mais cela ne fonctionne toujours pas. »

Agent : « Je suis désolé. Voyons s’il y a un autre moyen de résoudre le problème. Veuillez patienter. »

La fonctionnalité de résumé des conversations simplifie le texte de cette façon :

Résumé de l’exemple Format Aspect de la conversation
Le client souhaite utiliser la connexion Wi-Fi sur sa Smart Brew 300. Mais cela ne fonctionnait pas. Une ou deux phrases problème
A vérifié si la lumière de l’alimentation clignote lentement. Vérifié l’application de café Contoso. Elle n’avait pas d’invite. A essayé d’effectuer une réinitialisation aux paramètres d’usine. Une ou plusieurs phrases, générées à partir de plusieurs lignes de la transcription. resolution

Bien démarrer avec les résumés

Pour utiliser le résumé, vous envoyez du texte pour analyse et gérez la sortie d’API dans votre application. L’analyse est effectuée telle quelle, sans personnalisation supplémentaire du modèle utilisé sur vos données. Il existe deux façons d’utiliser les résumés :

Option de développement Description
Language studio Language Studio est une plateforme web qui vous permet d’essayer la liaison d’entités avec des exemples de texte sans compte Azure et vos propres données lorsque vous vous inscrivez. Pour plus d’informations, consultez le site web Language Studio ou le démarrage rapide de Language Studio.
API REST ou bibliothèque de client (SDK Azure) Intégrez le résumé du texte à vos applications à l’aide de l’API REST ou de la bibliothèque cliente disponible dans différentes langues. Pour plus d’informations, consultez le guide de démarrage rapide du résumé.

Exigences d’entrée et limites du service

Documentation de référence et exemples de code

Lorsque vous utilisez le résumé du texte dans vos applications, consultez la documentation de référence et les exemples suivants pour Azure AI Language :

Option de développement/langage Documentation de référence Exemples
C# Documentation C# Exemples C#
Java Documentation Java Exemples Java
JavaScript Documentation JavaScript Exemples JavaScript
Python Documentation Python Exemples Python

Intelligence artificielle responsable

Un système d’IA englobe non seulement la technologie, mais aussi ses utilisateurs, les personnes concernées et l’environnement de déploiement. Lisez la note de transparence sur le résumé pour en savoir plus sur l’utilisation et le déploiement d’une IA responsable dans vos systèmes. Pour plus d’informations, consultez les articles suivants :