Qu’est-ce que l’API Analyse de texte ?

L’API Analyse de texte est un service cloud qui fournit des fonctionnalités de traitement en langage naturel pour l’exploration de texte et l’analyse de texte, notamment l’analyse des sentiments, l’exploration des opinions, l’extraction de phrases clés, la détection de la langue et la reconnaissance des entités nommées.

L’API fait partie d’Azure Cognitive Services, une collection d’algorithmes de machine learning et d’intelligence artificielle dans le cloud pour vos projets de développement. Vous pouvez utiliser ces fonctionnalités avec l’API REST version 3.0 ou version 3.1 ou avec la bibliothèque de client.

Cette documentation contient les types d’articles suivants :

  • Les Guides de démarrage rapide sont des instructions pas à pas qui vous permettent d’effectuer des appels au service et d’obtenir des résultats en peu de temps.
  • Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.
  • Les Concepts fournissent des explications approfondies sur les fonctions et fonctionnalités du service.
  • Les Tutoriels sont des guides plus longs qui montrent comment utiliser ce service en tant que composant dans des solutions métier plus larges.

analyse de sentiments

Utilisez l’analyse des sentiments (SA) et découvrez ce que les gens pensent de votre marque ou de votre thématique en explorant le texte pour trouver des indices sur les sentiments positifs ou négatifs.

La fonctionnalité fournit des étiquettes de sentiment (comme « négatif », « neutre » et « positif ») en fonction du score de confiance le plus élevé trouvé par le service au niveau du document et de la phrase. Cette fonctionnalité retourne également des scores de confiance compris entre 0 et 1 pour chaque document, ainsi que les phrases qu’il contient pour les sentiments positif, neutre et négatif. Vous pouvez également exécuter le service localement à l’aide d’un conteneur.

À partir de la version 3.1, l’exploration des opinions (OM) est une fonctionnalité d’Analyse des sentiments. Également connu sous le nom d’Analyse des sentiments basée sur l’aspect dans le registre du traitement en langage naturel, cette fonctionnalité fournit des informations plus précises sur les opinions liées aux mots (tels que les attributs de produits ou de services) dans le texte.

Extraction d’expressions clés

Utilisez l’extraction d’expressions clés (KPE) pour identifier rapidement les principaux concepts d’un texte. Par exemple, dans le texte « The food was delicious and there were wonderful staff » (La nourriture était délicieuse et le personnel adorable), l’extraction de phrases clés retourne les principaux points de discussion : « food » (nourriture) et « wonderful staff » (personnel adorable).

Détection de la langue

La détection de la langue peut détecter la langue dans laquelle un texte d’entrée est rédigé et générer un code de langue unique pour chaque document envoyé dans la requête, ceci parmi une grande variété de langues, de variantes, de dialectes, et de quelques langues régionales ou de culture. Le code de langue est associé à un score de confiance.

Reconnaissance d’entité nommée

La reconnaissance d’entités nommées (NER) peut identifier et classer les entités dans votre texte en tant que personnes, lieux, organisations, quantités ; les entités bien connues sont également reconnues et liées à des informations supplémentaires sur le web.

Analyse de texte pour la santé

Analyse de texte pour la santé est une fonctionnalité du service de l’API Analyse de texte qui extrait et étiquette des informations médicales pertinentes à partir de textes non structurés, tels que les notes du médecin, les bilans de sortie d’hospitalisation, les documents cliniques et les dossiers médicaux électroniques.

Déployer localement en utilisant des conteneurs Docker

Utilisez des conteneurs Analyse de texte pour déployer localement des fonctionnalités d’API. Ces conteneurs Docker vous donnent la possibilité de rapprocher le service plus près de vos données, ce qui peut être souhaitable pour des raisons de conformité, de sécurité ou opérationnelles. Analyse de texte offre les conteneurs suivants :

  • analyse des sentiments
  • Extraction de phrases clés (préversion)
  • Détection de langue (préversion)
  • Analyse de texte pour la santé

Opérations asynchrones

Le point de terminaison /analyze vous permet d’utiliser de nombreuses fonctionnalités de l’API Analyse de texte de façon asynchrone. Les fonctionnalités Reconnaissance d’entité nommée (NER), Extraction d’expressions clés (KPE), Analyse des sentiments (SA) et Exploration des opinions (OM) sont disponibles dans le cadre du point de terminaison /analyze. Cela permet de regrouper ces fonctionnalités en un seul appel. Cela permet d’envoyer jusqu’à 125 000 caractères par document. La tarification est identique à celle de l’API Analyse de texte classique.

Flux de travail classique

Le flux de travail est simple : vous envoyez des données pour analyse et traitez les résultats dans votre code. Les analyseurs sont utilisés tels quels, sans configuration ou personnalisation supplémentaires.

  1. Créez une ressource Azure pour Text Analytics. Ensuite, récupérez la clé générée pour authentifier vos demandes.

  2. Formulez une demande contenant vos données sous forme de texte brut non structuré en JSON.

  3. Publiez la demande sur le point de terminaison établi pendant l’inscription, en ajoutant la ressource souhaitée : analyse des sentiments, extraction de phrases clés, détection de la langue ou reconnaissance des entités nommées.

  4. Diffusez ou stockez la réponse localement. En fonction de la demande, les résultats sont un score de sentiment, une collection de phrases clés extraites ou un code de langue.

La sortie est renvoyée en tant que simple document JSON, avec des résultats pour chaque document texte que vous avez publié, en fonction de l’ID. Vous pouvez ensuite analyser, visualiser ou catégoriser les résultats en informations exploitables.

Les données ne sont pas stockées dans votre compte. Les opérations effectuées par l’API Text Analytics sont sans état, ce qui signifie que le texte que vous fournissez est traité et que les résultats sont renvoyés immédiatement.

Text Analytics pour plusieurs niveaux d’expérience en programmation

Vous pouvez commencer à utiliser l’API Text Analytics dans votre processus, même si vous n’avez pas beaucoup d’expérience en programmation. Utilisez ces tutoriels pour savoir comment recourir à l’API pour analyser un texte de différentes façons en fonction de votre niveau d’expérience.

Langues prises en charge

Cette section a été déplacée vers un article distinct pour une meilleure détectabilité. Pour accéder à ce contenu, voir Langues prises en charge dans l’API Text Analytics.

Limites de données

Tous les points de terminaison de l’API Analyse de texte acceptent des données en texte brut. Pour plus d’informations, consultez l’article Limites de données.

Codage Unicode

L’API Text Analytics utilise un codage Unicode pour la représentation textuelle et les calculs de nombre de caractères. Les demandes peuvent être soumises en code UTF-8 ou UTF-16, sans différence mesurable de nombre de caractères. Des points de code Unicode sont utilisés en guise d’heuristique pour la longueur de caractères, et sont considérés comme équivalents en ce qui concerne les limites de données pour Text Analytics. Si vous utilisez StringInfo.LengthInTextElements pour obtenir le nombre de caractères, vous recourez à la même méthode que nous pour mesurer la taille des données.

Étapes suivantes