Qu’est-ce que le service Analyse de texte ?What is Text Analytics?

L’API Analyse de texte est un service cloud qui fournit un traitement en langage naturel avancé de texte brut. Elle inclut trois fonctions principales : analyse des sentiments, extraction de phrases clés, détection de la langue et liaison d’entités.The Text Analytics API is a cloud-based service that provides advanced natural language processing over raw text, and includes four main functions: sentiment analysis, key phrase extraction, language detection, and entity linking.

L’API s’appuie sur des ressources de Microsoft Cognitive Services, une collection d’algorithmes d’apprentissage automatique et d’intelligence artificielle dans le cloud, prêtes à l’emploi dans vos projets de développement.The API is backed by resources in Microsoft Cognitive Services, a collection of machine learning and AI algorithms in the cloud, readily consumable in your development projects.

Fonctionnalités d’Analyse de texteCapabilities in Text Analytics

L’analyse de texte peut signifier différentes choses mais, dans Cognitive Services, l’API Analyse de texte fournit quatre types d’analyses, comme décrit dans le tableau suivant.Text analysis can mean different things, but in Cognitive Services, the Text Analytics API provides four types of analysis as described in the following table.

OpérationsOperations DescriptionDescription APIAPIs
Analyse des sentimentsSentiment Analysis Découvrez ce que les clients pensent de votre marque ou thématique en analysant du texte brut pour trouver des indices sur les sentiments positifs ou négatifs.Find out what customers think of your brand or topic by analyzing raw text for clues about positive or negative sentiment. Cette API renvoie un score de sentiment de 0 à 1 pour chaque document, où 1 correspond au sentiment le plus positif.This API returns a sentiment score between 0 and 1 for each document, where 1 is the most positive.
Les modèles d’analyse sont préformés à l’aide d’un corps complet de technologies de texte et de Langage naturel de Microsoft.The analysis models are pretrained using an extensive body of text and natural language technologies from Microsoft. Pour les langues sélectionnées, l’API peut analyser tout texte brut que vous fournissez, lui attribuer un score, et renvoyer directement les résultats à l’application appelante.For selected languages, the API can analyze and score any raw text that you provide, directly returning results to the calling application.
RESTREST
.NET.NET
extraction de phrases clésKey Phrase Extraction Extrayez automatiquement des phrases clés pour identifier rapidement les points principaux.Automatically extract key phrases to quickly identify the main points. Par exemple, pour le texte d’entrée « Le repas était délicieux et le personnel adorable », l’API renvoie les principaux points de discussion : « repas » et « personnel adorable ».For example, for the input text "The food was delicious and there were wonderful staff", the API returns the main talking points: "food" and "wonderful staff". RESTREST
.NET.NET
Détection de la langueLanguage Detection Détectez parmi jusqu’à 120 langues celle dans laquelle le texte d’entrée est rédigé, et générez un code de langue unique pour chaque document soumis dans la demande.For up to 120 languages, detect which language the input text is written in and report a single language code for every document submitted on the request. Le code de langue est associé à un score indiquant la puissance de l’analyse.The language code is paired with a score indicating the strength of the score. RESTREST
.NET.NET
Reconnaissance d’entité (préversion)Entity Recognition (Preview) Identifiez et classez les entités dans votre texte en tant que personnes, lieux, organisations, date/heure, quantités, pourcentages, devises et bien plus encore.Identify and categorize entities in your text as people, places, organizations, date/time, quantities, percentages, currencies, and more. Les entités bien connues sont également reconnues et liées pour des informations supplémentaires sur le web.Well-known entities are also recognized and linked to more information on the web. RESTREST

Flux de travail classiqueTypical workflow

Le flux de travail est simple : vous envoyez des données pour analyse et traitez les résultats dans votre code.The workflow is simple: you submit data for analysis and handle outputs in your code. Les analyseurs sont utilisés tels quels, sans configuration ou personnalisation supplémentaires.Analyzers are consumed as-is, with no additional configuration or customization.

  1. Inscrivez-vous pour un clé d’accès.Sign up for an access key. La clé doit être passée dans chaque demande.The key must be passed on each request.

  2. Formulez une demande contenant vos données sous forme de texte brut non structuré en JSON.Formulate a request containing your data as raw unstructured text, in JSON.

  3. Publiez la demande sur le point de terminaison établi pendant l’inscription, en ajoutant la ressource souhaitée : analyse des sentiments, extraction de phrases clés, détection de la langue ou identification d’entité.Post the request to the endpoint established during sign-up, appending the desired resource: sentiment analysis, key phrase extraction, language detection, or entity identification.

  4. Diffusez ou stockez la réponse localement.Stream or store the response locally. En fonction de la demande, les résultats sont un score de sentiment, une collection de phrases clés extraites ou un code de langue.Depending on the request, results are either a sentiment score, a collection of extracted key phrases, or a language code.

La sortie est renvoyée en tant que simple document JSON, avec des résultats pour chaque document texte que vous avez publié, en fonction de l’ID.Output is returned as a single JSON document, with results for each text document you posted, based on ID. Vous pouvez ensuite analyser, visualiser ou catégoriser les résultats en informations exploitables.You can subsequently analyze, visualize, or categorize the results into actionable insights.

Les données ne sont pas stockées dans votre compte.Data is not stored in your account. Les opérations effectuées par l’API Analyse de texte sont sans état, ce qui signifie que le texte que vous fournissez est traité et que les résultats sont renvoyés immédiatement.Operations performed by the Text Analytics API are stateless, which means the text you provide is processed and results are returned immediately.

Langues prises en chargeSupported languages

Cette section a été déplacée vers un article distinct pour une meilleure détectabilité.This section has been moved to a separate article for better discoverability. Pour accéder à ce contenu, voir Langues prises en charge dans l’API Analyse de texte.Refer to Supported languages in Text Analytics API for this content.

Limites de donnéesData limits

Tous les points de terminaison de l’API Analyse de texte acceptent des données en texte brut.All of the Text Analytics API endpoints accept raw text data. La limite actuelle est de 5 000 caractères par document. Si vous avez besoin d’analyser des documents plus volumineux, vous pouvez les morceler en blocs plus petits.The current limit is 5,000 characters for each document; if you need to analyze larger documents, you can break them up into smaller chunks. Si vous avez malgré tout besoin d’une limite supérieure, contactez-nous afin que nous puissions en discuter.If you still require a higher limit, contact us so that we can discuss your requirements.

LimiteLimit ValeurValue
Taille maximale de documentMaximum size of a single document 5 000 caractères tels que mesurés par String.Length.5,000 characters as measured by String.Length.
Taille maximale d’une demandeMaximum size of entire request 1 Mo1 MB
Nombre maximal de documents par demandeMaximum number of documents in a request 1 000 documents1,000 documents

Le débit maximal est de 100 appels par minute.The rate limit is 100 calls per minute. Notez que vous pouvez envoyer une grande quantité de documents dans un seul appel (jusqu’à 1 000 documents).Note that you can submit a large quantity of documents in a single call (up to 1000 documents).

Codage UnicodeUnicode encoding

L’API Analyse de texte utilise un codage Unicode pour la représentation textuelle et les calculs de nombre de caractères.The Text Analytics API uses Unicode encoding for text representation and character count calculations. Les demandes peuvent être soumises en code UTF-8 ou UTF-16, sans différence mesurable de nombre de caractères.Requests can be submitted in both UTF-8 and UTF-16 with no measurable differences in the character count. Des points de code Unicode sont utilisés en guise d’heuristique pour la longueur de caractères, et sont considérés comme équivalents en ce qui concerne les limites de données pour l’analyse de texte.Unicode codepoints are used as the heuristic for character length and are considered equivalent for the purposes of text analytics data limits. Si vous utilisez String.Length pour obtenir le nombre de caractères, vous recourez à la même méthode que nous pour mesurer la taille des données.If you use String.Length to get the character count, you are using the same method we use to measure data size.

Étapes suivantesNext steps

Commencez par essayer la démonstration interactive.First, try the interactive demo. Vous pouvez coller une entrée de texte (5 000 caractères maximum) pour détecter la langue (parmi jusqu’à 120 langues), calculer un score de sentiment ou extraire des phrases clés.You can paste a text input (5,000 character maximum) to detect the language (up to 120), calculate a sentiment score, or extract key phrases. Aucune inscription n’est nécessaire.No sign-up necessary.

Lorsque vous êtes prêt à appeler l’API directement :When you are ready to call the API directly:

  • Inscrivez-vous pour obtenir une clé d’accès et examinez la procédure d’appel de l’API.Sign up for an access key and review the steps for calling the API.

  • Le démarrage rapide est une procédure pas à pas relative aux appels d’API REST, écrite en C#.Quickstart is a walkthrough of the REST API calls written in C#. Découvrez comment envoyer du texte, choisir une analyse et afficher les résultats avec un minimum de code.Learn how to submit text, choose an analysis, and view results with minimal code.

  • La documentation de référence de l’API fournit des informations techniques sur l’API.API reference documentation provides the technical documentation for the APIs. La documentation prenant en charge les appels incorporés, vous pouvez appeler l’API à partir de chaque page.The documentation supports embedded calls so that you can call the API from each documentation page.

  • Le Contenu externe et de la communauté fournit la liste des billets de blog et des vidéos montrant comment utiliser l’Analyse de texte avec d’autres outils et technologies.External & Community Content provides a list of blog posts and videos demonstrating how to use Text Analytics with other tools and technologies.

Voir aussiSee also

Page Documentation Cognitive ServicesCognitive Services Documentation page