Qu’est-ce que l’API Analyse de texte ?What is the Text Analytics API?

L’API Analyse de texte est un service cloud qui fournit un traitement en langage naturel avancé de texte brut. Elle inclut trois fonctions principales : analyse des sentiments, extraction de phrases clés, détection de la langue et la reconnaissance d’entités.The Text Analytics API is a cloud-based service that provides advanced natural language processing over raw text, and includes four main functions: sentiment analysis, key phrase extraction, language detection, and entity recognition.

L’API fait partie d’Azure Cognitive Services, une collection d’algorithmes de machine learning et d’intelligence artificielle dans le cloud pour vos projets de développement.The API is a part of Azure Cognitive Services, a collection of machine learning and AI algorithms in the cloud for your development projects.

L’analyse de texte peut signifier différentes choses mais, dans Cognitive Services, l’API Analyse de texte fournit quatre types d’analyses, comme décrit ci-dessous.Text analysis can mean different things, but in Cognitive Services, the Text Analytics API provides four types of analysis as described below. Vous pouvez utiliser ces fonctionnalités avec l' APIREST ou une bibliothèque de client pour .NET, Python, Node. js, Go, ou Ruby.You can use these features with the REST API, or a client library for .NET, Python, Node.js, Go, or Ruby.

Analyse des sentimentsSentiment Analysis

Utilisez l’analyse des sentiments pour découvrir ce que les clients pensent de votre marque ou de votre thématique en analysant du texte brut pour trouver des indices sur les sentiments positifs ou négatifs.Use sentiment analysis to find out what customers think of your brand or topic by analyzing raw text for clues about positive or negative sentiment. Cette API renvoie un score de sentiment de 0 à 1 pour chaque document, où 1 correspond au sentiment le plus positif.This API returns a sentiment score between 0 and 1 for each document, where 1 is the most positive.
Les modèles d’analyse sont préformés à l’aide d’un corps complet de technologies de texte et de Langage naturel de Microsoft.The analysis models are pretrained using an extensive body of text and natural language technologies from Microsoft. Pour les langues sélectionnées, l’API peut analyser tout texte brut que vous fournissez, lui attribuer un score, et renvoyer directement les résultats à l’application appelante.For selected languages, the API can analyze and score any raw text that you provide, directly returning results to the calling application.

Extraction d’expressions clésKey Phrase Extraction

Extrayez automatiquement les expressions clés pour identifier rapidement les points principaux.Automatically extract key phrases to quickly identify the main points. Par exemple, pour le texte d’entrée « Le repas était délicieux et le personnel adorable », l’API renvoie les principaux points de discussion : « repas » et « personnel adorable ».For example, for the input text "The food was delicious and there were wonderful staff", the API returns the main talking points: "food" and "wonderful staff".

Détection de la langueLanguage Detection

Vous pouvez détecter la langue dans laquelle le texte d’entrée est rédigé et générer un code de langue unique pour chaque document envoyé dans la requête, ceci parmi une grande variété de langues, de variantes, de dialectes, et de quelques langues régionales ou de culture.You can detect which language the input text is written in and report a single language code for every document submitted on the request in a wide range of languages, variants, dialects, and some regional/cultural languages. Le code de langue est associé à un score indiquant la puissance de l’analyse.The language code is paired with a score indicating the strength of the score.

Reconnaissance d’entité nomméeNamed Entity Recognition

Identifiez et classez les entités dans votre texte en tant que personnes, lieux, organisations, date/heure, quantités, pourcentages, devises et bien plus encore.Identify and categorize entities in your text as people, places, organizations, date/time, quantities, percentages, currencies, and more. Les entités bien connues sont également reconnues et liées pour des informations supplémentaires sur le web.Well-known entities are also recognized and linked to more information on the web.

Utiliser des conteneursUse containers

Utilisez les conteneurs Analyse de texte pour extraire les phrases clés, détecter la langue et analyser les sentiments localement, en installant des conteneurs Docker normalisés plus près de vos données.Use the Text Analytics containers to extract key phrases, detect language, and analyze sentiment locally, by installing standardized Docker containers closer to your data.

Flux de travail classiqueTypical workflow

Le flux de travail est simple : vous envoyez des données pour analyse et traitez les résultats dans votre code.The workflow is simple: you submit data for analysis and handle outputs in your code. Les analyseurs sont utilisés tels quels, sans configuration ou personnalisation supplémentaires.Analyzers are consumed as-is, with no additional configuration or customization.

  1. Créez une ressource Azure pour Analyse de texte.Create an Azure resource for Text Analytics. Ensuite, récupérez la clé générée pour authentifier vos demandes.Afterwards, get the key generated for you to authenticate your requests.

  2. Formulez une demande contenant vos données sous forme de texte brut non structuré en JSON.Formulate a request containing your data as raw unstructured text, in JSON.

  3. Publiez la demande sur le point de terminaison établi pendant l’inscription, en ajoutant la ressource souhaitée : analyse des sentiments, extraction de phrases clés, détection de la langue ou identification d’entité.Post the request to the endpoint established during sign-up, appending the desired resource: sentiment analysis, key phrase extraction, language detection, or entity identification.

  4. Diffusez ou stockez la réponse localement.Stream or store the response locally. En fonction de la demande, les résultats sont un score de sentiment, une collection de phrases clés extraites ou un code de langue.Depending on the request, results are either a sentiment score, a collection of extracted key phrases, or a language code.

La sortie est renvoyée en tant que simple document JSON, avec des résultats pour chaque document texte que vous avez publié, en fonction de l’ID.Output is returned as a single JSON document, with results for each text document you posted, based on ID. Vous pouvez ensuite analyser, visualiser ou catégoriser les résultats en informations exploitables.You can subsequently analyze, visualize, or categorize the results into actionable insights.

Les données ne sont pas stockées dans votre compte.Data is not stored in your account. Les opérations effectuées par l’API Analyse de texte sont sans état, ce qui signifie que le texte que vous fournissez est traité et que les résultats sont renvoyés immédiatement.Operations performed by the Text Analytics API are stateless, which means the text you provide is processed and results are returned immediately.

Analyse de texte pour plusieurs niveaux d’expérience en programmationText Analytics for multiple programming experience levels

Vous pouvez commencer à utiliser l’API Analyse de texte dans votre processus, même si vous n’avez pas beaucoup d’expérience en programmation.You can start using the Text Analytics API in your processes, even if you don't have much experience in programming. Utilisez ces tutoriels pour savoir comment recourir à l’API pour analyser un texte de différentes façons en fonction de votre niveau d’expérience.Use these tutorials to learn how you can use the API to analyze text in different ways to fit your experience level.

Langues prises en chargeSupported languages

Cette section a été déplacée vers un article distinct pour une meilleure détectabilité.This section has been moved to a separate article for better discoverability. Pour accéder à ce contenu, voir Langues prises en charge dans l’API Analyse de texte.Refer to Supported languages in the Text Analytics API for this content.

Limites de donnéesData limits

Tous les points de terminaison de l’API Analyse de texte acceptent des données en texte brut.All of the Text Analytics API endpoints accept raw text data. La limite actuelle est de 5 120 caractères par document. Si vous avez besoin d’analyser des documents plus volumineux, vous pouvez les morceler en blocs plus petits.The current limit is 5,120 characters for each document; if you need to analyze larger documents, you can break them up into smaller chunks. Si vous avez malgré tout besoin d’une limite supérieure, contactez-nous afin que nous puissions en discuter.If you still require a higher limit, contact us so that we can discuss your requirements.

LimiteLimit ValeurValue
Taille maximale de documentMaximum size of a single document 5 120 caractères, tels que mesurés par StringInfo.LengthInTextElements.5,120 characters as measured by StringInfo.LengthInTextElements.
Taille maximale d’une demandeMaximum size of entire request 1 Mo1 MB
Nombre maximal de documents par demandeMaximum number of documents in a request 1 000 documents1,000 documents

Votre limite de débit varie selon votre niveau tarifaire.Your rate limit will vary with your pricing tier.

NiveauTier Demandes par secondeRequests per second Requêtes par minuteRequests per minute
MultiserviceMulti-service 1 0001000 1 0001000
S0/F0S0/F0 100100 300300
S1S1 200200 300300
S2S2 300300 300300
S3S3 500500 500500
S4S4 1 0001000 1 0001000

Les requêtes sont mesurées séparément pour chaque fonctionnalité d’Analyse de texte.Requests are measured for each Text Analytics feature separately. Par exemple, vous pouvez envoyer le nombre maximal de requêtes pour votre niveau tarifaire pour chaque fonctionnalité en même temps.For example, you can send the maximum number of requests for your pricing tier to each feature, at the same time.

Codage UnicodeUnicode encoding

L’API Analyse de texte utilise un codage Unicode pour la représentation textuelle et les calculs de nombre de caractères.The Text Analytics API uses Unicode encoding for text representation and character count calculations. Les demandes peuvent être soumises en code UTF-8 ou UTF-16, sans différence mesurable de nombre de caractères.Requests can be submitted in both UTF-8 and UTF-16 with no measurable differences in the character count. Des points de code Unicode sont utilisés en guise d’heuristique pour la longueur de caractères, et sont considérés comme équivalents en ce qui concerne les limites de données pour l’analyse de texte.Unicode codepoints are used as the heuristic for character length and are considered equivalent for the purposes of text analytics data limits. Si vous utilisez StringInfo.LengthInTextElements pour obtenir le nombre de caractères, vous recourez à la même méthode que nous pour mesurer la taille des données.If you use StringInfo.LengthInTextElements to get the character count, you are using the same method we use to measure data size.

Étapes suivantesNext steps