Exemple : Comment extraire des phrases clés avec l’Analyse de texteExample: How to extract key phrases using Text Analytics

L’API Extraction de phrases clés évalue un texte non structuré puis, pour chaque document JSON, retourne une liste d’expressions clés.The Key Phrase Extraction API evaluates unstructured text, and for each JSON document, returns a list of key phrases.

Cette fonctionnalité est utile si vous avez besoin d’identifier rapidement les principaux points d’une collection de documents.This capability is useful if you need to quickly identify the main points in a collection of documents. Par exemple, pour le texte d’entrée « The food was delicious and there were wonderful staff » (La nourriture était délicieuse et le personnel adorable), le service retourne les principaux points de discussion : « food » (nourriture) et « wonderful staff » (personnel adorable).For example, given input text "The food was delicious and there were wonderful staff", the service returns the main talking points: "food" and "wonderful staff".

Actuellement, l’API Extraction de phrases clés prend en charge l’anglais, l’allemand, l’espagnol et le japonais.Currently, Key Phrase Extraction supports English, German, Spanish, and Japanese. D’autres langues sont en préversion.Other languages are in preview. Pour en savoir plus, consultez Langages pris en charge.For more information, see Supported languages.

Conseil

Analyse de texte fournit également une image conteneur Docker basée sur Linux pour l’extraction de phrases clés. Vous pouvez ainsi installer et exécuter le conteneur Analyse de texte à proximité de vos données.Text Analytics also provides a Linux-based Docker container image for key phrase extraction, so you can install and run the Text Analytics container close to your data.

PréparationPreparation

L’extraction de phrases clés fonctionne mieux avec une plus grande quantité de texte.Key phrase extraction works best when you give it bigger amounts of text to work on. Contrairement à l’analyse des sentiments, qui fonctionne mieux sur des petites quantités de texte.This is opposite from sentiment analysis, which performs better on smaller amounts of text. Pour obtenir des résultats optimaux pour ces deux opérations, envisagez de restructurer les entrées en conséquence.To get the best results from both operations, consider restructuring the inputs accordingly.

Vous devez disposer de documents JSON dans le format : id, texte, langueYou must have JSON documents in this format: id, text, language

La taille des documents doit être inférieure à 5 120 caractères par document et vous pouvez avoir jusqu’à 1 000 éléments (ID) par collection.Document size must be under 5,120 characters per document, and you can have up to 1,000 items (IDs) per collection. La collection est soumise dans le corps de la demande.The collection is submitted in the body of the request. L’exemple suivant illustre le contenu qui peut être soumis pour extraction d’expressions clés.The following example is an illustration of content you might submit for key phrase extraction.

    {
        "documents": [
            {
                "language": "en",
                "id": "1",
                "text": "We love this trail and make the trip every year. The views are breathtaking and well worth the hike!"
            },
            {
                "language": "en",
                "id": "2",
                "text": "Poorly marked trails! I thought we were goners. Worst hike ever."
            },
            {
                "language": "en",
                "id": "3",
                "text": "Everyone in my family liked the trail but thought it was too challenging for the less athletic among us. Not necessarily recommended for small children."
            },
            {
                "language": "en",
                "id": "4",
                "text": "It was foggy so we missed the spectacular views, but the trail was ok. Worth checking out if you are in the area."
            },                
            {
                "language": "en",
                "id": "5",
                "text": "This is my favorite trail. It has beautiful views and many places to stop and rest"
            }
        ]
    }

Étape 1 : Structurer la requêteStep 1: Structure the request

Vous trouverez plus d’informations sur la définition d’une demande dans Guide pratique pour appeler l’API Analyse de texte.Details on request definition can be found in How to call the Text Analytics API. Les points suivants sont réaffirmés pour des raisons pratiques :The following points are restated for convenience:

  • Créez une demande POST.Create a POST request. Passez en revue la documentation de l’API pour cette requête : API d’expressions clésReview the API documentation for this request: Key Phrases API

  • Définissez le point de terminaison HTTP pour l’extraction de phrases clés à l’aide d’une ressource Analyse de texte sur Azure ou d’un conteneur Analyse de texte instancié.Set the HTTP endpoint for key phrase extraction, using either a Text Analytics resource on Azure or an instantiated Text Analytics container. Il doit inclure la ressource /keyPhrases : https://westus.api.cognitive.microsoft.com/text/analytics/v2.1/keyPhrasesIt must include the /keyPhrases resource: https://westus.api.cognitive.microsoft.com/text/analytics/v2.1/keyPhrases

  • Définissez un en-tête de demande pour inclure la clé d’accès pour les opérations d’Analyse de texte.Set a request header to include the access key for Text Analytics operations. Pour plus d’informations, consultez Guide pratique pour rechercher des points de terminaison et des clés d’accès.For more information, see How to find endpoints and access keys.

  • Dans le corps de la demande, fournissez la collection de documents JSON que vous avez préparée pour cette analyse.In the request body, provide the JSON documents collection you prepared for this analysis

Conseil

Utilisez Postman ou ouvrez la console de test d’API dans la documentation pour structurer une demande et la publier dans le service.Use Postman or open the API testing console in the documentation to structure a request and POST it to the service.

Étape 2 : Publier la requêteStep 2: Post the request

L’analyse est effectuée à la réception de la demande.Analysis is performed upon receipt of the request. Le service accepte jusqu'à 100 demandes par minute.The service accepts up to 100 requests per minute. Chaque demande peut être au maximum de 1 Mo.Each request can be a maximum of 1 MB.

Rappelez-vous que le service est sans état.Recall that the service is stateless. Aucune donnée n’est stockée dans votre compte.No data is stored in your account. Les résultats sont retournés immédiatement dans la réponse.Results are returned immediately in the response.

Étape 3 : Afficher les résultatsStep 3: View results

Toutes les demandes POST retournent une réponse au format JSON avec les ID et les propriétés détectées.All POST requests return a JSON formatted response with the IDs and detected properties.

La sortie est retournée immédiatement.Output is returned immediately. Vous pouvez diffuser en continu les résultats dans une application qui accepte le code JSON ou enregistrer la sortie dans un fichier sur le système local, puis l’importer dans une application qui vous permet de trier, rechercher et manipuler les données.You can stream the results to an application that accepts JSON or save the output to a file on the local system, and then import it into an application that allows you to sort, search, and manipulate the data.

Voici un exemple de sortie pour l’extraction de phrases clés :An example of the output for key phrase extraction is shown here:

    "documents": [
        {
            "keyPhrases": [
                "year",
                "trail",
                "trip",
                "views"
            ],
            "id": "1"
        },
        {
            "keyPhrases": [
                "marked trails",
                "Worst hike",
                "goners"
            ],
            "id": "2"
        },
        {
            "keyPhrases": [
                "trail",
                "small children",
                "family"
            ],
            "id": "3"
        },
        {
            "keyPhrases": [
                "spectacular views",
                "trail",
                "area"
            ],
            "id": "4"
        },
        {
            "keyPhrases": [
                "places",
                "beautiful views",
                "favorite trail"
            ],
            "id": "5"
        }

Comme indiqué, l’analyseur recherche et ignore les mots non essentiels, et conserve les termes ou expressions uniques qui semblent constituer le sujet ou l’objet d’une phrase.As noted, the analyzer finds and discards non-essential words, and keeps single terms or phrases that appear to be the subject or object of a sentence.

RésuméSummary

Dans cet article, vous avez vu les concepts et le flux de travail d’extraction d’expressions clés à l’aide de l’API Analyse de texte dans Cognitive Services.In this article, you learned concepts and workflow for key phrase extraction using Text Analytics in Cognitive Services. En résumé :In summary:

  • L’API Extraction de phrases clés est disponible pour les langues sélectionnées.Key phrase extraction API is available for selected languages.
  • Les documents JSON figurant dans le corps de la demande incluent un id, un texte et un code de langue.JSON documents in the request body include an id, text, and language code.
  • La demande POST s’effectue sur un point de terminaison /keyphrases, à l’aide d’une clé d’accès et d’un point de terminaison personnalisés valides pour votre abonnement.POST request is to a /keyphrases endpoint, using a personalized access key and an endpoint that is valid for your subscription.
  • La sortie de réponse, qui se compose de mots et d’expressions clés pour chaque ID de document, peut être diffusée vers n’importe quelle application qui accepte JSON, y compris Excel et Power BI, pour n’en citer que quelques-unes.Response output, which consists of key words and phrases for each document ID, can be streamed to any app that accepts JSON, including Excel and Power BI, to name a few.

Voir aussiSee also

Vue d’ensemble d’Analyse de texteText Analytics overview
Questions fréquentes (FAQ)Frequently asked questions (FAQ)
Page produit d’Analyse de texteText Analytics product page

Étapes suivantesNext steps