Voor beeld: sleutel zinnen extra heren met behulp van Text AnalyticsExample: How to extract key phrases using Text Analytics

De Sleuteltermextractie API evalueert ongestructureerde tekst en retourneert voor elk JSON-document een lijst met sleuteltermen.The Key Phrase Extraction API evaluates unstructured text, and for each JSON document, returns a list of key phrases.

Deze functie is handig als u snel de belangrijkste punten moet identificeren van een verzameling documenten.This capability is useful if you need to quickly identify the main points in a collection of documents. Bijvoorbeeld, bij de invoertekst "het eten was heerlijk en de bediening fantastisch", retourneert de service de belangrijkste gespreksonderwerpen: 'eten' en "bediening fantastisch".For example, given input text "The food was delicious and there were wonderful staff", the service returns the main talking points: "food" and "wonderful staff".

Zie voor meer informatie Ondersteunde talen.For more information, see Supported languages.

Tip

Text Analytics biedt ook een Docker-containerinstallatiekopie op basis van Linux voor sleuteltermextractie. U kunt de Text Analytics-container dus dicht bij uw gegevens installeren en uitvoeren.Text Analytics also provides a Linux-based Docker container image for key phrase extraction, so you can install and run the Text Analytics container close to your data.

VoorbereidingPreparation

Sleuteltermextractie werkt het beste wanneer u grotere segmenten tekst opgeeft.Key phrase extraction works best when you give it bigger amounts of text to work on. Dit is het tegenovergestelde van sentimentanalyse, wat beter presteert op kleinere blokken tekst.This is opposite from sentiment analysis, which performs better on smaller amounts of text. Overweeg dienovereenkomstig herstructurering van de invoer voor de beste resultaten uit beide bewerkingen.To get the best results from both operations, consider restructuring the inputs accordingly.

U moet JSON-documenten hebben met de volgende indeling: ID, tekst, taalYou must have JSON documents in this format: ID, text, language

De document grootte moet 5.120 of minder tekens per document zijn en u kunt Maxi maal 1.000 items (Id's) per verzameling hebben.Document size must be 5,120 or fewer characters per document, and you can have up to 1,000 items (IDs) per collection. De verzameling is in de hoofdtekst van de aanvraag ingediend.The collection is submitted in the body of the request. Het volgende voorbeeld geeft de inhoud die u kunt indienen voor sleuteltermextractie.The following example is an illustration of content you might submit for key phrase extraction.

    {
        "documents": [
            {
                "language": "en",
                "id": "1",
                "text": "We love this trail and make the trip every year. The views are breathtaking and well worth the hike!"
            },
            {
                "language": "en",
                "id": "2",
                "text": "Poorly marked trails! I thought we were goners. Worst hike ever."
            },
            {
                "language": "en",
                "id": "3",
                "text": "Everyone in my family liked the trail but thought it was too challenging for the less athletic among us. Not necessarily recommended for small children."
            },
            {
                "language": "en",
                "id": "4",
                "text": "It was foggy so we missed the spectacular views, but the trail was ok. Worth checking out if you are in the area."
            },
            {
                "language": "en",
                "id": "5",
                "text": "This is my favorite trail. It has beautiful views and many places to stop and rest"
            }
        ]
    }

Stap 1: Structuur van de aanvraagStep 1: Structure the request

Zie de Text Analytics-API aanroepenvoor informatie over de definitie van aanvragen.For information about request definition, see How to call the Text Analytics API. De volgende punten zijn voor uw gemak opnieuw geformuleerd:The following points are restated for convenience:

  • Maak een POST-aanvraag.Create a POST request. Raadpleeg de API-documentatie voor deze aanvraag: Key frases-API.Review the API documentation for this request: Key Phrases API.

  • Stel het HTTP-eind punt voor de extractie van sleutel woordgroepen in met behulp van een Text Analytics bron in azure of een geĆÆnstantieerd Text Analytics container.Set the HTTP endpoint for key phrase extraction by using either a Text Analytics resource on Azure or an instantiated Text Analytics container. U moet /text/analytics/v2.1/keyPhrases in de URL toevoegen.You must include /text/analytics/v2.1/keyPhrases in the URL. Bijvoorbeeld: https://<your-custom-subdomain>.api.cognitiveservices.azure.com/text/analytics/v2.1/keyPhrases.For example: https://<your-custom-subdomain>.api.cognitiveservices.azure.com/text/analytics/v2.1/keyPhrases.

  • Stel een aanvraag header in voor het toevoegen van de toegangs sleutel voor Text Analytics bewerkingen.Set a request header to include the access key for Text Analytics operations.

  • Verstrek in de hoofdtekst van de aanvraag de JSON-documentenverzameling die u hebt voorbereid voor deze analyse.In the request body, provide the JSON documents collection you prepared for this analysis.

Tip

Gebruik Postman of open de API-testconsole in de documentatie om de aanvraag te structureren en POST deze in de service.Use Postman or open the API testing console in the documentation to structure a request and POST it to the service.

Stap 2: De aanvraag postenStep 2: Post the request

Analyse wordt uitgevoerd na ontvangst van de aanvraag.Analysis is performed upon receipt of the request. Zie de sectie gegevens limieten in het overzicht voor meer informatie over de grootte en het aantal aanvragen dat u per minuut of per seconde kunt verzenden.For information about the size and number of requests you can send per minute or per second, see the data limits section in the overview .

Terughalen als de service staatloos is.Recall that the service is stateless. Er worden geen gegevens opgeslagen in uw account.No data is stored in your account. Resultaten worden onmiddellijk in het antwoord geretourneerd.Results are returned immediately in the response.

Stap 3: Resultaten weergevenStep 3: View results

Alle POST-verzoeken retourneren een ingedeeld JSON-antwoord met de id's en gedetecteerde eigenschappen.All POST requests return a JSON formatted response with the IDs and detected properties. De volg orde van de geretourneerde sleutel zinnen wordt intern bepaald door het model.The order of the returned key phrases is determined internally, by the model.

Uitvoer wordt onmiddellijk geretourneerd.Output is returned immediately. U kunt de resultaten streamen naar een toepassing die JSON accepteert of u kunt de uitvoer opslaan als lokaal bestand en vervolgens importeren in een toepassing waarmee u kunt sorteren, zoeken en de gegevens kunt manipuleren.You can stream the results to an application that accepts JSON or save the output to a file on the local system, and then import it into an application that allows you to sort, search, and manipulate the data.

Een voorbeeld van de uitvoer voor sleuteltermextractie:An example of the output for key phrase extraction is shown here:

    {
        "documents": [
            {
                "keyPhrases": [
                    "year",
                    "trail",
                    "trip",
                    "views"
                ],
                "id": "1"
            },
            {
                "keyPhrases": [
                    "marked trails",
                    "Worst hike",
                    "goners"
                ],
                "id": "2"
            },
            {
                "keyPhrases": [
                    "trail",
                    "small children",
                    "family"
                ],
                "id": "3"
            },
            {
                "keyPhrases": [
                    "spectacular views",
                    "trail",
                    "area"
                ],
                "id": "4"
            },
            {
                "keyPhrases": [
                    "places",
                    "beautiful views",
                    "favorite trail"
                ],
                "id": "5"
            }
        ],
        "errors": []
    }

Zoals aangegeven, detecteert en negeert het analyse programma niet-essentiƫle woorden en worden enkele termen of zinsdelen weer gegeven die het onderwerp of object van een zin lijken te zijn.As noted, the analyzer finds and discards non-essential words, and it keeps single terms or phrases that appear to be the subject or object of a sentence.

SamenvattingSummary

In dit artikel hebt u concepten en werk stromen geleerd voor het uitpakken van sleutel zinnen door gebruik te maken van Text Analytics in Cognitive Services.In this article, you learned concepts and workflow for key phrase extraction by using Text Analytics in Cognitive Services. Samenvatting:In summary:

  • Sleuteltermextractie-API is beschikbaar in bepaalde talen.Key phrase extraction API is available for selected languages.
  • JSON-documenten in de hoofd tekst van de aanvraag bevatten een ID, tekst en taal code.JSON documents in the request body include an ID, text, and language code.
  • POST-aanvraag is een /keyphrases-eindpunt die een persoonlijke toegangssleutel en een eindpunt gebruikt die geldig zijn voor uw abonnement.POST request is to a /keyphrases endpoint, using a personalized access key and an endpoint that is valid for your subscription.
  • De uitvoer van antwoorden, die bestaat uit sleutel woorden en zinsdelen voor elke document-ID, kan worden gestreamd naar elke app die JSON accepteert, met inbegrip van Microsoft Office Excel en Power BI, om een paar te noemen.Response output, which consists of key words and phrases for each document ID, can be streamed to any app that accepts JSON, including Microsoft Office Excel and Power BI, to name a few.

Zie ookSee also

Overzicht van Text Analytics Veelgestelde vragenText Analytics overview Frequently asked questions (FAQ)
Text Analytics-productpaginaText Analytics product page

Volgende stappenNext steps