Ejemplo: Extracción de frases clave con Text AnalyticsExample: How to extract key phrases using Text Analytics

Key Phrase Extraction API evalúa el texto no estructurado y, en cada documento JSON, devuelve una lista de frases clave.The Key Phrase Extraction API evaluates unstructured text, and for each JSON document, returns a list of key phrases.

Esta capacidad es útil si necesita identificar rápidamente los principales puntos en una colección de documentos.This capability is useful if you need to quickly identify the main points in a collection of documents. Por ejemplo, si el texto de entrada es "La comida estaba deliciosa y el personal era maravilloso", el servicio devuelve los principales puntos de conversación: "comida" y "personal maravilloso".For example, given input text "The food was delicious and there were wonderful staff", the service returns the main talking points: "food" and "wonderful staff".

Para más información, consulte Lenguajes admitidos.For more information, see Supported languages.

Sugerencia

Text Analytics proporciona también una imagen de contenedor de Docker basada en Linux para la extracción de frases clave, por lo que puede instalar y ejecutar el contenedor de Text Analytics cerca de los datos.Text Analytics also provides a Linux-based Docker container image for key phrase extraction, so you can install and run the Text Analytics container close to your data.

PreparaciónPreparation

La extracción de frases clave funciona mejor cuando se proporcionan cantidades más grandes de texto en los que trabajar.Key phrase extraction works best when you give it bigger amounts of text to work on. Es lo contrario del análisis de opiniones, que funciona mejor con cantidades de texto más pequeñas.This is opposite from sentiment analysis, which performs better on smaller amounts of text. Para obtener los mejores resultados de ambas operaciones, considere la posibilidad de reestructurar las entradas en consecuencia.To get the best results from both operations, consider restructuring the inputs accordingly.

Debe tener documentos JSON en este formato: identificador, texto, idiomaYou must have JSON documents in this format: ID, text, language

El tamaño del documento debe ser de 5120 caracteres o menos por documento y puede tener hasta 1000 elementos (identificadores) por colección.Document size must be 5,120 or fewer characters per document, and you can have up to 1,000 items (IDs) per collection. La colección se envía en el cuerpo de la solicitud.The collection is submitted in the body of the request. El ejemplo siguiente es una ilustración del contenido que podría enviar a la extracción de frases clave.The following example is an illustration of content you might submit for key phrase extraction.

    {
        "documents": [
            {
                "language": "en",
                "id": "1",
                "text": "We love this trail and make the trip every year. The views are breathtaking and well worth the hike!"
            },
            {
                "language": "en",
                "id": "2",
                "text": "Poorly marked trails! I thought we were goners. Worst hike ever."
            },
            {
                "language": "en",
                "id": "3",
                "text": "Everyone in my family liked the trail but thought it was too challenging for the less athletic among us. Not necessarily recommended for small children."
            },
            {
                "language": "en",
                "id": "4",
                "text": "It was foggy so we missed the spectacular views, but the trail was ok. Worth checking out if you are in the area."
            },
            {
                "language": "en",
                "id": "5",
                "text": "This is my favorite trail. It has beautiful views and many places to stop and rest"
            }
        ]
    }

Paso 1: Estructurar la solicitudStep 1: Structure the request

Para más información sobre la definición de la solicitud, consulte Cómo llamar a la API REST de Text Analytics.For information about request definition, see How to call the Text Analytics API. Recapitulamos los siguientes puntos para su comodidad:The following points are restated for convenience:

  • Cree una solicitud POST.Create a POST request. Revise la documentación de la API para esta solicitud: Key Phrases API.Review the API documentation for this request: Key Phrases API.

  • Establezca el punto de conexión de HTTP para la extracción de frases clave mediante un recurso de Text Analytics en Azure o un contenedor de Text Analytics con instancias.Set the HTTP endpoint for key phrase extraction by using either a Text Analytics resource on Azure or an instantiated Text Analytics container. Debe incluir /text/analytics/v3.0/keyPhrases en la dirección URL.You must include /text/analytics/v3.0/keyPhrases in the URL. Por ejemplo: https://<your-custom-subdomain>.api.cognitiveservices.azure.com/text/analytics/v3.0/keyPhrases.For example: https://<your-custom-subdomain>.api.cognitiveservices.azure.com/text/analytics/v3.0/keyPhrases.

  • Establezca un encabezado de solicitud para incluir la clave de acceso para las operaciones de Text Analytics.Set a request header to include the access key for Text Analytics operations.

  • En el cuerpo de la solicitud, proporcione la colección de documentos JSON que preparó para este análisis.In the request body, provide the JSON documents collection you prepared for this analysis.

Sugerencia

Use Postman o abra la consola de prueba de la API en la documentación para estructurar y enviar una solicitud POST al servicio.Use Postman or open the API testing console in the documentation to structure a request and POST it to the service.

Paso 2: Publicar la solicitudStep 2: Post the request

El análisis se realiza tras la recepción de la solicitud.Analysis is performed upon receipt of the request. Para obtener información sobre el tamaño y el número de solicitudes que puede enviar por minuto o por segundo, consulte la sección de límites de datos de la introducción.For information about the size and number of requests you can send per minute or per second, see the data limits section in the overview .

Recuerde que el servicio no tiene estado.Recall that the service is stateless. No se almacena ningún dato en su cuenta.No data is stored in your account. Los resultados se devuelven inmediatamente en la respuesta.Results are returned immediately in the response.

Paso 3: Vista de resultadosStep 3: View results

Todas las solicitudes POST devolverán una respuesta con formato JSON con los identificadores y las propiedades detectadas.All POST requests return a JSON formatted response with the IDs and detected properties. El orden de las frases clave devueltas lo determina internamente el modelo.The order of the returned key phrases is determined internally, by the model.

La salida se devuelve inmediatamente.Output is returned immediately. Puede transmitir los resultados a una aplicación que acepte JSON o guardar la salida en un archivo en el sistema local y, a continuación, importarlo en una aplicación que permita ordenar, buscar y manipular los datos.You can stream the results to an application that accepts JSON or save the output to a file on the local system, and then import it into an application that allows you to sort, search, and manipulate the data.

Aquí se muestra un ejemplo de salida de la extracción de frases clave:An example of the output for key phrase extraction is shown here:

    {
        "documents": [
            {
                "keyPhrases": [
                    "year",
                    "trail",
                    "trip",
                    "views"
                ],
                "id": "1"
            },
            {
                "keyPhrases": [
                    "marked trails",
                    "Worst hike",
                    "goners"
                ],
                "id": "2"
            },
            {
                "keyPhrases": [
                    "trail",
                    "small children",
                    "family"
                ],
                "id": "3"
            },
            {
                "keyPhrases": [
                    "spectacular views",
                    "trail",
                    "area"
                ],
                "id": "4"
            },
            {
                "keyPhrases": [
                    "places",
                    "beautiful views",
                    "favorite trail"
                ],
                "id": "5"
            }
        ],
        "errors": []
    }

Como se indicó, el analizador busca y descarta las palabras que no son esenciales y conserva solo los términos o frases que parecen ser el asunto o el objeto de una frase.As noted, the analyzer finds and discards non-essential words, and it keeps single terms or phrases that appear to be the subject or object of a sentence.

ResumenSummary

En este artículo, ha aprendido los conceptos y el flujo de trabajo de la extracción de frases clave mediante Text Analytics de Cognitive Services.In this article, you learned concepts and workflow for key phrase extraction by using Text Analytics in Cognitive Services. En resumen:In summary:

  • Key phrase extraction API está disponible para los idiomas seleccionados.Key phrase extraction API is available for selected languages.
  • Los documentos JSON del cuerpo de la solicitud incluyen un identificador, un texto y el código de idioma.JSON documents in the request body include an ID, text, and language code.
  • La solicitud POST se realiza a un punto de conexión /keyphrases, con una clave de acceso y un punto de conexión personalizados, que son válidos para la suscripción.POST request is to a /keyphrases endpoint, using a personalized access key and an endpoint that is valid for your subscription.
  • La salida de la respuesta, que consta de palabras clave y frases para cada id. de documento, se puede transmitir a cualquier aplicación que acepte JSON, incluidas Microsoft Office Excel y Power BI, por nombrar algunas.Response output, which consists of key words and phrases for each document ID, can be streamed to any app that accepts JSON, including Microsoft Office Excel and Power BI, to name a few.

Consulte tambiénSee also

Introducción a Text AnalyticsPreguntas más frecuentes (FAQ)Text Analytics overview Frequently asked questions (FAQ)
Página del producto de Text AnalyticsText Analytics product page

Pasos siguientesNext steps