¿Qué es Text Analytics API?What is the Text Analytics API?

API Text Analytics es un servicio basado en la nube que proporciona un procesamiento avanzado de idioma natural sobre texto sin formato e incluye cuatro funciones principales: análisis de sentimiento, extracción de frases clave, detección de lenguaje y reconocimiento de entidades de caracteres.The Text Analytics API is a cloud-based service that provides advanced natural language processing over raw text, and includes four main functions: sentiment analysis, key phrase extraction, language detection, and named entity recognition.

La API forma parte de Azure Cognitive Services, una colección de algoritmos de aprendizaje automático y de inteligencia artificial en la nube para los proyectos de desarrollo.The API is a part of Azure Cognitive Services, a collection of machine learning and AI algorithms in the cloud for your development projects.

El análisis de texto puede significar diferentes cosas, pero en Cognitive Services, Text Analytics API proporciona cuatro tipos de análisis, que se describen a continuación.Text analysis can mean different things, but in Cognitive Services, the Text Analytics API provides four types of analysis as described below. Puede usar estas características con la API de REST o la biblioteca cliente.You can use these features with the REST API, or the client library.

Análisis de sentimientoSentiment Analysis

Use el análisis de sentimiento para averiguar qué piensan los clientes de su marca o de un tema concreto mediante el análisis de texto sin formato, con el fin de obtener pistas acerca de si sus opiniones son positivas o negativas.Use sentiment analysis to find out what customers think of your brand or topic by analyzing raw text for clues about positive or negative sentiment. Esta API devuelve una puntuación de la opción, que oscila entre 0 y 1, con respecto a cada documento, donde 1 es la más positiva.This API returns a sentiment score between 0 and 1 for each document, where 1 is the most positive.
Los modelos de análisis se entrenan previamente con una gran cantidad de cuerpo de texto y tecnologías de idioma natural de Microsoft.The analysis models are pretrained using an extensive body of text and natural language technologies from Microsoft. Para idiomas seleccionados, la API puede analizar y puntuar cualquier texto sin formato que se proporcione, y devolver los resultados directamente a la aplicación que realiza la llamada.For selected languages, the API can analyze and score any raw text that you provide, directly returning results to the calling application.

Extracción de frases claveKey Phrase Extraction

Extracción automática de las frases clave para identificar rápidamente los puntos principales.Automatically extract key phrases to quickly identify the main points. Por ejemplo, si el texto de entrada es "La comida estaba deliciosa y el personal era maravilloso", la API devuelve los principales puntos de conversación: "comida" y "personal maravilloso".For example, for the input text "The food was delicious and there were wonderful staff", the API returns the main talking points: "food" and "wonderful staff".

Detección de idiomasLanguage Detection

Puede detectar en qué idioma está escrito el texto de entrada y utilizar un código de idioma único para informar acerca de cada documento enviado en la solicitud para una amplia gama de idiomas, variantes, dialectos y algunos idiomas regionales o culturales.You can detect which language the input text is written in and report a single language code for every document submitted on the request in a wide range of languages, variants, dialects, and some regional/cultural languages. El código de idioma se empareja con una puntuación que indica la intensidad de esta.The language code is paired with a score indicating the strength of the score.

Reconocimiento de entidades con nombreNamed Entity Recognition

Identifique y clasifique las entidades en el texto como personas, lugares, organizaciones, fecha y hora, cantidades, porcentajes, divisas, etc.Identify and categorize entities in your text as people, places, organizations, date/time, quantities, percentages, currencies, and more. Las entidades más conocidas también se reconocen y vinculan a más información en la web.Well-known entities are also recognized and linked to more information on the web.

Uso de contenedoresUse containers

Use los contenedores de Text Analytics para extraer frases clave, detectar el idioma y analizar opiniones localmente, mediante la instalación de contenedores de Docker estándar más cercanos a los datos.Use the Text Analytics containers to extract key phrases, detect language, and analyze sentiment locally, by installing standardized Docker containers closer to your data.

Flujo de trabajo típicoTypical workflow

El flujo de trabajo es sencillo: se envían datos para su análisis y se controla el resultado en el código.The workflow is simple: you submit data for analysis and handle outputs in your code. Los analizadores se consumen tal cual, sin configuración ni personalización adicionales.Analyzers are consumed as-is, with no additional configuration or customization.

  1. Cree un recurso de Azure para Text Analytics.Create an Azure resource for Text Analytics. Después, obtenga la clave generada para autenticar las solicitudes.Afterwards, get the key generated for you to authenticate your requests.

  2. Formule una solicitud en JSON que contenga los datos como texto sin estructura.Formulate a request containing your data as raw unstructured text, in JSON.

  3. Publique la solicitud en el punto de conexión establecido durante el registro y anexe el recurso deseado: análisis de sentimiento, extracción de frases clave, detección de idioma o identificación de entidad de caracteres.Post the request to the endpoint established during sign-up, appending the desired resource: sentiment analysis, key phrase extraction, language detection, or named entity recognition.

  4. Transmita la respuesta en secuencias o almacénela localmente.Stream or store the response locally. En función de cuál sea la solicitud, los resultados son una puntuación de opinión, una colección de frases clave extraídas o un código de idioma.Depending on the request, results are either a sentiment score, a collection of extracted key phrases, or a language code.

La salida se devuelve como documento JSON individual, con los resultados de cada documento de texto que ha publicado, en función del identificador.Output is returned as a single JSON document, with results for each text document you posted, based on ID. Posteriormente puede analizar, visualizar o clasificar los resultados hasta convertirlos en conclusiones que requieren que se realice alguna acción.You can subsequently analyze, visualize, or categorize the results into actionable insights.

No se almacenan datos en su cuenta.Data is not stored in your account. Las operaciones que realiza Text Analytics API no tienen estado, lo que significa que se procesa el texto que se proporciona y los resultados se devuelven de inmediato.Operations performed by the Text Analytics API are stateless, which means the text you provide is processed and results are returned immediately.

Text Analytics para varios niveles de experiencia de programaciónText Analytics for multiple programming experience levels

Puede empezar a usar Text Analytics API en sus procesos, aunque no tenga mucha experiencia en programación.You can start using the Text Analytics API in your processes, even if you don't have much experience in programming. Use estos tutoriales para averiguar cómo puede usar la API para analizar texto de distintas formas que se ajusten a su nivel de experiencia.Use these tutorials to learn how you can use the API to analyze text in different ways to fit your experience level.

Idiomas compatiblesSupported languages

Esta sección se ha movido a otro artículo para facilitar su detección.This section has been moved to a separate article for better discoverability. Para ver este contenido, consulte Compatibilidad de idiomas para Text Analytics API.Refer to Supported languages in the Text Analytics API for this content.

Límites de datosData limits

Todos los puntos de conexión de Text Analytics API aceptan datos de texto sin formato.All of the Text Analytics API endpoints accept raw text data. El límite actual es de 5120 caracteres para cada documento; si necesita analizar documentos mayores, puede dividirlos en fragmentos más pequeños.The current limit is 5,120 characters for each document; if you need to analyze larger documents, you can break them up into smaller chunks.

LímiteLimit ValueValue
Tamaño máximo de un documento individualMaximum size of a single document 5120 caracteres, medidos por StringInfo.LengthInTextElements.5,120 characters as measured by StringInfo.LengthInTextElements.
Tamaño máximo de la solicitud completaMaximum size of entire request 1 MB1 MB
Número máximo de documentos de una solicitudMaximum number of documents in a request 1000 documentos1,000 documents

El límite de velocidad variará en función del plan de tarifa.Your rate limit will vary with your pricing tier.

NivelTier Solicitudes por segundoRequests per second Solicitudes por minutoRequests per minute
S / Varios serviciosS / Multi-service 10001000 10001000
S0 / F0S0 / F0 100100 300300
S1S1 200200 300300
S2S2 300300 300300
S3S3 500500 500500
S4S4 10001000 10001000

Las solicitudes se miden por separado para cada característica de Text Analytics.Requests are measured for each Text Analytics feature separately. Por ejemplo, puede enviar el número máximo de solicitudes correspondiente al plan de tarifa a cada característica, al mismo tiempo.For example, you can send the maximum number of requests for your pricing tier to each feature, at the same time.

Codificación UnicodeUnicode encoding

Text Analytics API utiliza la codificación Unicode para la representación del texto y los cálculos del número de caracteres.The Text Analytics API uses Unicode encoding for text representation and character count calculations. Las solicitudes se pueden enviar tanto en UTF-8 como en UTF-16 sin que haya diferencias apreciables en el número de caracteres.Requests can be submitted in both UTF-8 and UTF-16 with no measurable differences in the character count. Los puntos de código Unicode se utilizan como heurística de longitud de caracteres y se consideran equivalentes a efectos de los límites de datos del análisis de texto.Unicode codepoints are used as the heuristic for character length and are considered equivalent for the purposes of text analytics data limits. Si usa StringInfo.LengthInTextElements para obtener el número de caracteres, está empleando el mismo método que nosotros para medir el tamaño de los datos.If you use StringInfo.LengthInTextElements to get the character count, you are using the same method we use to measure data size.

Pasos siguientesNext steps