Análisis de texto (API REST de Azure AI Search)

Artículo
11/13/2023

La API de análisis muestra cómo un analizador descompone el texto en tokens. Está pensado para pruebas interactivas para que pueda ver cómo un analizador determinado tokenizará una entrada de cadena.

POST https://[service name].search.windows.net/indexes/[index name]/analyze?api-version=[api-version]
    Content-Type: application/json
    api-key: [admin key]

Para especificar un analizador usado durante la indexación y la ejecución de consultas, establezca la propiedad analyzer en los campos de cadena del índice.

Parámetros de identificador URI

Parámetro	Descripción
nombre del servicio	Necesario. Establézcalo en el nombre único definido por el usuario del servicio de búsqueda.
nombre de índice	Necesario. El URI de solicitud especifica el nombre del índice que contiene el campo que desea analizar.
api-version	Necesario. La versión estable actual es `api-version=2020-06-30`. Consulte Versiones de API para obtener más versiones.

Encabezados de solicitud

En la siguiente tabla se describen los encabezados de solicitud obligatorios y opcionales.

Campos Descripción

Content-Type Necesario. Establézcalo en application/json

api-key Opcional si usa roles de Azure y se proporciona un token de portador en la solicitud; de lo contrario, se requiere una clave. Una clave de API es una cadena única generada por el sistema que autentica la solicitud en el servicio de búsqueda. Las solicitudes del analizador deben incluir un api-key encabezado establecido en la clave de administración (en lugar de una clave de consulta). Consulte Conexión a Azure AI Search mediante la autenticación de claves para más información.

Campos	Descripción
Content-Type	Necesario. Establézcalo en `application/json`
api-key	Opcional si usa roles de Azure y se proporciona un token de portador en la solicitud; de lo contrario, se requiere una clave. Una clave de API es una cadena única generada por el sistema que autentica la solicitud en el servicio de búsqueda. Las solicitudes del analizador deben incluir un `api-key` encabezado establecido en la clave de administración (en lugar de una clave de consulta). Consulte Conexión a Azure AI Search mediante la autenticación de claves para más información.

Cuerpo de la solicitud

{
  "text": "Text to analyze",
  "analyzer": "analyzer_name"
}

{
  "text": "Text to analyze",
  "tokenizer": "tokenizer_name",
  "tokenFilters": (optional) [ "token_filter_name" ],
  "charFilters": (optional) [ "char_filter_name" ]
}

Los analyzer_name, tokenizer_nametoken_filter_name y char_filter_name deben ser nombres válidos de analizadores predefinidos o personalizados, tokenizadores, filtros de token y filtros char para el índice. Para más información sobre el proceso de análisis léxico, consulte Análisis en Azure AI Search.

Response

Código de estado: al obtener una respuesta correcta, se visualiza 200 Correcto.

El cuerpo de la respuesta está en el formato siguiente:

    {
      "tokens": [
        {
          "token": string (token),
          "startOffset": number (index of the first character of the token),
          "endOffset": number (index of the last character of the token),
          "position": number (position of the token in the input text)
        },
        ...
      ]
    }

Ejemplos

El cuerpo de la solicitud incluye la cadena y el analizador que desea usar.

     {
       "text": "The quick brown fox",
       "analyzer": "standard"
     }

La respuesta muestra los tokens emitidos por el analizador para la cadena que proporcione.

{
    "tokens": [
        {
            "token": "the",
            "startOffset": 0,
            "endOffset": 3,
            "position": 0
        },
        {
            "token": "quick",
            "startOffset": 4,
            "endOffset": 9,
            "position": 1
        },
        {
            "token": "brown",
            "startOffset": 10,
            "endOffset": 15,
            "position": 2
        },
        {
            "token": "fox",
            "startOffset": 16,
            "endOffset": 19,
            "position": 3
        }
    ]
}