Share via


Carga de datos en un índice de búsqueda en Azure AI Search

En este artículo se explica cómo importar, actualizar y administrar contenido en un índice de búsqueda predefinido. En Azure AI Search, primero se crea un índice de búsqueda, con la importación de datos como segundo paso. La excepción es el Asistente para importar datos y las canalizaciones del indexador, que crean y cargan un índice en un flujo de trabajo.

Un servicio de búsqueda importa e indexa texto y vectores en JSON, que se usan en escenarios de búsqueda de texto completo, vector de búsqueda, búsqueda híbrida y minería de conocimiento. El contenido de texto se puede obtener a partir de campos alfanuméricos en el origen de datos externo, metadatos que son útiles en escenarios de búsqueda o contenido enriquecido creado por un conjunto de aptitudes (las aptitudes pueden extraer o deducir descripciones textuales de imágenes y contenido no estructurado). El contenido vectorial se vectoriza mediante un modelo de inserción externo o vectorización integrada (versión preliminar).

Una vez indexados los datos, las estructuras de datos físicos del índice se bloquean. Para obtener instrucciones sobre lo que se puede y no se puede cambiar, consulte Eliminación y recompilación de índices.

La indexación no es un proceso en segundo plano. Los servicios de búsqueda equilibrarán la indexación y las cargas de trabajo de consulta, pero si la latencia de las consultas es demasiado alta, puede agregar capacidad o identificar períodos de baja actividad de consulta para cargar un índice.

Carga de documentos

Los servicios de búsqueda aceptan documentos JSON que se ajustan al esquema de índice.

Puede preparar estos documentos usted mismo, pero si el contenido reside en un origen de datos compatible, la ejecución de un indexador o del Asistente para la importación de datos puede automatizar la recuperación de documentos, la serialización de JSON y la indexación.

En Azure Portal, use los asistentes para importar datos para crear y cargar índices en un flujo de trabajo sin problemas. Si desea cargar un índice existente, elija un enfoque alternativo.

  1. Inicie sesión en Azure Portal con su cuenta de Azure.

  2. Encuentre el servicio de búsqueda y, en la página Información general, seleccione Importar datos o Importar y vectorizar datos en la barra de comandos para crear y rellenar un índice de búsqueda. Puede seguir estos vínculos para revisar el flujo de trabajo: Inicio rápido: crear un índice de Búsqueda de Azure AI e Inicio rápido: vectorización integrada (versión preliminar).

    Captura de pantalla del comando para importar datos

Si los indexadores ya están definidos, puede restablecer y ejecutar un indexador desde Azure Portal, lo que resulta útil si va a agregar campos de forma incremental. El restablecimiento obliga al indexador a volver a empezar, seleccionando todos los campos de todos los documentos de origen.

Eliminación de documentos huérfanos

Azure AI Search admite operaciones de nivel de documento para que pueda buscar, actualizar y eliminar un documento concreto de forma aislada. En el ejemplo siguiente se muestra cómo eliminar un documento. En un servicio de búsqueda, los documentos no están relacionados, por lo que la eliminación de uno de ellos no tendrá ningún impacto en el resto del índice.

  1. Identifique qué campo es la clave del documento. En el portal, puede ver los campos de cada índice. Las claves del documento son campos de cadena y se indican con un icono de una llave, con el fin de que sean más fáciles de detectar.

  2. Compruebe los valores del campo de clave del documento: search=*&$select=HotelId. Una cadena simple es sencilla, pero si el índice usa un campo codificado en base 64 o si se generaron documentos de búsqueda a partir de una configuración parsingMode, es posible que esté trabajando con valores con los que no está familiarizado.

  3. Consulte el documento para comprobar el valor del identificador del documento y examinar su contenido antes de eliminarlo. Especifique la clave o el identificador de documento en la solicitud. En los ejemplos siguientes se muestra una cadena sencilla del índice de ejemplo Hotels y una cadena codificada en base 64 para la clave metadata_storage_path del índice cog-search-demo.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Elimine el documento para quitarlo del índice de búsqueda.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Consulte también