Inicio rápido: Creación de un índice de búsqueda en Azure Portal

En esta guía de inicio rápido de Azure AI Search, cree su primer índice de búsqueda mediante el Asistente para importar datos y un origen de datos de ejemplo integrado que consta de datos ficticios del hotel hospedados por Microsoft. El asistente le guía por la creación de un índice de búsqueda sin código para ayudarle a escribir consultas interesantes en cuestión de minutos.

El asistente crea varios objetos en el servicio de búsqueda ( índice que se puede buscar), pero también una conexión de indexador y origen de datos para la recuperación de datos automatizada. Al final de este inicio rápido, revisamos cada objeto.

Nota:

El Asistente para importación de datos incluye opciones para OCR, traducción de texto y otros enriquecimientos de IA que no se tratan en este inicio rápido. Para ver un tutorial similar que se centra en el enriquecimiento con IA, consulte Inicio rápido: Creación de un conjunto de aptitudes en Azure Portal.

Requisitos previos

Búsqueda de espacio

Muchos clientes comienzan con el servicio gratis. El nivel Gratis está limitado a tres índices, tres orígenes de datos y tres indexadores. Asegúrese de que tiene espacio para elementos adicionales antes de empezar. Este inicio rápido crea uno de cada objeto.

Compruebe la pestaña Uso de información general > del servicio para ver cuántos índices, indexadores y orígenes de datos ya tiene.

Screenshot of the Overview page for an Azure AI Search service instance in the Azure portal, showing the number of indexes, indexers, and data sources.

Inicio del asistente

  1. Inicie sesión en Azure Portal con su cuenta de Azure y vaya al servicio de Azure AI Search.

  2. En la página Información general , seleccione Importar datos para iniciar el asistente.

    Screenshot that shows how to open the Import data wizard in the Azure portal.

Creación y carga de un índice

En esta sección, cree y cargue un índice en cuatro pasos.

Conectarse a un origen de datos

El asistente crea una conexión de origen de datos a datos de ejemplo hospedados por Microsoft en Azure Cosmos DB. Estos datos de ejemplo se recuperan a través de una conexión interna. No necesita su propia cuenta de Azure Cosmos DB ni archivos de origen para ejecutar este inicio rápido.

  1. En Conectar a los datos, expanda la lista desplegable Origen de datos y seleccione Ejemplos.

  2. En la lista de ejemplos integrada, seleccione hotels-sample.

    Screenshot that shows how to select the hotels-sample data source in the Import data wizard.

  3. Seleccione Siguiente: Agregar aptitudes cognitivas (opcional) para continuar.

Omitir la configuración de aptitudes cognitivas

El Asistente para la importación de datos admite la creación de un conjunto de aptitudes y el enriquecimiento con IA en la indexación.

  1. En este inicio rápido, omita las opciones de configuración de enriquecimiento con IA en la pestaña Agregar aptitudes cognitivas.

  2. Seleccione Saltar a: Personalizar índice de destino para continuar.

    Screenshot that shows how to Skip to the Customize target index tab in the Import data wizard.

Sugerencia

¿Te interesa el enriquecimiento con IA? Pruebe este inicio rápido: Creación de un conjunto de aptitudes en Azure Portal

Configuración del índice

El asistente deduce un esquema para el índice integrado hotels-sample. Siga estos pasos para configurar el índice:

  1. Acepte los valores generados por el sistema para el Nombre de índice (hotels-sample-index) y el campo de Clave (HotelId).

  2. Acepte los valores generados por el sistema para todos los atributos de campo.

    Importante

    Si vuelve a ejecutar el asistente y usa un origen de datos hotels-sample existente, el índice no se configurará con los atributos predeterminados. En las siguientes importaciones tendrá que seleccionar los atributos manualmente.

  3. Seleccione Siguiente: Crear un indizador para continuar.

Screenshot that shows the generated index definition for the hotels-sample data source in the Import data wizard.

Como mínimo, el índice requiere un Nombre de índice y un conjunto de Campos. Uno de los campos debe estar marcado como la clave de documento para identificar de forma única cada documento. El valor siempre es una cadena. El asistente examina los campos de cadena únicos y elige uno para la clave.

Cada campo tiene un nombre, un tipo de datos y atributos que controlan cómo usar el campo en el índice de búsqueda. Las casillas habilitan o deshabilitan los atributos siguientes:

  • Recuperable: campos devueltos en una respuesta de consulta.
  • Filtrable: campos que aceptan una expresión de filtro.
  • Ordenable: campos que aceptan una expresión orderby.
  • Facetable: campos usados en una estructura de navegación por facetas.
  • Buscable: campos usados en la búsqueda de texto completo. Las cadenas permiten realizar búsquedas. Los campos numéricos y los booleanos a menudo se marcan como no utilizables en búsquedas.

Las cadenas tienen los atributos Recuperable y Permite búsquedas. Los enteros tienen los atributos Recuperables, Filtrable, Ordenable y Clasificable por facetas.

Los atributos afectan al almacenamiento. Los campos filtrables consumen almacenamiento adicional, pero Recuperable no. Para obtener más información, consulte Ejemplo que muestra las implicaciones de almacenamiento de los atributos y proveedores de sugerencias.

Si quiere autocompletar o consultas sugeridas, especifique analizadores de lenguaje o proveedores de sugerencias.

Configuración y ejecución del indexador

El último paso configura y ejecuta el indexador. Este objeto define un proceso ejecutable. El origen de datos, el índice y el indexador se crean en este paso.

  1. Acepte el valor generado por el sistema para el Nombre del indizador (hotels-sample-indexer).

  2. Para este inicio rápido, use la opción predeterminada para ejecutar el indizador una vez, inmediatamente. Los datos hospedados son estáticos, por lo que no hay ningún seguimiento de cambios habilitado para él.

  3. Seleccione Enviar para crear y ejecutar simultáneamente el indexador.

    Screenshot that shows how to configure the indexer for the hotels-sample data source in the Import data wizard.

Supervisión del progreso del indizador

Puede supervisar la creación del indexador o el índice en el portal. En la página de información general del servicio se proporcionan vínculos a los recursos creados en el servicio Azure AI Search.

  1. A la izquierda, seleccione Indexadores.

    Screenshot that shows the creation of the indexer in progress in the Azure portal.

    Los resultados de la página pueden tardar unos minutos en actualizarse en Azure Portal. Debería ver el indizador recién creado en la lista con el estado En curso o Correcto. La lista también muestra el número de documentos indexados.

Comprobación de los resultados del índice de búsqueda

  1. A la izquierda, seleccione Índices.

  2. Seleccione hotels-sample-index.

    Espere a que se actualice la página de Azure Portal. Debería ver el índice con un recuento de documentos y un tamaño de almacenamiento.

    Screenshot of the Indexes list on the Azure AI Search service dashboard in the Azure portal.

  3. Seleccione la pestaña Campos para ver el esquema de índice.

    Compruebe qué campos son Filtrables o Ordenables para saber qué consultas escribir.

    Screenshot that shows the schema definition for an index in the Azure AI Search service in the Azure portal.

Agregar o cambiar campos

En la pestaña Campos , puede crear un nuevo campo mediante Agregar campo con un nombre, un tipo de datos admitido y atribución.

Cambiar los campos existentes es más difícil. Los campos existentes tienen una representación física en el índice para que no se puedan modificar, ni siquiera en el código. Para cambiar fundamentalmente un campo existente, debe crear un nuevo campo que reemplace el original. Otras construcciones, como perfiles de puntuación y opciones de CORS, se pueden agregar a un índice en cualquier momento.

Para saber claramente qué puede y qué no puede modificar durante el diseño del índice, dedique un minuto a ver las opciones de definición de índice. Las opciones atenuadas de la lista de campos indican valores que no se pueden modificar ni eliminar.

Consulta con el Explorador de búsqueda

Ahora tiene un índice de búsqueda que se puede consultar con el Explorador de búsqueda. El Explorador de búsqueda envía llamadas REST que se ajustan a la API REST search POST. La herramienta admite la sintaxis de consulta simplificada y la sintaxis de consultas completa de Lucene.

  1. En la pestaña Explorador de búsqueda , escriba texto en el que buscar.

    Screenshot that shows how to enter and run a query in the Search Explorer tool.

  2. Use el Mini-map para saltar rápidamente a áreas novisibles de la salida.

    Screenshot that shows long results for a query in the Search Explorer tool and the mini-map.

  3. Para especificar la sintaxis, cambie a la vista JSON.

    Screenshot of the JSON view selector.

Consultas de ejemplo para el índice de ejemplo de hoteles

En los ejemplos siguientes se supone que la vista JSON y la versión de la API REST 2023-11-01.

Ejemplos de filtro

El estacionamiento, las etiquetas, la fecha de renovación, la clasificación y la ubicación son filtrables.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "Rating gt 4"
}

Los filtros booleanos asumen "true" de forma predeterminada.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "ParkingIncluded"
}

La búsqueda geoespacial se basa en filtros. La geo.distance función filtra todos los resultados de los datos posicionales en función de las coordenadas y geography'POINT especificadasLocation. La consulta busca hoteles que están a menos de 5 kilómetros de las coordenadas de longitud y latitud -122.12 47.67, que es "Redmond, Washington, EE. UU.". La consulta muestra el número total de coincidencias &$count=true con los nombres de hotel y las ubicaciones de direcciones.

{
    "search": "*",
    "select": "HotelName, Address/City, Address/StateProvince",
    "count": true,
    "top": 10,
    "filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}

Ejemplos de sintaxis completa de Lucene

La sintaxis predeterminada es una sintaxis simple, pero si desea una búsqueda aproximada o expresiones regulares o de aumento de términos, especifique la sintaxis completa.

{
    "queryType": "full",
    "search": "seatle~",
    "select": "HotelId, HotelName,Address/City, Address/StateProvince",
    "count": true
}

De manera predeterminada, los términos de consulta mal escritos, como seatle para Seattle, no devuelven coincidencias en una búsqueda normal. El parámetro queryType=full invoca el analizador de consultas de Lucene completo, que admite el operando ~ de tilde. Cuando estos parámetros están presentes, la consulta realiza una búsqueda aproximada de la palabra clave especificada. La consulta busca resultados coincidentes junto con los resultados similares, pero no una coincidencia exacta con la palabra clave.

Dedique un minuto a probar algunas de estas consultas de ejemplo para el índice. Para más información sobre las consultas, consulte Consulta en Azure AI Search.

Limpieza de recursos

Cuando trabaje con su propia suscripción, al final de un proyecto es una buena idea identificar si todavía se necesitan los recursos que ha creado. Los recursos que se dejan en ejecución pueden costarle mucho dinero. Puede eliminar los recursos de forma individual o eliminar el grupo de recursos para eliminar todo el conjunto de recursos.

Puede buscar y administrar los recursos del servicio en Azure Portal, en Todos los recursos o Grupos de recursos en el panel de navegación izquierdo.

Si usa un servicio gratuito, recuerde que está limitado a tres índices, indizadores y orígenes de datos. Puede eliminar elementos individuales en Azure Portal para mantenerse por debajo del límite.

Pasos siguientes

Pruebe un asistente de Azure Portal para generar una aplicación web lista para usar que se ejecute en un explorador. Use este asistente en el índice pequeño que acaba de crear en este inicio rápido, o bien use uno de los conjuntos de datos de ejemplo integrados para obtener una búsqueda más enriquecida.