Inicio rápido: Creación de un índice de Azure Cognitive Search en Azure Portal

Cree su primer índice de búsqueda mediante el asistente para importar datos y un origen de datos de ejemplo integrado que consta de datos de hoteles ficticios. El asistente le guía en la creación de un índice de búsqueda (hotels-sample-index) para que pueda escribir consultas interesantes en cuestión de minutos.

Aunque no usará las opciones de este inicio rápido, el asistente incluye una página de enriquecimiento con IA que permite extraer texto y la estructura de archivos de imagen y texto no estructurado. Para ver un tutorial similar que incluya el enriquecimiento con IA, consulte los inicios rápidos sobre traducción de texto y conjuntos de aptitudes de entidades o conjuntos de aptitudes de imágenes OCR.

Requisitos previos

Búsqueda de espacio

Muchos clientes comienzan con el servicio gratis. El nivel Gratis está limitado a tres índices, tres orígenes de datos y tres indexadores. Asegúrese de que tiene espacio para elementos adicionales antes de empezar. Este tutorial crea uno de cada objeto.

Consulte la página de información general del servicio para conocer el número de índices, indexadores y orígenes de datos que ya tiene.

Lists of indexes, indexers, and datasources

Creación de un índice y carga de datos

Las consultas de búsqueda recorren en iteración un índice que contiene los datos de búsqueda, los metadatos y las construcciones adicionales que optimizan determinados comportamientos de la búsqueda.

En este tutorial, se usa un conjunto de datos de ejemplo integrado que se puede rastrear mediante un indexador mediante el Asistente para la importación de datos. Un indexador es un rastreador específico del origen que puede leer los metadatos y el contenido de los orígenes de datos de Azure admitidos. Normalmente, los indexadores se usan mediante programación, pero, en el portal, tiene acceso a ellos a través del Asistente para la importación de datos.

Paso 1: Inicio del Asistente para la importación de datos y creación de un origen de datos

  1. Inicie sesión en Azure Portal con su cuenta de Azure.

  2. Busque su servicio de búsqueda y, en la página de información general, haga clic en Importar datos en la barra de comandos para crear y rellenar un índice de búsqueda.

    Screenshot of the Import data command

  3. En el asistente, haga clic en Conectar a los datos>Ejemplos>hotels-sample. Este origen de datos está integrado. Si creó su propio origen de datos, deberá especificar un nombre, el tipo y la información de conexión. Una vez creado, se convierte en un "origen de datos existente" que se puede reutilizar en otras operaciones de importación.

    Select sample dataset

  4. Continúe en la siguiente página.

Paso 2: omitir la página "Enriquecer contenido"

El asistente admite la creación de una canalización de enriquecimiento con inteligencia artificial para incorporar los algoritmos de inteligencia artificial de Cognitive Services a la indexación.

Omitiremos este paso por ahora y pasaremos directamente a Personalización del índice de destino.

Skip cognitive skill step

Sugerencia

Puede recorrer un ejemplo de indización con IA en una guía de inicio rápido o tutorial.

Paso 3: Configuración del índice

Para el índice hotels-sample integrado, el esquema de índice predeterminado ya está definido. A excepción de algunos ejemplos de filtros avanzados, las consultas de la documentación y los ejemplos que tienen como destino el índice hotels-sample se ejecutarán en esta definición de índice:

Generated hotels index

Normalmente, la creación del índice en un ejercicio basado en código se completa antes de cargar datos. El asistente para importar datos condensa estos pasos mediante la generación de un índice básico para cualquier origen de datos que pueda rastrear. Como mínimo, un índice necesita un nombre y una colección de campos, uno de los cuales debe estar marcado como la clave de documento para identificar de forma única cada documento. Además, puede especificar analizadores de lenguaje o proveedores de sugerencias si quiere que las consultas se sugieran o completen automáticamente.

Los campos tienen tipos de datos y atributos. Las casillas de la parte superior son atributos de índice que controlan cómo se usa el campo.

  • Retrievable significa que se muestra en la lista de resultados de búsqueda. Puede desactivar esta casilla para marcar los campos individuales como fuera de los resultados de búsqueda, por ejemplo, para los campos que se usan solo en expresiones de filtro.
  • Key es el identificador único del documento. Siempre es una cadena, y es necesario.
  • Filterable, Sortable y Facetable determinan si se usan campos en un filtro, una ordenación o una estructura de navegación de facetas.
  • Searchable significa que se incluye un campo en la búsqueda de texto completo. Las cadenas permiten realizar búsquedas. Los campos numéricos y los booleanos a menudo se marcan como no utilizables en búsquedas.

Los requisitos de almacenamiento no varían como resultado de la selección. Por ejemplo, si establece el atributo Retrievable en varios campos, los requisitos de almacenamiento no aumentan.

De forma predeterminada, el asistente busca en el origen de datos identificadores únicos como base para el campo de clave. Las cadenas tienen los atributos Recuperable y Permite búsquedas. Los enteros tienen los atributos Recuperable, Filterable, Ordenable y Clasificable.

  1. Acepte los valores predeterminados.

    Si vuelve a ejecutar el asistente con un origen de datos de hotels existente, el índice no se configurará con los atributos predeterminados. En las siguientes importaciones tendrá que seleccionar los atributos manualmente.

  2. Continúe en la siguiente página.

Paso 4: Configuración del indexador

Aún en el Asistente para la importación de datos, haga clic en Indexador>Nombre y escriba un nombre para el indexador.

Este objeto define un proceso ejecutable. Podría colocarlo en una programación periódica; pero, por ahora, use la opción predeterminada para ejecutar el indexador una vez, inmediatamente.

Haga clic en Enviar para crear y ejecutar simultáneamente el indexador.

hotels indexer

Supervisión de progreso

El asistente debe llevarle a la lista de indexadores, donde puede supervisar el progreso. En cuanto a la navegación automática, vaya a la página de información general y haga clic en la pestaña Indizadores.

El portal puede tardar unos minutos en actualizar la página, pero debería ver el indexador recién creado en la lista, con el estado "en curso" o correcto, junto con el número de documentos indexados.

Indexer progress message

Ver el índice

La página de información general del servicio proporciona vínculos a los recursos creados en el servicio de Azure Cognitive Search. Para ver el índice que acaba de crear, haga clic en Índices en la lista de vínculos.

Espere a que se actualice la página del portal. Después de unos minutos, debería ver el índice con un recuento de documentos y un tamaño de almacenamiento.

Indexes list on the service dashboard

En esta lista, puede hacer clic en el índice de hotels-sample que acaba de crear y ver el esquema de índice y, opcionalmente, agregar nuevos campos.

La pestaña Campos muestra el esquema de índice. Si está escribiendo consultas y necesita comprobar si un campo se puede filtrar u ordenar, en esta pestaña se muestran los atributos.

Desplácese hasta la parte inferior de la lista para especificar un nuevo campo. Aunque siempre se puede crear un nuevo campo, en la mayoría de los casos no se pueden cambiar los campos existentes. Los campos existentes tienen una representación física en el servicio de búsqueda y, por tanto, no se pueden modificar, ni siquiera en el código. Para cambiar radicalmente un campo, cree otro índice y elimine el original.

sample index definition

Otras construcciones, como los perfiles de puntuación y las opciones de CORS, pueden agregarse en cualquier momento.

Para saber claramente qué puede y qué no puede modificar durante el diseño del índice, tómese un minuto para ver las opciones de definición de índice. Las opciones atenuadas son un indicador de que un valor no se puede modificar o eliminar.

Realización de consultas con el Explorador de búsqueda

Ahora tiene un índice de búsqueda que se puede consultar mediante el Explorador de búsqueda.

El Explorador de búsqueda envía llamadas REST que se ajustan a Search Documents API. La herramienta admite la sintaxis de consulta simplificada y el analizador de consultas completo de Lucene.

  1. Seleccione el Explorador de búsqueda en la barra de comandos.

    Search explorer command

  2. En la lista desplegable Índice, elija "hotels-sample-index".

    Index and API commands

  3. En la barra de búsqueda, pegue una cadena de consulta de los ejemplos siguientes y seleccione Buscar.

    Query string and search button

Consultas de ejemplo

Todas las consultas de esta sección están diseñadas para el Explorador de búsqueda y el índice de ejemplo de Hoteles. Los resultados se devuelven como documentos JSON detallados. Todos los campos marcados como "recuperables" en el índice pueden aparecer en los resultados. Para más información sobre las consultas, consulte Consultas de Azure Cognitive Search.

Consultar Descripción
search=spa Consulta de texto completo simple con N resultados superiores. El parámetro search= se usa para la búsqueda con una palabra clave; en este caso, se devuelven los datos de los hoteles que contienen spa en cualquier campo que permite en el documento.
search=beach &$filter=Rating gt 4 Consulta filtrada. En este caso, las clasificaciones mayores de 4.
search=spa &$select=HotelName,Description,Tags &$count=true &$top=10 Consulta con parámetros. El símbolo & se usa para anexar parámetros de búsqueda, que pueden especificarse en cualquier orden.
El parámetro $select devuelve un subconjunto de campos para obtener unos resultados de búsqueda más concisos.
El parámetro $count=true devuelve el recuento total de todos los documentos que coinciden con la consulta.
El parámetro $top=10devuelve los 10 documentos mejor clasificados del total. De forma predeterminada, Azure Cognitive Search devuelve las 50 mayores coincidencias. Puede aumentar o disminuir la cantidad mediante este parámetro.
search=* &facet=Category &$top=2 Consulta de faceta, que se usa para devolver un recuento agregado de los documentos que coincidan con el valor de faceta que proporcione. En una búsqueda vacía o no calificada, se representan todos los documentos. En el índice de hoteles, el campo Categoría se marca como "clasificable".
search=spa &facet=Rating Faceta en valores numéricos. Esta consulta es una faceta para la clasificación, en una búsqueda de texto de "spa". El término "Clasificación" se puede especificar como una faceta porque el campo está marcado como recuperable, filtrable y aplicable a facetas en el índice, y sus valores numéricos (de 1 a 5) son adecuados para agrupar los resultados por cada valor.
search=beach &highlight=Description &$select=HotelName, Description, Category, Tags Resaltado de referencias. El término "beach" se resaltará cuando aparezca en el campo "Descripción".
search=seatle seguido de
search=seatle~ &queryType=full
Búsqueda aproximada. De forma predeterminada, los términos de consulta mal escritos, como seatle para "Seattle", no devuelven coincidencias en una búsqueda normal. El primer ejemplo no devuelve ningún resultado. Al agregar queryType=full, se invoca el analizador de consultas de Lucene completo, que admite el operando ~ para la búsqueda aproximada.
$filter=geo.distance(Location, geography'POINT(-122.12 47.67)') le 5 &search=* &$select=HotelName, Address/City, Address/StateProvince &$count=true Búsqueda geoespacial. La consulta de ejemplo filtra todos los resultados para los datos posicionales, donde los resultados están a menos de 5 kilómetros de un punto determinado, según lo especificado por las coordenadas de latitud y longitud (en este ejemplo se usa Redmond, Washington, como punto de origen).

Puntos clave

En este tutorial se ha proporcionado una introducción rápida al uso de Azure Cognitive Search desde Azure Portal.

Ha aprendido cómo crear un índice de búsqueda mediante el asistente para importar datos. Ha creado su primer indizador y ha aprendido el flujo de trabajo básico para el diseño de índices.

Mediante el Explorador de búsqueda de Azure Portal, ha aprendido la sintaxis de consulta básica mediante ejemplos prácticos de las funcionalidades clave, como los filtros, el resaltado de referencias, la búsqueda aproximada y la búsqueda geoespacial.

Limpieza de recursos

Cuando trabaje con su propia suscripción, es una buena idea al final de un proyecto identificar si todavía se necesitan los recursos que ha creado. Los recursos que se dejan en ejecución pueden costarle mucho dinero. Puede eliminar los recursos de forma individual o eliminar el grupo de recursos para eliminar todo el conjunto de recursos.

Puede encontrar y administrar recursos en el portal, mediante el vínculo Todos los recursos o Grupos de recursos en el panel de navegación izquierdo.

Si está usando un servicio gratuito, recuerde que está limitado a tres índices, indexadores y orígenes de datos. Puede eliminar elementos individuales en el portal para mantenerse por debajo del límite.

Pasos siguientes

Use un asistente del portal para generar una aplicación web lista para usar que se ejecute en un explorador. Puede probar este asistente en el pequeño índice que acaba de crear, o bien usar uno de los conjuntos de datos de ejemplo integrados, ya que la búsqueda mejorará.