Información general sobre la arquitectura de búsqueda en SharePoint Server

SE APLICA A:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint en Microsoft 365

La arquitectura de búsqueda contiene bases de datos y componentes de búsqueda. La estructuración de la arquitectura de búsqueda depende de dónde desee usar la característica de búsqueda: en la empresa o en sitios de Internet. Cuando cree la arquitectura de búsqueda, debe tener en cuenta aspectos como, por ejemplo, la elevada disponibilidad y la tolerancia a errores, así como el volumen del contenido o la estimación de visualizaciones de página y de consultas por segundo.

Para obtener información sobre las topologías de búsqueda de diferentes casos de uso: vea los diagramas técnicos Arquitecturas del motor de búsqueda Enterprise Search para SharePoint Server 2016 y Arquitecturas de búsqueda de Internet Sites para SharePoint Server 2016.

Introducción a las bases de datos y componentes de búsqueda

En las tablas siguientes se muestra una introducción a todas las bases de datos y componentes de búsqueda disponibles. Para obtener más información sobre el modo en que interactúan las bases de datos y los componentes de búsqueda, consulte el diagrama técnico Search architectures for SharePoint Server 2016 (Arquitecturas de búsqueda para SharePoint Server 2016).

Componentes de búsqueda

Nombre del componente de búsqueda Descripción
Componente de rastreo Rastrea los orígenes de datos para recopilar propiedades rastreadas y metadatos de los elementos rastreados y enviar esta información al componente de procesamiento de contenido.
Componente de procesamiento de contenido Transforma los elementos rastreados y los envía al componente de índice. Este componente también asigna las propiedades rastreadas a las propiedades administradas
Componente de procesamiento de Analytics Lleva a cabo análisis de búsqueda y análisis de uso.
Componente de índice Recibe los elementos procesados del componente de procesamiento de contenido y los escribe en el índice de búsqueda. Este componente también controla las consultas entrantes, recupera la información del índice de búsqueda y devuelve el conjunto de resultados al componente de procesamiento de consultas.
Componente de procesamiento de consulta Analiza las consultas entrantes. Esto ayuda a optimizar la precisión, la recuperación y la relevancia. Las consultas se envían al componente de índice que, a su vez, devuelve un conjunto de resultados de búsqueda para la consulta.
Componente de administración de búsqueda Inicia los procesos de búsqueda del sistema, agrega e inicia nuevas instancias de los componentes de búsqueda.

Bases de datos de búsqueda

Nombre de la base de datos de búsqueda Descripción
Base de datos de rastreo Almacena la información de seguimiento y la información histórica sobre los elementos rastreados como, por ejemplo, direcciones URL y documentos. También almacena información como, por ejemplo, la hora del último rastreo, el Id. del último rastreo y el tipo de actualización (agregación, actualización o eliminación) durante el último rastreo.
Base de datos de vínculo Almacena la información no procesada que extrae el componente de procesamiento de contenido, así como la información de los clics de búsqueda. El componente de procesamiento de Analytics analiza esta información.
Base de datos de informes de Analytics Almacena los resultados de análisis de uso.
Base de datos de administración de búsqueda Almacena datos de configuración de búsqueda.

Acerca del componente de rastreo

El componente de rastreo rastrea los orígenes de contenido. Se pueden rastrear muchos orígenes de contenido, como recursos compartidos de archivos, contenido de SharePoint Server, aplicaciones de línea de negocio, y mucho más. Para recuperar información, el componente de rastreo invoca al conector de indexación o al controlador de protocolo para conectarse a los orígenes de contenido. Después de recuperar el contenido, el componente de rastreo pasa los elementos rastreados al componente de procesamiento de contenido.

Para obtener más información sobre los orígenes de contenido de rastreo, vea Planear el rastreo y la federación en SharePoint Server.

Acerca del componente de procesamiento de contenido

El componente de procesamiento de contenido procesa los elementos rastreados y los envía al componente de índice. El componente de procesamiento de contenido lleva a cabo operaciones como, por ejemplo, el análisis de documentos o la asignación de propiedades. También lleva a cabo procesamiento lingüístico como, por ejemplo, la extracción de entidades y la detección de idioma. El componente transforma los elementos rastreados en artefactos que se incluyen en el índice de búsqueda. El componente de procesamiento de contenido también escribe información sobre vínculos y direcciones URL a la base de datos de vínculo.

Para obtener más información sobre el procesamiento de contenido, vea Planear el rastreo y la federación en SharePoint Server.

Acerca del componente de procesamiento de Analytics

El componente de procesamiento de Analytics realiza dos tipos de análisis: análisis de búsqueda y análisis de uso. Este componente usa información de estos análisis para mejorar la relevancia de búsqueda, crear informes de búsqueda y generar recomendaciones y vínculos profundos.

  • El análisis de búsqueda consiste en extraer información, como vínculos, el número de veces que se hace clic en un elemento, texto de hipervínculo, datos relacionados con personas y metadatos, de la base de datos de vínculo. Esta información es importante para la relevancia.

  • El análisis de uso consiste en analizar la información de registro de uso que se recibe del front-end a través del almacén de eventos. El análisis de uso genera informes estadísticos y de uso.

Los resultados de los análisis se agregan a los elementos en el índice de búsqueda. Además, los resultados del análisis de uso se almacenan en la base de datos de informes de Analytics.

Para obtener más información, vea Información general del procesamiento de análisis en SharePoint Server.

Acerca del componente de índice

Puede dividir el índice de búsqueda en partes discretas denominadas particiones de índice. El índice de búsqueda es la suma de todas las particiones de índice. Cada partición de índice contiene una o varias réplicas de índice que contienen la misma información. Para lograr la redundancia y tolerancia de errores, cree más réplicas de índice para cada partición de índice y distribúyalas en varios servidores.

El componente de índice es la representación lógica de una réplica del índice. En la topología de búsqueda, debe aprovisionar un componente de índice para cada réplica de índice.

El componente de índice:

  • Recibe los elementos procesados del componente de procesamiento de contenido y los escribe en un archivo de índice. Los archivos de índice se almacenan en un disco en el servidor que hospeda el componente de índice.

  • Recibe consultas del componente de procesamiento de consultas y devuelve conjuntos de resultados.

Para obtener más información sobre el esquema de búsqueda y el índice de búsqueda, consulte Información general sobre el esquema de búsqueda en SharePoint Server.

Acerca del componente de procesamiento de consultas

El componente de consultas analiza y procesa las consultas y los resultados. Realiza procesamiento lingüístico como separación de palabras y lematización. Cuando el componente de procesamiento de consultas recibe una consulta del front-end de búsqueda, la analiza y la procesa para optimizar la precisión, la recuperación y la relevancia. La consulta procesada se envía al componente de índice. El componente de índice devuelve un conjunto de resultados basado en la consulta procesada al componente de procesamiento de consultas que, a su vez, procesa dicho conjunto de resultados antes de devolverlo al front-end de búsqueda.

Para obtener más información, vea Planear la transformación de consultas y el orden de resultados en SharePoint Server.

Acerca del componente de administración de búsqueda

El componente de administración de búsqueda inicia los procesos de sistema de búsqueda. Este componente lleva a cabo el aprovisionamiento, que consiste en agregar e iniciar instancias de otros componentes de búsqueda.

Acerca de la base de datos rastreo

La base de datos de rastreo almacena la información de seguimiento y la información histórica de los elementos rastreados. Por ejemplo, almacena información como la hora del último rastreo, el Id. del último rastreo y el tipo de actualización durante el último rastreo.

La base de datos de vínculo almacena la información que extrae el componente de procesamiento de contenido. Además almacena información sobre clics de búsqueda; el número de veces que los usuarios hacen clic sobre un resultado de búsqueda desde la página de resultados de la búsqueda. Esta información se almacena sin procesar para que el componente de procesamiento de Analytics la analice.

Acerca de la base de datos de informe de Analytics

La base de datos de informes de análisis almacena los resultados del análisis de uso. Además, almacena información estadística de los análisis. SharePoint Server usa esta información para crear informes de Excel donde se muestran diferentes estadísticas.

Acerca de la base de datos de administración de búsqueda

La base de datos de administración de búsqueda almacena los datos de configuración de búsqueda, como la topología, las reglas de rastreo, las reglas de consulta y las asignaciones entre las propiedades rastreadas y administradas. También almacena la lista de control de acceso (ACL), así como las opciones más probables para el componente de rastreo. Solo puede haber una base de datos de administración de búsqueda por cada aplicación de servicio de búsqueda.

Consulte también

Administrar la topología de búsqueda en SharePoint Server