Estructura de índices de texto

Para entender la estructura de un índice de texto, es necesario comprender el funcionamiento del servicio Motor de texto completo de Microsoft para SQL Server (MSFTESQL). En el siguiente fragmento de la tabla Document de Adventure Works se muestran dos columnas y tres filas de la tabla: la columna DocumentID y la columna Title.

En este ejemplo, se supone que se ha creado un índice de texto en la columna Title.

DocumentID Title

1

Crank Arm and Tire Maintenance

2

Front Reflector Bracket and Reflector Assembly 3

3

Front Reflector Bracket Installation

El siguiente fragmento de tabla muestra el contenido del índice de texto creado en la columna Title de la tabla Document.

[!NOTA] Los índices de texto contienen más información que la que se presenta en esta tabla. La siguiente tabla es sólo un ejemplo.

Keyword ColId DocId Occ

Crank

1

1

1

Arm

1

1

2

Tire

1

1

4

Maintenance

1

1

5

Front

1

2

1

Front

1

3

1

Reflector

1

2

2

Reflector

1

2

5

Reflector

1

3

2

Bracket

1

2

3

Bracket

1

3

3

Assembly

1

2

6

3

1

2

7

Installation

1

3

4

La columna Keyword contiene una representación de un solo testigo extraído durante la indización. Los separadores de palabras determinan en qué consiste un testigo.

La columna ColId contiene un valor correspondiente a una determinada tabla y columna indizada de texto.

La columna DocId contiene valores de un entero de cuatro bytes que se asigna a un determinado valor de clave de texto en una tabla indizada de texto. Los valores de DocId que cumplen una condición de búsqueda se pasan desde el servicio MSFTESQL al motor de base de datos, donde se asignan a valores de clave de texto de la tabla base en la que se realizan las consultas.

La columna Occ contiene un valor entero. Para cada valor de DocId hay una lista de valores de repetición correspondientes a los desplazamientos de palabras relativos de una palabra clave determinada en DocId. Los valores de repetición son útiles para determinar las coincidencias de frases o de proximidad, por ejemplo, frases que tienen valores de repetición adyacentes. También son útiles para calcular las puntuaciones de importancia; por ejemplo, el número de repeticiones de una palabra clave en una columna DocId se puede utilizar para determinar la puntuación.

Vea también

Conceptos

Motor de texto completo de Microsoft para SQL Server
Aspectos básicos de la búsqueda de texto
Índices de texto

Otros recursos

CREATE FULLTEXT INDEX (Transact-SQL)

Ayuda e información

Obtener ayuda sobre SQL Server 2005