Configurar y administrar filtros para búsquedasConfigure and Manage Filters for Search

Se aplica a:Applies to: síSQL ServerSQL Server (todas las versiones admitidas) yesSQL ServerSQL Server (all supported versions) SíAzure SQL DatabaseAzure SQL DatabaseYesAzure SQL DatabaseAzure SQL DatabaseSe aplica a:Applies to: síSQL ServerSQL Server (todas las versiones admitidas) yesSQL ServerSQL Server (all supported versions) SíAzure SQL DatabaseAzure SQL DatabaseYesAzure SQL DatabaseAzure SQL Database

La indexación de documentos en una columna de tipo de datos varbinary, varbinary(max), image, o xml exige un procesamiento adicional.Indexing documents in a varbinary, varbinary(max), image, or xml data type column requires extra processing. Un filtro debe realizar este procesamiento.This processing must be performed by a filter. El filtro extrae la información de texto del documento y quita el formato.The filter extracts the textual information from the document (removing the formatting). A continuación, el filtro envía el texto al componente separador de palabras correspondiente al idioma asociado a la columna de la tabla.The filter then sends the text to the word-breaker component for the language associated with the table column.

Tipos de documento y filtroFilters and document types

Un filtro determinado es específico de un tipo de documento concreto (.doc, .pdf, .xls, .xml, etc.).A given filter is specific to a given document type (.doc, .pdf, .xls, .xml, and so forth). Estos filtros implementan la interfaz IFilter.These filters implement the IFilter interface. Para obtener más información de estos tipos de documento, consulte la vista de catálogo sys.fulltext_document_types .For more information about these document types, query the sys.fulltext_document_types catalog view.

Los documentos binarios se pueden almacenar en una sola columna de tipo varbinary(max) o image .Binary documents can be stored in a single varbinary(max) or image column. Para cada documento, SQL ServerSQL Server elige el filtro correcto de acuerdo con la extensión de archivo.For each document, SQL ServerSQL Server chooses the correct filter based on the file extension. Dado que la extensión de archivo no está visible cuando el archivo se almacena en una columna de tipo varbinary(max) o image , la extensión de archivo (.doc, .xls, .pdf, etcétera) debe almacenarse en una columna independiente de la tabla, denominada columna de tipo.Because the file extension is not visible when the file is stored in a varbinary(max) or image column, the file extension (.doc, .xls, .pdf, and so forth) must be stored in a separate column in the table, called a type column. Esta columna de tipo debe ser de cualquier tipo de datos basado en caracteres y debe contener la extensión del archivo, como .doc para los documentos de MicrosoftMicrosoft Word.This type column can be of any character-based data type and contains the document file extension, such as .doc for a MicrosoftMicrosoft Word document. En la tabla Document en Adventure WorksAdventure Works, la columna Document es de tipo varbinary(max) y la columna de tipo FileExtension es de tipo nvarchar(8).In the Document table in Adventure WorksAdventure Works, the Document column is of type varbinary(max), and the type column, FileExtension, is of type nvarchar(8).

Para ver la columna de tipo en un índice de texto completo existenteTo view the type column in an existing full-text index

Nota

Un filtro podría ser capaz de tratar los incrustados en el objeto primario, dependiendo de su implementación.A filter might be able to handle objects embedded in the parent object, depending on its implementation. Sin embargo, SQL ServerSQL Server no configura los filtros para seguir los vínculos a otros objetos.However, SQL ServerSQL Server does not configure filters to follow links to other objects.

Filtros instaladosInstalled filters

SQL ServerSQL Server instala sus propios filtros HTML y XML.installs its own XML and HTML filters. Además, SQL ServerSQL Server también carga los filtros para formatos de propietario de MicrosoftMicrosoft (.doc, .xdoc, .ppt, etcétera) que ya están instalados en el sistema operativo.In addition, any filters for MicrosoftMicrosoft proprietary formats (.doc, .xdoc, .ppt, and so on) that are already installed on the operating system are also loaded by SQL ServerSQL Server. Para identificar los filtros que están cargados actualmente en una instancia de SQL ServerSQL Server, use el procedimiento almacenado sp_help_fulltext_system_components , como se explica a continuación:To identify the filters that are currently loaded on an instance of SQL ServerSQL Server, use the sp_help_fulltext_system_components stored procedure, as follows:

EXEC sp_help_fulltext_system_components 'filter';   

Nota

Incluso con la versión más reciente del módulo Filter Pack de Office que proporciona compatibilidad con .xlsx, SQL Server no admite hojas de cálculo Strict Open XML.Even with the latest version of the Office Filter Pack that provides .xlsx support, SQL Server does not support Strict Open XML Spreadsheets. No se devolverá ningún error, simplemente se producirá un error en SQL Server al indexar el contenido de cualquier hoja de cálculo Strict Open XML.No error will be returned, SQL Server will simply fail to index the contents of any Strict Open XML Spreadsheets.

Filtros que no son de MicrosoftNon-Microsoft filters

Para poder usar filtros para formatos que no son de MicrosoftMicrosoft, debe cargarlos manualmente en la instancia del servidor.Before you can use filters for non- MicrosoftMicrosoft formats, however, you must manually load them into the server instance. Para obtener información sobre cómo instalar filtros adicionales, vea Ver o cambiar los filtros y separadores de palabras registrados.For information about installing additional filters, see View or Change Registered Filters and Word Breakers.

Vea tambiénSee Also

sys.fulltext_index_columns (Transact-SQL) sys.fulltext_index_columns (Transact-SQL)
Compatibilidad de FILESTREAM con otras características de SQL ServerFILESTREAM Compatibility with Other SQL Server Features