Configurar e gerenciar filtros de pesquisa

Aplica-se a:SQL ServerBanco de Dados SQL do Azure

A indexação de documentos em uma coluna de tipo de dados varbinary, varbinary(max), image ou xml exige processamento extra. Esse processamento deve ser realizado por um filtro. O filtro extrai as informações textuais do documento (removendo a formatação). Em seguida, o filtro envia o texto para o componente separador de palavras do idioma associado à coluna da tabela.

Filtros e tipos de documento

Um determinado filtro é específico a um determinado tipo de documento (.doc, .pdf, .xls, .xml e assim por diante). Estes filtros implementam a interface IFilter. Para obter mais informações sobre estes tipos de documento, veja a exibição de catálogo sys.fulltext_document_types .

Documentos binários podem ser armazenados em uma única coluna varbinary(max) ou image . Para cada documento, o SQL Server escolhe o filtro correto com base na extensão de arquivo. Como a extensão de arquivo não é visível quando o arquivo é armazenado em uma coluna varbinary(max) ou image , a extensão de arquivo (.doc, .xls, .pdf e assim por diante) deve ser armazenada em outra coluna da tabela, chamada de coluna de tipo. Essa coluna de tipo pode ser do tipo de dados com base em quaisquer caracteres e contém a extensão do arquivo de documento, como .doc para um documento do Microsoft Word. Na tabela Documento do Adventure Works, a coluna Documento é do tipo varbinary(max), e a coluna de tipo FileExtension é do tipo nvarchar(8).

Para exibir a coluna de tipo em um índice de texto completo existente

Observação

É possível que um filtro consiga processar objetos incorporados ao objeto pai, dependendo da sua implementação. Porém, o SQL Server não configura filtros para seguir links para outros objetos.

Filtros instalados

O SQL Server instala seus próprios filtros XML e HTML. Além disso, o SQL Server também carrega qualquer filtro de formatos proprietários da Microsoft (.doc, .xdoc, .ppt etc.) que já esteja instalado no sistema operacional. Para identificar os filtros que estão carregados atualmente em uma instância do SQL Server, use o procedimento armazenado sp_help_fulltext_system_components, desta maneira:

EXEC sp_help_fulltext_system_components 'filter';   

Observação

Mesmo com a versão mais recente do pacote de filtro do Office que dá suporte a .xlsx, o SQL Server não oferece suporte a planilhas Open XML estritas. Nenhum erro será retornado, SQL Server simplesmente falhará em indexar o conteúdo de qualquer Planilha Open XML Estrita.

Atualizações que não são da Microsoft

Para poder usar filtros para formatos que não sejam da Microsoft, é necessário, contudo, carregá-los manualmente na instância de servidor. Para obter informações sobre como instalar filtros adicionais, veja Exibir ou alterar filtros registrados e separadores de palavras.

Confira também

sys.fulltext_index_columns (Transact-SQL)
Compatibilidade do FILESTREAM com outros recursos do SQL Server