Visão geral do esquema de pesquisa no SharePoint Server

APLICA-SE A:yes-img-132013 yes-img-16 2016yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint no Microsoft 365

O índice é o centro da pesquisa. O que está no índice de pesquisa determina o que pessoas encontram quando procuram informações inserindo consultas de pesquisa ou interagindo com páginas da Internet ou intranet.

Este artigo descreve como o conteúdo é coletado e recuperado do índice de pesquisa, usando o esquema de pesquisa. O esquema de pesquisa contém propriedades rastreadas, categorias de propriedades rastreadas, o mapeamento de propriedades rastreadas para as gerenciadas e as configurações das propriedades gerenciadas. Essas configurações definem o que e como você pode pesquisar, por exemplo, se você pode refinar ou consultar uma propriedade.

Rastreamento e propriedades rastreadas

Para construir o índice de pesquisa, você deve rastrear o conteúdo primeiro. Você pode rastrear várias fontes de conteúdo, por exemplo, conteúdo do SharePoint Server, compartilhamento de arquivos ou perfis de usuário. O conteúdo e os metadados dos itens rastreados são representados como propriedades rastreadas.

Cada item que foi rastreado e transferido para o componente de processamento de conteúdo possui propriedades rastreadas associadas. Os exemplos de propriedades são Autor, Título e Data de Criação. As novas propriedades rastreadas serão descobertas automaticamente.

Propriedades rastreadas são agrupadas em categorias baseadas no IFilter ou manipulador de protocolo do item. Exemplos de categorias são Escritório (propriedade rastreadas de documentos do Word, planilhas do Excel e assim por diante), Dados Corporativos (de bancos de dados de exemplo) e Web (de sites).

Para mais informações sobre o rastreamento, confira Planejar o rastreamento e a federação no SharePoint Server.

Propriedades gerenciadas e mapeamento de propriedade

Para incluir o conteúdo e os metadados de propriedades rastreadas no índice de pesquisa, você deve mapear as propriedades rastreadas para as propriedades gerenciadas. Apenas as propriedades gerenciadas são gravadas no índice de pesquisa.

As propriedades gerenciadas podem ter muitas configurações. As configurações na propriedade gerenciada determinam como o conteúdo pode ser mostrado nos resultados da pesquisa e como as pessoas podem pesquisá-lo.

É possível mapear várias propriedades rastreadas para uma propriedade gerenciada. Por exemplo, você pode mapear as propriedades rastreadas "Escritor" e "Autor" para a propriedade gerenciada "Autor". Ou, é possível mapear uma propriedade rastreada para várias propriedades gerenciadas.

Além disso, a ordem na qual propriedades rastreadas são mapeadas a uma propriedade gerenciada pode determinar o conteúdo de uma propriedade gerenciada. Por exemplo, uma propriedade gerenciada pode ter várias propriedades rastreadas mapeadas a ela, e pode ser definida para incluir todos os valores de todas as propriedades rastreadas mapeadas a ela. Porém, se você der prioridade à propriedade rastreada que contém o título SharePoint sobre outro título no mapeamento, ela mostrará o título do SharePoint nos resultados da pesquisa.

Um conjunto de mapeamentos padrão entre as propriedades rastreadas e gerenciadas foi definido, confira Visão geral das propriedades rastreadas e gerenciadas no SharePoint Server.

Alguns tipos de propriedade rastreada geram automaticamente uma nova propriedade gerenciada, e um mapeamento entre a propriedade rastreada e a gerenciada. Por exemplo, todas as colunas de site das bibliotecas do SharePoint possuem essa geração e mapeamento automáticos. Quando você cria uma coluna de site em uma lista e rastreia essa lista, uma propriedade rastreada e uma gerenciada, e um mapeamento entre ambas, são criados automaticamente para a coluna.

Você pode alterar o mapeamento padrão e qualquer outro mapeamento das propriedades rastreadas para as gerenciadas, criar novos mapeamentos ou criar novas propriedades gerenciadas. Quando você cria uma nova propriedade gerenciada, ouquando altera certas configurações em propriedades gerenciadas existentes, um rastreamento completo deve ser feito antes que a propriedade gerenciada e seu valor sejam incluídos no índice de pesquisa. Se a propriedade nova ou alterada estiver em uma biblioteca ou lista do SharePoint, você pode reindexar essa biblioteca ou lista individual sem iniciar um rastreamento completo da fonte de conteúdo inteira do SharePoint. Isso tem o mesmo efeito de um rastreamento completo.

Confira a tabela Visão geral das configurações de propriedades gerenciadas posteriormente neste artigo para obter mais informações.

O esquema de pesquisa

O esquema de pesquisa é armazenado no banco de dados de Administração de Pesquisa. Ele contém:

  • O mapeamento entre propriedades rastreadas e propriedades gerenciadas. Pode ser um mapeamento de uma propriedades rastreada para uma propriedade gerenciada, de uma para várias, várias para uma ou até várias para várias.

  • Como as propriedades gerenciadas devem ser gravadas no índice de pesquisa. Por exemplo, em qual índice de texto completo os valores das propriedades gerenciadas devem ser gravados e em qual grupo de ponderação (contexto).

  • As configurações das propriedades gerenciadas diferentes. Por exemplo, se você pode pesquisar, consultar ou refinar os resultados da pesquisa através de propriedades gerenciadas específicas.

  • Categorias de propriedade rastreada que agrupam propriedades de acordo com o respectivo IFilter ou manipulador de protocolo. Se você edcitar uma categoria de propriedade rastreada, suas alterações serão aplicadas a todas as propriedades rastreadas na categoria. Isso pode influenciar o desempenho e o modo como itens são salvos no índice de pesquisa.

As atualizações do esquema de pesquisa são propagadas pelo sistema de pesquisa a cada minuto.

Vários esquemas de pesquisas

Você pode criar vários esquemas de pesquisa. O esquema de pesquisa principal é definido no aplicativo de serviço Pesquisa e pode ser editado na Administração Central. Os administradores de locatários e de conjuntos de sites podem alterar o esquema de pesquisa para um locatário ou conjunto de sites específico. Por exemplo, um administrador de conjunto de sites pode personalizar o que é incluído no índice de pesquisa ao alterar o esquema de pesquisa para aquele conjunto de sites. Os proprietários do site podem ver o esquema de pesquisa, mas não alterá-lo.

Observação

[!OBSERVAçãO] Você não pode ver ou alterar o esquema de pesquisa do conjunto de sites no Administração Central. Para ver ou alterar o esquema de pesquisa para um conjunto de sites, é necessário usar a Administração do Conjunto de Sites.

O índice de pesquisa

O índice de pesquisa consiste em um conjunto de arquivos nas pastas de um servidor. O componente de processamento do conteúdo processa os itens pesquisados, usa o esquema de pesquisa para mapear as propriedades rastreadas para as gerenciadas e converte as propriedades gerenciadas em um formato gravado no índice de pesquisa. Além de vários índices de texto completo, existem índices separados de propriedades gerenciadas marcadas como recuperáveis e outros marcados como consultáveis. Também existe um índice separado para os vetores de atributo e existem índices numéricos.

Grupos de atualização de índice

Sempre que o item muda, ele deve ser reindexado depois que foi rastreado novamente. Para reduzir a carga da reindexação, o SharePoint Server introduz vários grupos de atualização de índices separados.

  • Padrão Contém a maioria de propriedades gerenciadas. Esse grupo contém todas as propriedades gerenciadas que não pertencem aos grupos Segurança, Link, Uso ou Pessoas.

  • Segurança Contém a propriedade gerenciada da lista de Controle de acesso (ACL) do documento

  • Link Contém as propriedades gerenciadas relacionadas à estrutura de link

  • Uso Contém as propriedades gerenciadas relacionadas aos dados de uso

  • Pessoas Contém as propriedades gerenciadas relacionadas às pesquisas de pessoas

Cada grupo de atualização é armazenado em uma pasta diferente no índice de pesquisa.

Índice de texto completo

Um índice de texto completo contém todo o texto das propriedades gerenciadas pesquisáveis, que são armazenados no índice de texto completo. Cada índice de texto completo é dividido em grupos de peso, também conhecido como contextos. Os diferentes contextos se relacionam com a importância relativa de uma propriedade gerenciada, que é um dos recursos de classificação que são usados para calcular a classificação de relevância total de um resultado de pesquisa. O número ou ID de um contexto não é importante; o modelo de classificação determina sua importância relativa, atribuindo um peso contribuição a um contexto particular. O maior peso resulta em uma contribuição maior pontuação de classificação. Para obter mais informações, veja a seção sobre Influenciar a classificação de resultados de pesquisa usando o esquema de pesquisa no artigo de Visão geral do resultado de pesquisa de classificação no SharePoint Server.

Há dois índices de texto completo predefinidos: o índice de texto completo dos termos do SharePoint( SpTermsIdx ) e o índice de pessoas ( PeopleIdx ).

A maioria das propriedades gerenciadas já é mapeada para um índice de texto completo e contexto adequado por padrão. Não recomendamos a alteração do contexto de nenhuma das propriedades gerenciadas pesquisáveis existentes.

Visão geral das configurações da propriedade gerenciada

As configurações das propriedades gerenciadas determinam como o conteúdo é salvo no índice de pesquisa e se, e como, as pessoas podem pesquisar e recuperar a respeito.

O esquema de pesquisa pode ser editado na Administração Central, na Administração do Conjunto de Sites e na Administração de Locatários. Os administradores de site podem ver o esquema de pesquisa, mas não podem editá-lo. A tabela a seguir descreve as diferentes configurações e se elas estão disponíveis para a edição nos diferentes níveis do administrador.

Configuração da propriedade gerenciada Função Exemplo Disponível em Rastreamento completo ou reindexação da lista/biblioteca do SharePoint requerida após alteração da configuração
Pesquisável Permite consultar o conteúdo da propriedade gerenciada. Esse conteúdo é incluído no índice de texto completo. Se a propriedade for "autor", uma consulta simples "Smith" retorna os itens que contêm a palavra "Smith" e os itens cuja propriedade autor contém "Smith". Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Configurações pesquisáveis avançadas Permite exibir e alterar o índice de texto completo no qual a propriedade gerenciada está gravada. Também permite alterar o contexto da propriedade gerenciada para o cálculo da classificação de relevância. Não recomendamos que o contexto de nenhuma das propriedades gerenciadas existentes seja alterado. Para obter mais informações, veja a seção sobre Influenciar a classificação de resultados de pesquisa usando o esquema de pesquisa no artigo de Visão geral do resultado de pesquisa de classificação no SharePoint Server. Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Consultável Permite consultar a propriedade gerenciada específica. O nome da propriedade deve ser incluído na consulta, sendo especificado diretamente ou incluído de maneira programática. Se a propriedade gerenciada for "autor", a consulta deve conter "autor:Smith". Administração Central / Administração de Conjunto de Sites / Administração de Locatários De desabilitado para habilitado.
Recuperável Permite que o conteúdo dessa propriedade gerenciada seja retornado nos resultados da pesquisa. Ative essa configuração para as propriedades relevantes para a apresentação nos resultados da pesquisa. Administração Central/Administração de Conjunto de Sites/Administração de Locatários De desabilitado para habilitado.
Permitir valores múltiplos Permite diversos valores do mesmo tipo nessa propriedade gerenciada. Se a propriedade gerenciada for "autor" e um documento tem vários autores, o nome de cada autor será armazenado como um valor separado na propriedade. Administração Central Sim
Refinável Sim - ativo: Permite usar a propriedade como um refinador dos resultados de pesquisa no front-end. Configure o refinador manualmente no web part.

Sim - latente: permite trocar o refinável para ativo mais tarde, sem ter que fazer um rastreamento completo quando trocar.

As duas opções exigem um rastreamento completo para surtirem efeito.

IMPORTANTE: Se você selecionar Sim - ativo ou Sim - latente, também deverá tornar a propriedade gerenciada Consultável.

Não há suporte na experiência de pesquisa moderna.
Se a propriedade "autor" for configurada como Refinável, você pode configurar Autor como um refinador em seu front-end de pesquisa mais tarde. Administração Central De desativado para ativado (se ainda não estiver definido para Ordenável)
Ordenável Sim - ativo: permite ordenar o conjunto de resultados com base na propriedade, antes que seja retornado.

Sim - latente: permite trocar o ordenável para ativo mais tarde, sem ter que fazer um rastreamento completo quando trocar.

As duas opções exigem um rastreamento completo para surtirem efeito.

Não há suporte na experiência de pesquisa moderna.
Use para conjuntos de resultados grandes, que não podem ser ordenados e recuperados ao mesmo tempo. Administração Central De desativado para ativado (se ainda não estiver definido para Refinável)
Alias Define um alias para a propriedade gerenciada, se você deseja usá-lo em vez do nome da propriedade nas consultas e nos resultados da pesquisa. Use a propriedade gerenciada original e não o alias para mapear para uma propriedade rastreada. Use um alias se você não deseja ou não tem permissão para criar uma propriedade gerenciada nova. Administração Central / Administração de Conjunto de Sites / Administração de Locatários Não
Normalização de Token Permite retornar resultados independentes da caixa alta/baixa e dos diacríticos usados na consulta. A consulta "curacao" também corresponderá a "Curaçao", "curacao" e "Curacao". Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Correspondência Completa Por padrão, a pesquisa retorna correspondências parciais entre consultas em relação a uma propriedade gerenciada e o conteúdo da propriedade gerenciada.

Selecione Correspondência Completa para pesquisa para retornar correspondências exatas.
Se uma propriedade gerenciada "Title" contiver "Contoso Sites", apenas o título da consulta: "Contoso Sites" dará um resultado. Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Tokenização neutra de linguagem (somente SharePoint Server 2019) Selecione tokenização neutra de idioma se você tiver conteúdo multilíngue e a propriedade gerenciada contiver marcas baseadas em conjuntos de termos de metadados ou outros identificadores.

Por padrão, a pesquisa depende da linguagem quando ela quebra consultas e conteúdo em partes (tokenização). Por exemplo, uma biblioteca de documentos que contém planilhas de produtos em inglês e chinês em que os identificadores de produto têm caracteres não alfanuméricos, como "11.132-84-115#4". Quando a pesquisa processa uma planilha de dados, ela detecta seu idioma e tokeniza tudo nela de acordo com esse idioma. Quando os usuários pesquisam um identificador de produto, a pesquisa tokeniza sua consulta de acordo com a configuração de idioma do site do SharePoint em que estão. Se o site estiver definido como inglês e o usuário pesquisar um identificador de produto que foi tokenizado como texto chinês, os tokens poderão não corresponder e os usuários não obterão resultados.

Para melhorar os resultados para os usuários, mapeie a propriedade rastreada para o identificador de produto para uma nova propriedade gerenciada, "ProductID", com a tokenização neutra do idioma habilitada. Instrua os usuários a procurar identificadores de produto na nova propriedade gerenciada, assim: ProductID:"11.132-8".
Se a propriedade rastreada para um identificador de produto for mapeada para uma propriedade gerenciada "ProductID", a pesquisa usará a tokenização neutra do idioma para consultas em "ProductID". Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Tokenização de consulta mais fina (somente SharePoint Server 2019) Use essa configuração para ajudar os usuários a obter melhores resultados de pesquisa ao pesquisar em propriedades gerenciadas que contêm metadados com caracteres não alfanuméricos. Essa configuração torna as consultas na propriedade gerenciada mais lentas.

Os usuários que preferem inserir rapidamente uma consulta e procurar os resultados para encontrar a planilha de dados que estão procurando, normalmente inserem consultas como ProductID:"132-884". Como a pesquisa por padrão quebra o conteúdo do índice de pesquisa em partes menores do que em consultas, a pesquisa pode não encontrar correspondências para essas consultas. Quando a consulta é tokenizada mais fina, é mais provável que haja correspondências entre os tokens no índice de pesquisa e na consulta. Os usuários também podem consultar a parte intermediária ou última do identificador do produto.

Os usuários que pesquisam uma planilha de dados e esperam obter apenas resultados que correspondam ao identificador completo do produto, normalmente gravam consultas como ProductID:"11.132-884-115#4". A tokenização de consulta mais fina não faz diferença para essas consultas.
Se você tiver uma propriedade gerenciada "Identificador de produto" que contém "11.132-884-115#4", pesquisas como ProductID:"132-884" provavelmente obterão resultados. Administração Central / Administração de Conjunto de Sites / Administração de Locatários Não
Mapeamentos para propriedades rastreadas A lista mostra todas as propriedades rastreadas mapeadas para esta propriedade gerenciada. A propriedade gerenciada pode obter seu conteúdo de uma ou mais propriedades rastreadas.

Você pode incluir o conteúdo de todas as propriedades rastreadas ou da primeira propriedade rastreada que não seja vazia, com base em uma ordem específica.
Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Extração do nome de empresa Permite que o sistema extraia entidades de nome de empresa da propriedade gerenciada, ao rastrear itens novos ou atualizados. As entidades extraídas podem, mais tarde, ser usadas para definir refinadores.

Há um dicionário pré-preenchido para extração de nome da empresa. O sistema salva o conteúdo da propriedade gerenciada original inalterado no índice e, além disso, copia as entidades extraídas para a propriedade gerenciada "empresas". A propriedade gerenciada "empresas" está configurada para ser pesquisável, consultável, recuperável, classificável e refinável.

Você pode editar o dicionário de nomes de empresa no Repositório de Termos.

Para obter mais informações, consulte Gerenciar extração do nome da empresa no SharePoint Server.

Não há suporte na experiência de pesquisa moderna.
Administração Central / Administração de Conjunto de Sites / Administração de Locatários Sim
Extração da entidade personalizada Permite que um ou mais extratores de entidade personalizada sejam associados a esta propriedade gerenciada. Assim, o sistema pode extrair entidades da propriedade gerenciada quando rastrear itens novos ou atualizados. As entidades podem ser usadas, mais tarde, para configurar refinadores.

Para saber mais, confira Criar e implantar extratores de entidade personalizada no SharePoint Server.

Não há suporte na experiência de pesquisa moderna.
Administração Central / Administração de Conjunto de Sites Sim

Confira também

Gerenciar o esquema de pesquisa no SharePoint Server

Visão geral dos rastreadas e propriedades gerenciadas no SharePoint Server

Planejar o rastreamento e a federação no SharePoint