Criar e implantar extratores de entidade personalizada no SharePoint Server

APLICA-SE A:yes-img-132013 yes-img-16 2016yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint no Microsoft 365

Você cria e mantém o arquivo extrator de entidade personalizada em um sistema externo ao SharePoint Server antes de importá-lo ao SharePoint Server para tornar o extrator de entidade personalizada disponível para o sistema de pesquisa.

Para usar entidades personalizadas como refinarias na pesquisa clássica, primeiro crie um dicionário de extração de entidade personalizada e implante-o. Em seguida, configura uma propriedade gerenciada para usar um extrator de entidade personalizada e executar um rastreamento completo. Após isso, é possível configurar o Web Part de Refinamento na página de resultados da pesquisa para usar a entidade personalizada como um refinador.

Antes de começar

Antes de iniciar esta operação, você deve ter em vigor:

  • Um aplicativo de serviço de pesquisa.

  • Uma ou mais fontes de conteúdo totalmente rastreadas.

  • Uma página de resultados de pesquisa

Criar um dicionário de extração de entidade personalizada

Para criar um dicionário de extração de entidade personalizada

  1. Determine qual tipo de dicionário de extração de entidade personalizada você deseja criar: Word, Word Part, Word exact ou Word Part exact. Consulte Visão geral dos tipos de extratores de entidade personalizada.

  2. Crie um arquivo .csv com as colunas Chave e Formulário de Exibição. Use uma vírgula como separador da coluna. Se o arquivo contém caracteres que não são ASCII, como diacríticos, você precisa codificá-lo em UTF-8. Salve o arquivo em um local acessível do servidor do qual você executará o cmdlet do Microsoft PowerShell para implantar o dicionário de extração de entidade personalizada.

    • Na coluna Chave, insira o termo (uma ou várias palavras) que você deseja incluir como entidades personalizadas. É possível usar mais de uma linha por chave. Certifique-se de que não há espaços em branco ao redor dos termos.

    • (Opcional) Na coluna Formulário de exibição, insira um nome do refinador. Caso deixe essa coluna vazia, o termo extraído do conteúdo será exibido como o refinador no mesmo caso em que ocorra tal conteúdo. Utilize a coluna Display Form para controlar e padronizar a forma como o refinador é exibido.

Por exemplo, uma organização chamada Contoso possui um sistema de certificação de três níveis: Contoso Beginner, Contoso Professional e Contoso Expert. A Contoso deseja extrair essas entidades e deseja poder refinar todas. Independentemente do caso em que a palavra "Contoso", "beginner", "professional" ou "expert" esteja escrita, eles desejam exibir o refinador como Contoso Beginner, Contoso Professional e Contoso Expert. Para esse exemplo, a entrada do arquivo do dicionário de extração de identidade personalizada seria como segue:

Key,Display form
Contoso Beginner,Contoso Beginner
Contoso B1,Contoso Beginner
Contoso Professional,Contoso Professional
Contoso prof,Contoso Professional
Contoso Expert,Contoso Expert

Implantar um dicionário de extração de entidade personalizada

Para implantar o dicionário de extração de entidade personalizada, você deve importá-lo para o SharePoint Server.

Para importar um dicionário de extração de entidade personalizada

  1. Verifique se a conta do usuário importando o dicionário de extrator de entidade personalizada é administradora para o aplicativo de serviço de Pesquisa.

  2. Inicie o Shell de Gerenciamento do SharePoint.

  3. No prompt de comando do Windows PowerShell, digite o seguinte comando:

    $searchApp = Get-SPEnterpriseSearchServiceApplication
    Import-SPEnterpriseSearchCustomExtractionDictionary -SearchApplication $searchApp -Filename <Path> -DictionaryName <Dictionary name> 
    
    

    Em que:

    • <Path> especifica o caminho UNC completo do arquivo .csv (o dicionário de extração personalizado) a ser importado.

    • <Dictionary name> é o nome do tipo de dicionário de extração personalizada.

    Dependendo do tipo de dicionário que estiver importando, insira um dos seguintes:

    • Microsoft.UserDictionaries.EntityExtraction.Custom.Word. n [onde n = 1,2,3,4 ou 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1

    • Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart. n [no qual n = 1,2,3,4 ou 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1

Configurar uma propriedade gerenciada para a extração de entidade personalizada

O procedimento a seguir descreve como associar o dicionário de extração de identidade personalizada com uma propriedade gerenciada existente o qual deseja extrair entidades personalizadas. Normalmente, essa propriedade gerenciada que você espera que contenha tais entidades, como as propriedades gerenciadas Título ou Corpo. Entidades personalizadas são extraídas do conteúdo completo da propriedade gerenciada à qual estão associadas, mesmo que seções nesses conteúdos sejam marcadas como <nenhum índice>.

Para especificar de qual propriedade gerenciada as entidades personalizadas devem ser extraídas, edite a propriedade gerenciada existente. Para obter mais informações sobre como gerenciar propriedades rastreadas e gerenciadas, consulte Gerenciar o esquema de pesquisa no SharePoint Server.

Para editar uma propriedade gerenciada para extração de entidade personalizada

  1. Verifique se a conta do usuário é a de administrador no aplicativo de serviço de Pesquisa.

  2. Em Administração Central, na seção Gerenciamento de Aplicativos, clique em Gerenciar Aplicativos de Serviço.

  3. Clique no aplicativo de serviço de Pesquisa.

  4. Na página Administração da Pesquisa, em Inicialização Rápida, na seção Consultas e Resultados, clique em Esquema de Pesquisa.

  5. Na página Propriedades Gerenciadas, encontre a propriedade gerenciada que você quer associar ao dicionário de extração de entidade personalizada que contém as palavras únicas ou múltiplas (ou partes de palavra). Você também pode inserir o nome da propriedade gerenciada na caixa Filtro.

  6. Aponte para a propriedade gerenciada, clique na seta e clique em Editar/mapear propriedade.

  7. Na página Editar propriedade gerenciada, edite as configurações em Extração de entidade personalizada. Selecione o dicionário de extração de entidade personalizada importado e clique em OK.

Depois que o próximo rastreamento completo for concluído, o extrator de entidade personalizado será habilitado. O conteúdo da propriedade gerenciada original é salvo inalterado no índice de pesquisa. Além disso, dependendo do tipo de extrator de entidade personalizado habilitado, as entidades extraídas são copiadas para uma ou mais das seguintes propriedades gerenciadas:

  • WordCustomRefiner1
  • WordCustomRefiner2
  • WordCustomRefiner3
  • WordCustomRefiner4
  • WordCustomRefiner5
  • WordExactCustomRefiner
  • WordPartCustomRefiner1
  • WordPartCustomRefiner2
  • WordPartCustomRefiner3
  • WordPartCustomRefiner4
  • WordPartCustomRefiner5
  • WordPartExactCustomRefiner

Essas propriedades gerenciadas são configuradas automaticamente para serem pesquisáveis, consultáveis, recuperáveis, classificáveis e refináveis.

Configurar um refinador no Web Part

É possível usar as entidades personalizadas extraídas como refinadores na página de resultados de pesquisa. Os refinadores baseados nas entidades personalizadas estão disponíveis no Web Part de Refinamento.

Para adicionar um refinador com base em um extrator de entidade personalizado

  1. Verifique se a conta do usuário que executa este procedimento é membro do grupo Designers do SharePoint no site do Enterprise Search Center.

  2. Navegue até a página que contém o web part de refinamento que você quer configurar, clique no menu Configurações e, em seguida, em Editar Página.

  3. Edite o Web Part de Refinamento. Clique na seta do menu de Web Part de refinamento e, em seguida, clique em Editar Web Part.

    • No painel de ferramentas do Web Part, na seção Propriedades do Refinamento da Pesquisa, verifique se Escolher Refinadores neste Web Part está selecionado.

    • Clique em Escolher refinadores.

    • Na página de configuração de refinamento, na seção de refinadores disponíveis, use os botões para escolher uma ou mais propriedades que contêm entidades extraídas que você quer mostrar como refinadores na lista e clique em Adicionar. Por exemplo, se você implantou um dicionário de extração de palavras, escolha WordCustomRefiner1.

    • Na seção Configurar para, configure como você deseja que cada refinador apareça.

  4. Clique em OK.

Visão geral dos tipos de extrator de entidade personalizada

A tabela a seguir mostra que tipo de dicionários de extração personalizados você pode criar e como as entradas do dicionário são correspondentes ao conteúdo no índice de pesquisa, qual nome de dicionário você deve usar ao implantar o dicionário e qual propriedade gerenciada conterá as entidades extraídas.


Extrator de entidade personalizada/dicionário do extrator de entidade personalizada Descrição Exemplo Nome de dicionário a usar no Windows PowerShell Propriedade gerenciada que contém a entidade extraída
Extração de palavra Entradas de dicionário que diferenciam maiúsculas e minúsculas correspondem o conteúdo tokenizado, máximo de 5 dicionários. A entrada "âncora" corresponde a "âncora" e "Âncora", mas não "ancoragem" Microsoft.UserDictionaries.EntityExtraction.Custom.Word.n [em que n = 1,2,3,4 ou 5] WordCustomRefiner1 WordCustomRefiner2 WordCustomRefiner3 WordCustomRefiner4 WordCustomRefiner5
Extração de parte da palavra Entradas de dicionário que diferenciam maiúsculas e minúsculas correspondem o conteúdo não tokenizado, máximo de 5 dicionários. A entrada "âncora" corresponde a "âncora", "Âncora" e "ancoragem" Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.n [onde n = 1,2,3,4 ou 5] WordPartCustomRefiner1 WordPartCustomRefiner2 WordPartCustomRefiner3 WordPartCustomRefiner4 WordPartCustomRefiner5
Extração exata de palavra Entradas de dicionário que diferenciam maiúsculas e minúsculas correspondendo o conteúdo tokenizado, máximo de 1 dicionário. A entrada "âncora" corresponde a "âncora", mas não a "Âncora" ou "Ancoragem" Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1 WordExactCustomRefiner
Extração exata de parte da palavra Entradas de dicionário que diferenciam maiúsculas e minúsculas correspondendo o conteúdo não tokenizado, máximo de 1 dicionário. A entrada "âncora" corresponde a "âncora" e "ancoragem", mas não "Âncora" Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1 WordPartExactCustomRefiner

Confira também

Import-SPEnterpriseSearchCustomExtractionDictionary