Crear e implementar extractores de entidades personalizadas en SharePoint Server

SE APLICA A:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint en Microsoft 365

Se crea y mantiene el archivo de extractor de entidades personalizado en un sistema externo a SharePoint Server antes de importarlo a SharePoint Server para que el extractor de entidades personalizado esté disponible en el sistema de búsqueda.

Para usar entidades personalizadas como refinadores en la búsqueda clásica, primero debe crear un diccionario de extracción de entidades personalizado e implementarlo. Después debe configurar una propiedad administrada para usar un extractor de entidades personalizado y ejecutar un rastreo completo. A continuación, puede configurar el elemento web de refinamiento en la página de resultados de búsqueda para usar la entidad personalizada como refinador.

Antes de empezar

Antes de comenzar esta operación, debe tener en su lugar:

  • Una aplicación de servicio de búsqueda

  • Una o más fuentes de contenido de rastreo completo

  • Una página de resultados de búsqueda

Crear un diccionario de extracción de entidades personalizado

Para crear un diccionario de extracción de entidades personalizadas

  1. Determine qué tipo de diccionario de extracción de entidades personalizado que desee crear: de palabras, de partes de palabras, de palabras exactas o de partes de palabras exactas. Vea Información general de tipos de extractor de entidades personalizados.

  2. Cree un archivo .csv con las columnas Clave y Mostrar formulario. Asegúrese de usar una coma como separador de columnas. Si el archivo contiene caracteres que no son ASCII, como el acento diacrítico, debe codificarlo en UTF-8. Guarde el archivo en una ubicación a la que se pueda acceder desde el servidor desde el que ejecutará el cmdlet de Microsoft PowerShell para implementar el diccionario de extracción de entidades personalizado.

    • En la columna Clave, escriba el término (una sola palabra o varias) que desee incluir como entidades personalizadas. Puede usar más de una línea por clave. Asegúrese de que no haya espacios iniciales o finales en torno a los términos.

    • (Opcional) En la columna Mostrar formulario, escriba un nombre de refinador. Si deja esta columna vacía, el término que se extrae desde el contenido se mostrará como el refinador de la misma forma que si ocurriera en el contenido. Use la columna Display Form para controlar y normalizar la forma en que se muestra el refinador.

Por ejemplo, una organización denominada Contoso tiene un sistema de certificación con tres niveles: Contoso Beginner, Contoso Professional y Contoso Expert. Contoso desea extraer esas entidades y refinarlas. Independientemente de si las palabras "Contoso", "beginner", "professional" o "expert" se han escrito en mayúsculas o minúsculas, quieren que se muestre el refinador como Contoso Beginner, Contoso Professional y Contoso Expert. Para este ejemplo, la entrada del archivo del diccionario de extracción de entidades personalizada podría tener el aspecto siguiente:

Key,Display form
Contoso Beginner,Contoso Beginner
Contoso B1,Contoso Beginner
Contoso Professional,Contoso Professional
Contoso prof,Contoso Professional
Contoso Expert,Contoso Expert

Implementación de un diccionario de extracción de entidades personalizado

Para implementar el diccionario de extracción de entidades personalizadas, tiene que importarlo en SharePoint Server.

Para importar un diccionario de extracción de entidades personalizadas

  1. Compruebe si la cuenta de usuario que está importando el diccionario de extracción de entidades personalizado es administrador de la aplicación de servicio de búsqueda.

  2. Inicie el Shell de administración de SharePoint.

  3. En el símbolo del sistema de Windows PowerShell, escriba el siguiente comando:

    $searchApp = Get-SPEnterpriseSearchServiceApplication
    Import-SPEnterpriseSearchCustomExtractionDictionary -SearchApplication $searchApp -Filename <Path> -DictionaryName <Dictionary name> 
    
    

    Donde:

    • <Path> especifica la ruta completa de UNC del archivo .csv (el diccionario de extracción personalizado) que se va a importar.

    • <Dictionary name> es el nombre del tipo de diccionario de extracción personalizado.

    Según el tipo de diccionario que va a importar, escriba una de las siguientes opciones:

    • Microsoft.UserDictionaries.EntityExtraction.Custom.Word. n [donde n = 1,2,3,4 o 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1

    • Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart. n [donde n = 1,2,3,4 o 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1

Configuración de una propiedad administrada para la extracción de entidades personalizadas

El siguiente procedimiento describe cómo asociar el diccionario de extracción de entidades personalizadas con una propiedad administrada existente desde la que desea extraer entidades personalizadas. Normalmente, es una propiedad administrada que espera contener estas entidades, como las propiedades administradas Título o Cuerpo. Las entidades personalizadas se extraen del contenido completo de la propiedad administrada a la que están asociadas, incluso si las secciones de esos contenidos se etiquetan como <sin índice>.

Para especificar de qué propiedad administrada existente deben extraerse entidades personalizadas, modifique la propiedad administrada existente. Para obtener más información sobre cómo administrar propiedades rastreadas y administradas, vea Administrar el esquema de búsqueda en SharePoint Server.

Para editar una propiedad administrada para la extracción de entidades personalizadas

  1. Compruebe que la cuenta de usuario es administrador de la aplicación del servicio de búsqueda.

  2. En Administración central, en la sección Administración de aplicaciones, haga clic en Administrar aplicaciones de servicio.

  3. Haga clic en la aplicación de servicio de búsqueda.

  4. En Inicio rápido de la página Administración de búsqueda, en Consultas y resultados, haga clic en Esquema de búsqueda.

  5. En la página Propiedades administradas, busque la propiedad administrada con la que desea asociar el diccionario de extracción de entidades personalizado, que contiene una o varias palabras (o partes de palabras). También puede escribir el nombre de la propiedad administrada en el cuadro Filtro.

  6. Señale a la propiedad administrada, haga clic en la flecha y después haga clic en Editar/asignar propiedad.

  7. En la página Editar propiedad administrada, edite la configuración de Extracción de entidades personalizada. Seleccione el diccionario de extracción de entidades personalizado que ha importado y, a continuación, haga clic en Aceptar.

Cuando se complete el siguiente rastreo completo, se habilitará el extractor de entidades personalizadas. El contenido de la propiedad administrada original se guarda sin cambios en el índice de búsqueda. Además, en función del tipo de extractor de entidades personalizado que haya habilitado, las entidades extraídas se copian en una o varias de las siguientes propiedades administradas:

  • WordCustomRefiner1
  • WordCustomRefiner2
  • WordCustomRefiner3
  • WordCustomRefiner4
  • WordCustomRefiner5
  • WordExactCustomRefiner
  • WordPartCustomRefiner1
  • WordPartCustomRefiner2
  • WordPartCustomRefiner3
  • WordPartCustomRefiner4
  • WordPartCustomRefiner5
  • WordPartExactCustomRefiner

Estas propiedades administradas se configuran automáticamente para que se puedan buscar, consultar, recuperar, ordenar y refinar.

Configuración de un refinador en el elemento web

Puede usar las entidades personalizadas extraídas como refinadores en la página de resultados de búsqueda. Los refinadores basados en las entidades personalizadas están basados en el elemento web de refinamiento.

Para agregar un refinador basado en un extractor de entidades personalizadas

  1. Compruebe que la cuenta de usuario que realiza este procedimiento sea miembro del grupo de diseñadores de SharePoint en el Centro de búsqueda Enterprise.

  2. Vaya a la página que contiene el elemento web de refinamiento que desea configurar. Haga clic en el menú Configuración y, a continuación, haga clic en Editar página.

  3. Edite el elemento web de refinamiento. Haga clic en la flecha menú Del elemento web de refinamiento y, a continuación, haga clic en Editar elemento web.

    • En el panel de herramientas del elemento web, vaya a la sección Propiedades de refinamiento de búsqueda y verifique que la opción Elija refinadores de este elemento web está seleccionada.

    • Haga clic en Elegir refinadores

    • En la página Configuración de refinamiento, vaya a la sección Refinadores disponibles y use los botones que aparecen para seleccionar una o varias propiedades administradas que contengan las entidades extraídas que desea mostrar como refinadores de la lista y haga clic en Agregar. Por ejemplo, si ha implementado un diccionario de extracción de palabras, elija WordCustomRefiner1.

    • En la sección Configurar para, configure cómo desea que aparezcan los distintos refinadores.

  4. Haga clic en Aceptar.

Información general de tipos de extractor de entidades personalizados

En la tabla siguiente se muestra qué tipo de diccionarios de extracción personalizados puede crear y cómo coinciden las entradas de diccionario con el contenido del índice de búsqueda, qué nombre de diccionario debe usar al implementar el diccionario y qué propiedad administrada contendrá las entidades extraídas.


Extractor de entidades personalizado/diccionario de extractor de entidades personalizado Descripción Ejemplo Nombre de diccionario que se debe usar en Windows PowerShell Propiedad administrada que va a contener la entidad extraída
Extracción de palabras No distingue entre mayúsculas y minúsculas, entradas de diccionario que coinciden con contenido acortado, máximo 5 diccionarios. La entrada “ancla” coincide con “ancla” y “Ancla”, pero no con “anclaje”. Microsoft.UserDictionaries.EntityExtraction.Custom.Word.n [donde n = 1,2,3,4 o 5] WordCustomRefiner1 WordCustomRefiner2 WordCustomRefiner3 WordCustomRefiner4 WordCustomRefiner5
Extracción de partes de palabras No distingue entre mayúsculas y minúsculas, entradas de diccionario que coinciden con contenido no acortado, máximo 5 diccionarios. La entrada “ancla” coincide con “ancla”, “Ancla” y “anclaje”. Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.n [where n = 1,2,3,4 o 5] WordPartCustomRefiner1 WordPartCustomRefiner2 WordPartCustomRefiner3 WordPartCustomRefiner4 WordPartCustomRefiner5
Extracción exacta de palabras Distingue entre mayúsculas y minúsculas, entradas de diccionario que coinciden con contenido acortado, máximo 1 diccionario. La entrada "ancla" coincide con "ancla" pero no "Ancla" pero o "Anclaje" Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1 WordExactCustomRefiner
Extracción exacta de partes de palabras Distingue entre mayúsculas y minúsculas, entradas de diccionario que coinciden con contenido no acortado, máximo 1 diccionario. La entrada "ancla" coincide con "ancla" y "anclaje" pero no con "Ancla" Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1 WordPartExactCustomRefiner

Consulte también

Import-SPEnterpriseSearchCustomExtractionDictionary