Поделиться через


Создание и развертывание пользовательских средств извлечения объектов в SharePoint Server

ОБЛАСТЬ ПРИМЕНЕНИЯ:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint в Microsoft 365

Файл пользовательского средства извлечения объектов создается и поддерживается в системе, которая является внешней по отношению к SharePoint Server, до его импорта в SharePoint Server, что делает пользовательское средство извлечения объектов доступным в поисковой системе.

Чтобы использовать пользовательские сущности в качестве уточнений в классическом поиске, сначала создайте настраиваемый словарь извлечения сущностей и разверните его. Затем необходимо настроить управляемое свойство для использования пользовательского средства извлечения объектов и выполнить полный обход. После этого можно настроить веб-часть уточнения на странице результатов поиска, чтобы использовать пользовательский объект в качестве уточнения.

Подготовка к работе

Прежде чем приступить к этой операции, необходимо выполнить следующие действия:

  • приложения-службы поиска;

  • одного или нескольких источников контента, для которых выполнен полный обход;

  • страницы с результатами поиска.

Создание пользовательского словаря извлечений объектов

Создание словаря для извлечения пользовательских объектов

  1. Определите, какой тип пользовательского словаря извлечения сущностей вы хотите создать: Word, Word Part, Word exact или Word Part exact. См. раздел Общие сведения о типах пользовательских средств извлечения сущностей.

  2. Создайте CSV-файл со столбцами Key и Display Form. Убедитесь, что в качестве разделителя столбцов используется запятая. Если файл содержит знаки не из набора ASCII, например диакритические знаки, необходимо использовать кодировку UTF-8. Сохраните файл в расположении, доступном с сервера, с которого вы будете выполнять командлет Microsoft PowerShell для развертывания пользовательского словаря извлечения сущностей.

    • В столбце Key введите термин (одно или несколько слов), который следует включить в качестве пользовательского объекта. Можно использовать более одной строки для каждого раздела. Убедитесь, что до и после термина не стоят пробелы.

    • (Необязательно) В столбце Display form введите имя уточнения. Если оставить этот столбец пустым, извлеченный из контента термин будет отображаться так же, как он отображается в контенте. Используйте столбец Display Form для контроля и стандартизации способа отображения уточнения.

Например, у организации Contoso есть система сертификации с тремя уровнями: Contoso Beginner, Contoso Professional и Contoso Expert. Компания Contoso хочет извлечь эти сущности и получить возможность уточнения результатов с их использованием. Независимо от регистра слова "Contoso", "beginner", "professional" или "expert" требуется показать уточнение как Contoso Beginner, Contoso Professional и Contoso Expert. В этом примере файл пользовательского словаря извлеченных объектов будут выглядеть следующим образом:

Key,Display form
Contoso Beginner,Contoso Beginner
Contoso B1,Contoso Beginner
Contoso Professional,Contoso Professional
Contoso prof,Contoso Professional
Contoso Expert,Contoso Expert

Развертывание пользовательского словаря извлечений объектов

Чтобы развернуть словарь для извлечения пользовательских объектов, необходимо импортировать его в SharePoint Server.

Импорт словаря для извлечения пользовательских объектов

  1. Убедитесь, что учетной записи пользователя, импортирующей пользовательский словарь извлечений объектов, назначены права администратора на приложение — службу поиска.

  2. Запустите Командная консоль SharePoint.

  3. В командной строке Windows PowerShell введите следующую команду.

    $searchApp = Get-SPEnterpriseSearchServiceApplication
    Import-SPEnterpriseSearchCustomExtractionDictionary -SearchApplication $searchApp -Filename <Path> -DictionaryName <Dictionary name> 
    
    

    Где:

    • <Path> указывает полный UNC-путь к импортируемому CSV-файлу (пользовательский словарь извлечений).

    • <Dictionary name> имя типа пользовательского словаря извлечений.

    В зависимости от типа импортируемого словаря введите одно из следующих значений:

    • Microsoft.UserDictionaries.EntityExtraction.Custom.Word. n [где n = 1,2,3,4 или 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1

    • Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart. n [where n = 1,2,3,4 or 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1

Настройка управляемого свойства для извлечения пользовательских объектов

В следующей процедуре описано, как сопоставить пользовательский словарь извлечений объектов с существующим управляемым свойством, из которого необходимо извлекать пользовательские объекты. Как правило, это управляемое свойство, которое должно содержать эти объекты, такое как управляемые свойства Title или Body. Пользовательские сущности извлекаются из полного содержимого управляемого свойства, с которым они связаны, даже если разделы в этом содержимом помечаются как <не индекс>.

Чтобы указать, из какого существующего управляемого свойства должны извлекаться пользовательские объекты, измените существующее управляемое свойство. Дополнительные сведения об управлении свойствами для обхода и управляемыми свойствами см. в статье Управление схемой поиска в SharePoint Server.

Изменение управляемого свойства для извлечения пользовательских объектов

  1. Убедитесь, что учетной записи пользователя назначены права администратора на приложение-службу поиска.

  2. В Центр администрирования в разделе Управление приложениями выберите Управление приложениями-службами.

  3. Щелкните приложение-службу поиска.

  4. На странице "Администрирование поиска" в панели быстрого запуска в разделе Запросы и результаты щелкните Схема поиска.

  5. На странице Управляемые свойства найдите управляемое свойство, которое нужно связать с пользовательским словарем извлеченных объектов, который содержит одно или несколько слов (частей слов). Имя управляемого свойства можно также указать в поле Фильтр.

  6. Выберите управляемое свойство, щелкните стрелку, затем щелкните Изменить/сопоставить свойство.

  7. На странице изменения управляемого свойства измените параметры в разделе Извлечение пользовательского объекта. Выберите пользовательский словарь извлечений объектов, импортированный ранее, и нажмите кнопку ОК.

После завершения следующего полного обхода включено средство извлечения пользовательских сущностей. Исходное содержимое управляемого свойства сохраняется в индексе поиска без изменений. Кроме того, в зависимости от типа включаемого пользовательского средства извлечения сущностей извлеченные сущности копируются в одно или несколько из следующих управляемых свойств:

  • WordCustomRefiner1
  • WordCustomRefiner2
  • WordCustomRefiner3
  • WordCustomRefiner4
  • WordCustomRefiner5
  • WordExactCustomRefiner
  • WordPartCustomRefiner1
  • WordPartCustomRefiner2
  • WordPartCustomRefiner3
  • WordPartCustomRefiner4
  • WordPartCustomRefiner5
  • WordPartExactCustomRefiner

Эти управляемые свойства автоматически настраиваются для поиска, запроса, извлечения, сортировки и уточнения.

Настройка уточнения в веб-части

Извлеченные пользовательские объекты можно использовать в качестве уточнений на странице результатов поиска. Уточнения, основанные на пользовательских объектах, доступны в веб-части уточнения.

Добавление уточнения с учетом средства извлечения пользовательских объектов

  1. Убедитесь, что учетная запись пользователя, которая выполняет эту процедуру, является участником группы разработчиков SharePoint для сайта корпоративного центра поиска.

  2. Перейдите к странице, содержащей веб-часть уточнения, которую нужно настроить, откройте меню Параметры и выберите пункт Изменить страницу.

  3. Измените веб-часть "Уточнение". Щелкните стрелку Веб-часть "Уточнение" и нажмите кнопку Изменить веб-часть.

    • Убедитесь, что в разделе Свойства для уточнения поиска области инструментов веб-части установлен флажок Выбрать уточнения в этой веб-части.

    • Щелкните Выбрать уточнения

    • На странице настройки уточнения в разделе "Доступные уточнения" с помощью кнопок выберите одно или несколько управляемых свойств, содержащих извлеченные сущности, которые нужно показать как уточнения, в списке и нажмите кнопку Добавить. Например, если был развернут словарь извлечений слов, выберите WordCustomRefiner1.

    • В разделе Настройка выберите способ отображения уточнений.

  4. Нажмите кнопку ОК.

Общие сведения о типах извлечений пользовательских объектов

В следующей таблице показано, какие типы пользовательских словарей извлечения можно создавать и как записи словаря сопоставляются с содержимым в индексе поиска, какое имя словаря следует использовать при развертывании словаря и какое управляемое свойство будет содержать извлеченные сущности.


Пользовательское средство извлечения объектов / пользовательский словарь извлечений объектов Описание Пример Имя словаря, используемое в Windows PowerShell Управляемое свойство, которое будет содержать извлеченный объект
Извлечение с совпадением слов Не зависит от регистра, записи словаря сопоставляются с маркированным контентом, не более 5 словарей. Слово "лук" сопоставляется со словом "лук" и "Лук", но не со словом "луковица" Microsoft.UserDictionaries.EntityExtraction.Custom.Word.n [where n = 1,2,3,4 или 5] WordCustomRefiner1 WordCustomRefiner2 WordCustomRefiner3 WordCustomRefiner4 WordCustomRefiner5
Извлечение с совпадением частей слов Не зависит от регистра, записи словаря сопоставляются с немаркированным контентом, не более 5 словарей. Слово "лук" сопоставляется со словом "лук", "Лук" и "луковица" Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.n [where n = 1,2,3,4 или 5] WordPartCustomRefiner1 WordPartCustomRefiner2 WordPartCustomRefiner3 WordPartCustomRefiner4 WordPartCustomRefiner5
Извлечение с точным совпадением слов Не зависит от регистра, записи словаря сопоставляются с маркированным контентом, не более 1 словаря. Слово "лук" сопоставляется со словом "лук", но не со словами "Лук" и "луковица" Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1 WordExactCustomRefiner
Извлечение с точным совпадением частей слов Зависит от регистра, записи словаря сопоставляются с немаркированным контентом, не более 1 словаря. Слово "лук" сопоставляется со словом "лук" и "луковица", но не со словом "Лук" Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1 WordPartExactCustomRefiner

См. также

Import-SPEnterpriseSearchCustomExtractionDictionary