Обзор поиска в SharePoint 2013

Исходная статья опубликована в субботу, 29 сентября 2012 г.

Краткое введение.
Меня зовут Герхард Шоббе (Gerhard Schobbe), я являюсь руководителем групповой программы в группе организации SharePoint и занимаюсь сценариями поиска для информационных работников на предприятии.

Цели для выпуска

Позвольте сначала рассказать о тех целях, которые ставились для данного выпуска.

Как и для любого выпуска, существует несколько областей, в которых мы намеревались добиться прогресса. Для выпуска Office 2013 наиболее важными были три следующие области:

  • Переход на единую платформу поиска в корпоративной среде
  • Обеспечение прогресса, который будет несомненным для конечных пользователей, взаимодействующих с системой поиска
  • Использование этой платформы в качестве более общего уровня доступа к информации для приложений, включая другие части SharePoint и, конечно же, стороннюю разработку

Я детально рассмотрю каждую из указанных областей и приведу несколько примеров, чтобы подчеркнуть достигнутый нами прогресс. После этой обзорной статьи — в течение следующих недель и месяцев — будет опубликовано несколько более подробных записей, посвященных различным подсистемам.

Единая платформа поиска

Сначала давайте рассмотрим цель по формированию единой платформы поиска в корпоративной среде. После получения приобретения FAST в середине 2008 года и последующего выпуска Office 2010 линейка продуктов Microsoft SharePoint 2010 включает в себя двухуровневое предложение поиска, в котором уровни основаны на разных стеках технологий: SharePoint 2010 включает в себя систему поиска в корпоративной среде, основанную на разработанной в Редмонде базе кода, а более высокий уровень включает в себя систему FAST Search Server 2010, которая разрабатывалась на базе стека технологий FAST следом за приобретением.

Однако было ясно, что именно система, позволяющая объединить лучшие аспекты обоих подходов, может служить для создания более привлекательного продукта поиска в корпоративной среде и одновременно упростить процесс принятия решений для клиентов, то есть является беспроигрышным вариантом. Но это еще не все, так как процесс полного переосмысления архитектуры обеспечил возможность интеграции нескольких современных компонентов, с которыми система FAST взаимодействовала, и которые еще не были представлены широкой общественности, включая обновленные платформы обработки контента и запросов.

После нескольких лет разработки результатом данного плана стала система, которая объединяет в себе программу-обходчик и платформу соединителя, знакомые нам по SharePoint Search, с платформами обработки контента и запросов следующего поколения из FAST, и все это работает совместно с базой поиска, основанной на FAST Search.

Процедуры взаимодействия с пользователем по умолчанию для конечных пользователей и ИТ-администраторов снова размещаются в SharePoint — соответствующий интерфейс был полностью переработан с серверного подхода к отрисовке в 2010 на асинхронный клиентский подход (подробнее об этом чуть позже).

Кроме того, мы смогли интегрировать новую подсистему анализа, которая выступает в качестве среды выполнения для различных заданий, включая алгоритмы ранжирования и рекомендации.
 
Следует отметить, что была проделана большая работа, чтобы сделать платформу поиска размещенной в облаке — она будет лежать в основе службы O365, так как новая версия работает в сети.
 
На следующем рисунке приведена графическая сводка (щелкните изображение для его увеличения).

 

 

Создание превосходного взаимодействия с пользователем

 

 

Это подводит нас ко второй области инвестиций — предоставление кардинальных улучшений для всех конечных пользователей. Обычно пользователь вводил набор терминов поиска на домашней странице центра поиска, которые рассматривались как ключевые слова, а результаты были представлены отдельным ранжированным списком из ссылок с трехстрочными сводками и небольшим объемом метаданных.  Позвольте мне описать, как мы продвигались дальше в каждом из описанных случаев.

 

Домашняя страница центра поиска является главной точкой входа:

 

В этом выпуске каждое поле поиска на каждом сайте группы предлагает полный доступ к поиску в рамках всего предприятия, поиску людей и другим специализированным интерфейсам поиска в дополнение к традиционному поиску сайтов с заданной областью. Пользователи могут получать доступ к требуемой области из раскрывающегося списка внутри поля поиска.

Это позволяет любому пользователю, работающему на сайте группы или одном из разнообразных концентраторов в SharePoint, воспользоваться всей полнотой функциональных возможностей поиска в масштабе предприятия. 

Каждый термин является ключевым словом:

Подробный анализ нескольких журналов запросов клиентов, на которые мы получили разрешения, однозначно показал, что многие запросы пользователей представляют собой сочетание ключевых слов и командных слов, при этом вторые могут указывать на тип искомого пользователем результата. Другим крупным классом запросов были навигационные запросы, то есть те, для которых ожидаемым результатом было расположение, например, сайт группы, некоторый другой веб-сайт, библиотека документов или даже конкретный документ, который пользователь уже использовал несколько раз.

 

Чтобы получить более полное представление о концепции командных слов, давайте рассмотрим пример запроса "marketing deck". Пользователь выполняет логичный (с точки зрения человека) поиск презентации о маркетинге, однако ни одна презентация не содержит слово "deck" (пресс-кит), которое относится к жаргону. Более рациональной представляется классификация терминов в запросе непосредственно на непосредственно ключевые слова (в данном случае — "marketing") и командные слова, которые требуется преобразовать в другие ограничения запроса, в данном случае в ограничение типа, ограничивающее тип результатов всеми типами файлов, которые определены как презентации. Аналогичная идея применяется, например, к результатам, которые пользователь ищет для сайта или для документов, не являющихся веб-страницами. Эти логические построения привели к введению правил запроса — обобщенной и расширяемой системы для анализа запросов, которая сопоставляет термины в запросе с ключевыми словами и реализует преобразование командных слов в запросы свойств. Правила запроса также предоставляют расширенные возможности, включая использование поведения пользователя для создания блоков результатов. В последующих записях блога все эти аспекты использования правил запроса будут рассмотрены подробнее.

Отдельный ранжированный список результатов:

 

Правила запроса допускают несколько интерпретаций одного и того же запроса. Возможно, одна из интерпретаций использует приведенное выше ограничение типа, формируя набор документов. Другое правило может использовать слово "marketing" — маркетинг, то есть четко определенную дисциплину в соответствии с терминологией категорий работы таких компаний, как корпорация Майкрософт, и поэтому возвращает набор результатов, областью которых является корпоративный репозиторий управления персоналом, содержащий тщательно модерируемый контент по каждой дисциплине. Возможно, будет разумным также предположить, что обе эти интерпретации могут быть неверными, и традиционный запрос по ключевым словам для индекса имеет больше шансов получить те результаты, которые нужны пользователю. Объединение этих трех наборов результатов на одной странице соответствует концепции блоков результатов. Они составляют один ранжированный список отдельных результатов с ранжированным набором блоков, которые вставляются в разные места. Каждый такой блок содержит индивидуально оцениваемые результаты.

Следует еще раз отметить, что для демонстрации всей полноты возможностей базовых концепций требуется гораздо более подробное объяснение.

На следующем снимке экрана показан пример — страница результатов для запроса "marketing deck" содержит блок с элементами "deck" (то есть презентациями), соответствующими запросу "marketing", после которого идут обычные результаты полного запроса.

 

Ссылки с трехстрочными сводками:

 

Было ясно, что попытки "впихнуть" больше информации в фиксированную область экрана, не позволят добиться существенных улучшений с точки зрения способности пользователей быстро просматривать результаты и выбирать из них наилучший. Решением в данном случае стала всплывающая при наведении панель, которую можно было сделать значительно крупнее для отображения предварительного просмотра сайтов, документов и бесед. Она также дала нам возможность перейти от интерфейса, неявно подразумевающего отсутствие альтернатив простому чтению документа или страницы, к расширяемому набору действий, которые пользователи могут выполнять прямо на странице результатов поиска. Например, они могут отслеживать документ, сразу перейти в режим редактирования либо совместно использовать или открыть библиотеку, в которой хранился документ, чтобы просмотреть остальной ее контент, и это все только действия по умолчанию.

Наконец, что не менее важно, вместо того, чтобы полагаться исключительно на текстовые сводки, мы реализовали извлечение семантических разделов для нескольких типов документов, которые отображаются на всплывающей панели в виде удобных "прямых ссылок". Ведь с большой вероятностью можно сказать, что составитель тщательно подбирал заголовки слайдов в презентации PowerPoint, чтобы они отражали содержимое всего слайда, даже если имя самого файла является малоинформативным.

Теперь мы извлекаем и отображаем заголовки слайдов, соответствующие ключевым словам, что позволяет пользователю перейти от запроса, охватывающего индекс в более чем 100 миллионов элементов, к конкретному слайду с релевантным заголовком, а затем открыть презентацию именно на этом слайде всего одним щелчком. Эта возможность также доступна для документов Word и Excel (с ориентацией на графики и именованные таблицы), а также сайтов SharePoint (основные дочерние сайты и библиотеки документов).
 
Платформа пользовательского интерфейса, которая поддерживает все эти новые возможности, также подверглась переработке. Она основана на наборе вложенных шаблонов макета, которые определены в формате JavaScript и HTML для упрощения реализации расширяемости. Каждый тип результатов имеет шаблон для управления макетом в списке результатов и шаблон всплывающей панели. Макеты блоков управляются отдельным шаблоном, после чего макет всех результатов определяется шаблоном группы. Все указанные аспекты можно корректировать в соответствии с требуемым макетом презентации. Одним из примеров является то, что в используемом по умолчанию поиске видео применяется макет сетки с настроенными макетами результатов для представления результатов по видео. Совершенно иной внешний вид достигается простой сменой шаблона без внесения изменений в код для базовых результатов, чего требовала веб-часть.

Все вместе эти улучшения составляют эффективный интерфейс с высокой скоростью реагирования, который доступен из любого места в SharePoint, значительно лучше понимает запросы пользователей и предоставляет визуально дифференцированные результаты с прямым доступом к самой детальной информации, находящейся внутри сайтов и документов, а также позволяет пользователям выполнять действия над результатами, не покидая страницу результатов.

На следующем изображении показан пример внешнего вида интерфейса для презентации PowerPoint: ссылки на соответствующие заголовки слайдов из этого файла, визуальный предварительный просмотр, позволяющий пользователю просматривать презентацию в интерактивном режиме, и набор ссылок действий вдоль нижней части панели.



Поиск как платформа доступа к информации

Третьей целью было использование платформы поиска в качестве более общей платформы доступа к информации.
Правильно настроенный индекс поиска в корпоративной среде вмещает в себя потрясающую коллекцию доступной на предприятии информации — он пересекается с приемниками информации различных систем управления документацией, а также выполняет нормализацию схемы метаданных в рамках этих систем.

Изучение всей этой информации в интерактивном интерфейсе на основе ключевых слов очень удобно, но зачем останавливаться на достигнутом? Существует множество интерфейсов для работы с информацией, которые только выиграли бы от внедрения ориентированного на пользователя представления, игнорирующего границы базовых приемников и использующего возможности сопоставления и ранжирования контента по ключевым словам для отображения наиболее подходящих элементов в начале списка.

Чтобы показать, что именно это значит, я хочу привести несколько примеров, которые по умолчанию входят в состав SharePoint 2013:

  • На личных сайтах пользователи могут получить доступ к списку всех назначенных им задач SharePoint независимо от того, на каких сайтах хранятся такие назначения.
  • Каждая библиотека документов теперь снабжена полем поиска в верхней части экрана, которое позволяет пользователям выполнять поиск в метаданных и полнотекстовый поиск в документах, а список результатов теперь имеет вид стандартного представления SharePoint, а не страницы результатов.
  • При щелчке тега хэша в записи или обсуждении отображается список всех бесед на данную тему в рамках всего предприятия.

В этом выпуске доступно и множество других новых возможностей, таких как новый способ определения типов на основе правил (например, контракт должен отличаться от универсального типа файлов "Word"), улучшенная релевантность готового продукта, которую можно настроить в пользовательском интерфейсе или с помощью XRANK, обнаружение электронных данных, охватывающее SharePoint и Exchange, непрерывный обход контента, который поддерживает актуальность контента на более высоком уровне, средства для объединения результатов из клиентов O365 с локальными результатами в "гибридных" конфигурациях, предоставление системой интерфейсов API CSOM и RESTful и многие другие.

 

Надеемся, что вам понравилось — зарегистрируйтесь для доступа к среде O365 Preview через Интернет или загрузите файлы здесь и установите среду на локальном компьютере.

Позвольте нам узнать, что вы думаете!
 
Герхард.

Это локализованная запись блога. Оригинал статьи находится на странице Overview of Search in SharePoint 2013