规划最终用户搜索体验 (Search Server 2008)

更新时间: 2008年3月

应用到: Microsoft Search Server 2008

 

上一次修改主题: 2015-03-09

提示

除非另有说明,否则本文中的信息对 Microsoft Search Server 2008 和 Microsoft Search Server 2008 Express 均适用。

本节内容:

  • 规划用户执行查询时看到的内容

  • 规划用户在搜索结果中看到的内容

搜索管理员可以通过仔细规划最终用户搜索体验,来改进搜索结果的相关性和显示。该规划的目标是要创建一种搜索体验,使用户能够快速找到所需信息。本文包含的信息可帮助搜索服务管理员和网站集管理员优化最终用户搜索体验。

本文第一节:

  • 描述执行搜索查询的搜索用户界面。

  • 讨论高级搜索以及如何使用属性来筛选搜索结果。管理员可以使用此信息来了解可使用哪些选项来管理关键字和属性,从而优化用户执行功能强大的高级搜索的能力。

  • 讨论结合使用属性搜索和范围的好处。这包括已爬网属性和托管属性的关系如何以及如何对其进行规划。

本文的第二部分介绍搜索结果页面,以及管理员可以控制的影响用户在搜索结果中看到的内容的功能。

本文第二部分:

  • 描述如何规划关键字和最佳匹配。这包括如何为特定组织规划有效的关键字和最佳匹配,以及如何将同义词与关键字相关联以增强最终用户体验。

  • 讨论管理员如何控制特定网站的相关性等级以改进搜索结果的相关性。

  • 介绍新增的联合位置功能,该功能可用于搜索多个源并将结果合并到单个搜索结果页。

  • 介绍如何控制搜索结果中显示的链接。

  • 讨论如何规划基于搜索的通知。

通过使用本文所述的功能,管理员能够控制最终用户搜索体验的许多特性。尽管我们建议您定期评估搜索查询的有效性,但在初始部署之前进行充分的规划能够帮助您从一开始就创建高效的搜索查询,同时减少以后的管理成本。

规划用户执行查询时看到的内容

为了高效地规划适当的配置选择,实现帮助用户找到所需内容的目标,首先应考虑最终用户可在用户界面中看到的内容。

搜索用户界面

若要了解如何规划最终用户搜索体验,首先应熟悉最终用户在执行查询时使用的用户界面。正如您所期望的那样,此用户界面非常简单。此用户界面的重点是搜索框,用户可在该搜索框中输入搜索查询。网站集和搜索中心的所有非管理页面上均提供搜索框。例如,默认情况下搜索框将在网站级别和列表级别以及搜索中心上显示。搜索中心自身就是一个网站集。

以下各部分介绍了网站集各个级别的搜索用户界面。

网站级别搜索用户界面

网站级别搜索用户界面

网站级别搜索框(标注 2)是网页右上角显示的文本框,用户可在其中输入他们的搜索查询,然后单击“开始搜索”图标(标注 3)来运行其查询。

用户看到用户界面中的搜索框时,首先会问“我的查询会针对哪些内容主体运行?”。搜索框旁边的“搜索范围”列表(标注 1)指定内容索引中要对其运行查询的内容的信息主体。搜索范围也称为“范围”,指应用于搜索结果的筛选器,它可以基于范围中是否包含项目来缩小(即筛选)在搜索页中显示的项目。这样,用户便能针对内容索引中的部分内容执行查询,以提高搜索结果的相关性。

默认情况下,网站级别搜索框使用“此网站”范围。这意味着,查询将针对与当前网站及其所有子网站相关联的所有内容运行。

列表级别搜索用户界面

此搜索用户界面在列表级别运行,其外观和功能与网站级别搜索用户界面相同,但可以使用另一个默认搜索范围(名为“此列表”)。列表级别搜索框位于所有网站集中的每个列表和库的右上角,且该搜索框设置为默认使用“此列表”范围。但是,用户可以选择“此网站”范围或自定义范围(如果有)。

搜索中心搜索用户界面

搜索中心提供一个高度可自定义的集中式用户界面,用户可以在其中执行搜索查询。搜索中心包括一个用于输入搜索查询的搜索框和一个指向高级搜索页面的链接,以便用户能够构造高级搜索查询。默认情况下,搜索框设置为“所有网站”范围,以便用户在索引的所有内容中进行搜索。

SharePoint Server 2007 for Search 中的搜索中心

与网站级别上的搜索框类似,搜索中心的搜索框(标注 1)是一个文本框,用户可以在其中键入他们的搜索查询。然后,用户单击“开始搜索”按钮(标注 2)来运行他们的查询。高级用户可以单击高级搜索链接(标注 3)使用高级搜索页面构造查询。下文提供了有关高级搜索页面的信息。

如果 Microsoft Search Server 2008 是使用基本安装选项安装的,则会使用搜索中心模板创建顶级网站。这意味着,您的网站集的首要网站是搜索中心。

下表显示了 Search Server 2008 中默认提供的范围以及他们适用的级别。

范围 允行用户执行的操作 适用级别

所有网站

在索引中的所有内容中搜索

搜索中心

首要网站

子网站

列表和库

此网站:网站名称

在当前网站及其所有子网站中搜索

首要网站

子网站

列表和库

此列表:列表名称

在当前列表中搜索

列表和库

规划自定义范围

本节介绍可用来筛选搜索查询所包含的内容的默认范围。作为搜索管理员,这些信息可帮助您确定组织何时需要通过创建自定义范围来补充默认范围。您可以结合使用自定义范围和范围规则,将索引中的某些内容分组成可单独搜索的内容组合。

例如,您可以设置搜索一组特定网站、某人创作的或是在某个时间段创作的所有 Word 文档,或者任意组合这些参数。

您也可以在网站集级别创建自定义范围,这样,可以向该网站集提供在其上创建的自定义范围。

在规划搜索范围时,您需要查看自己的信息体系结构,确定用户可能要搜索的广泛内容集。某些内容集将跨越许多网站,而有些内容集将跨越网站集内的信息子集。

为网站集规划范围

在规划期间,每个网站集管理员都要基于网站中的信息体系结构来创建范围。

下面列出了网站集管理员可在网站级别执行的与范围相关的任务:

  • 选择如何显示搜索范围(搜索下拉列表、高级搜索或两者均可)。

  • 创建网站集级别范围。

  • 编辑网站集级别范围(下面提供了详细信息)。

  • 添加范围规则。

  • 删除网站集级别范围。

  • 查看状态。例如,它们包含哪些范围规则以及它们在范围列表中的显示顺序。

创建或编辑新网站集级别范围时,要指定以下项:

  • 唯一的标题。

  • 范围的说明(可选)。

  • 显示组,有时也称为范围组。网站集管理员可以将范围分配到显示组,以确定它们在网站中的显示位置。默认情况下,Search Server 2008 会为搜索框下拉列表和高级搜索页面提供显示组。网站集管理员可将一个或多个范围分配给任意显示组,或者创建新的显示组。

  • 结果页面。您可以选择使用默认搜索结果页面来显示使用该范围时的搜索结果,也可指定其他页面。请注意,如果您选择使用其他页面,则必须先创建该搜索结果页面。

规划显示组

显示组提供了一种为特定搜索框分配范围的方法。网站集管理员具有多个用于配置现有显示组的选项,或者,他们也可以选择创建一个或多个新显示组。通常情况下,网站所有者会确定显示组的特定需求。例如,某特定工作组网站的用户可能会经常需要搜索分散在多个文档库中的内容。为了缩小要搜索的内容主体,他们目前必须在不同的搜索框(例如,每个库的搜索框)中单独执行搜索或者构造一个高级查询来筛选搜索结果。为了向用户提供更简单的方法来执行这一常用搜索,网站集管理员会创建一个显示组并为其分配适当的范围。然后,网站所有者可以将此显示组与特定的搜索框相关联。例如,网站自定义搜索页面上的搜索框。然后,用户使用该搜索框在该范围定义的内容(在此例中,指文档库)中进行搜索。默认情况下,Search Server 2008 提供两个显示组:

  • 搜索下拉列表   默认情况下,“所有网站”范围分配给此显示组,且由搜索框使用。

  • 高级搜索   默认情况下,“所有网站”范围分配给此显示组,且由高级搜索页面上的搜索框使用。

网站集管理员可以执行以下操作:

  • 将范围添加到任意显示组。

  • 从任意显示组中移除范围。

  • 创建新显示组并为其分配所需的范围。

  • 更改范围在搜索范围列表中的显示顺序。

  • 指定搜索范围列表中默认选中的范围。

网站所有者可以执行以下任务

  • 将不同的显示组分配给搜索中心网站中的搜索框和高级搜索页面。

  • 使用搜索框和高级搜索框 Web 部件创建新的搜索页面并为其分配所需的显示组。

规划范围规则

您可以通过为范围添加范围规则来定义范围。范围规则定义与范围关联以及不关联的内容。为特定范围添加的范围规则可定义范围的大小。

每个范围规则都基于一种特定的范围规则类型,该类型定义内容的属性、位置和来源。下表列出了网站集级别搜索范围可以使用的范围规则类型。

范围规则类型 是否适用于网站集级别搜索范围 测试内容的依据

Web 地址 (https://server/site)

位置

属性查询(作者 = Jane Dow)

单个属性

内容源

特定的内容源

所有内容

内容索引中的所有内容

“所有内容”范围规则类型最简单,原因是:它将所有已爬网的内容与该范围相关联。对于其他三种范围规则类型中的每种类型,搜索服务管理员可以指定范围规则的行为,以此确定与范围相关联的内容。下面的列表描述了这些行为:

  • 包含    除非被其他规则删除,否则,与此规则匹配的项会显示在搜索结果中。合并规则时,此行为类似于 OR 逻辑运算符。

  • 要求   与其他规则相匹配的项还必须与此规则相匹配,才能显示在搜索结果中。此行为与 AND 逻辑运算符等效。

  • 排除   与此规则相匹配的项不会显示在搜索结果中,即使它们与其他规则匹配也是如此。此行为与 AND NOT 逻辑运算符等效。

范围通常基于单个范围规则。但是,由于一些正当原因,我们需要将范围与多个规则结合使用。您可以基于特定的主题或在概念上相关的内容集创建范围。为此,您可以包括或排除多个位置、属性或者在概念上相关的位置和属性的组合。规则的逻辑组合可确定在范围中包括或排除的内容。

使用基于位置的范围规则

您可以使用 Web 地址范围规则类型,基于内容的位置(Web 地址或 UNC 路径)创建规则。有几个使用方案需要使用这种规则,包括以下内容搜索范围:

  • 在一组文档库中。

  • 在一个大型文档库中的一组文件夹中,例如,当搜索公司的存档文件时。

  • 在介绍特定主题的外部网站上。

  • 在组织中的其他服务器上。

每个 Web 地址范围规则都包含一个位置,该位置由单个文件夹、域名或服务器名称定义。您可以根据要在范围中提供的内容集添加匹配规则,直到范围中包括所有相关位置并排除所有无关位置。检查信息体系结构和网站结构规划可帮助您确定要在每个范围中包括的位置。

使用基于托管属性的范围规则

您可以使用“属性查询”范围规则类型,基于单个托管属性的特定值创建范围规则。在创建这种范围规则之前,应对以下几个方面进行确认:

  • 您要使用的托管属性是否存在,因为它是默认托管属性或者是由搜索服务管理员创建的托管属性。

  • 将托管属性配置为可在范围中使用。默认情况下,系统会创建多个托管属性,但只有少数几个被配置为可在范围中使用。只有搜索服务管理员专为范围提供的托管属性可在搜索范围内使用。

    提示

    搜索服务管理员可以使用特定属性的“编辑托管属性”页面,使该属性可在范围中使用。

创建范围规则后,会根据该特定值对与属性查询匹配的每项内容进行测试,并根据该规则包括或排除这些内容。对于基于属性的规则,只能使用 Is exactly 运算符对其进行查询,而不能依据其他运算符(如 Contains)对其进行查询。

例如,某销售门户网站的网站集管理员可以通过以下方法为每个销售办事处创建范围:使用 SalesOffice 托管属性,并将每个范围中规则的值设为相关办事处的值。因为此托管属性用于定义范围,所以使用此范围时的搜索结果将只包括相关销售办事处的内容。

贵组织在规划托管属性时应考虑范围。若要为一组特定的内容创建范围,必须确保该内容的某些属性映射到可包含在范围规则中的托管属性。

使用基于内容源的范围规则

如果您具有搜索服务器管理员权限,则可以对网站集级别内容源创建范围规则。您可能会出于以下原因执行此操作:

  • 要创建按照不同计划对内容进行爬网的其他内容源。

  • 要创建单独的内容源,以对不同 SharePoint 服务和技术服务器场或文件共享上的内容进行爬网。

  • 要将内容分成较小的集,以与范围规则结合使用以及创建更窄范围的内容。

有关内容源规划的详细信息,请参阅规划内容爬网 (Search Server 2008)

使用“所有内容”范围规则类型

当您使用“所有内容”范围规则类型创建范围规则时,内容索引中的所有内容均可用于该范围。如果您想创建较窄的范围,则可为使用“所有内容”范围规则类型的范围添加范围规则,以从该范围中排除特定的内容。

使用具有排除行为的范围规则排除内容

可以复制“所有网站”范围并将其用作起点来包括内容索引中的所有内容。然后,您可以添加从搜索结果中排除内容的范围规则,以创建广泛、但不包括某组特定搜索结果的范围。有时,使用具有排除规则的“所有网站”范围的副本比创建具有包含网站上每个内容子集的规则的复杂搜索范围更为简便。

无论您是首先复制“所有网站”范围还是另一范围,您可能都要考虑添加排除内容的范围规则,由于从搜索结果中排除内容的原因可能与包括内容的原因有很大区别,所以这一步将与添加包括内容的范围规则分开执行。

高级搜索

在很多情况下,用户只是在搜索框中键入关键字短语,然后单击“开始搜索”按钮或按 Enter 键来执行他们的查询。如果通过此方法无法在搜索结果的前几页上生成所要查找的结果,则有些用户会放弃。但是,高级用户可选择再次尝试使用更高级的查询来搜索他们所要查找的内容。

提示

随着用户搜索的内容数量的增加,他们使用简单关键字短语找到所需内容的机会将不断降低。

极其高级的用户可以在搜索框中构造高级搜索查询。例如,要寻找由 David Jones 创作的、包含单词“negotiate”的内容,他们可在搜索框中键入以下查询:

negotiate author:jones

但是,大多数用户都不熟悉以这种方式构造高级查询所需使用的语法。因此,大多数用户都使用高级搜索页面来构造高级查询,利用高级搜索页面,用户可以找到他们使用语法搜索的内容。下表介绍了高级搜索页面上与关键字相关的选项。

查找文档时使用的选项 执行的操作

下列所有单词

搜索包含用户键入的所有关键字的内容,但这些单词出现在内容中时不必遵循任何特定顺序。

精确短语

搜索包含用户键入的单词的内容,单词在内容中的顺序与用户键入单词的顺序完全相同。

下列任意单词

搜索包含用户键入的任意单词的内容。

无下列单词

搜索不包含用户键入的单词的内容。

用户还可以使用高级搜索页面,将搜索范围缩小到特定语言或文档类型。最后,用户可以选择属性限制,以根据他们选择的属性的值是否与他们输入的值匹配来筛选搜索结果。例如,用户可选择“作者”属性,选择“Contains”包含运算符,键入一个值,然后单击“搜索”。

默认情况下,系统提供了多个被称为托管属性的属性,如“作者”和“标题”。但是,大多数默认托管属性都不能用于范围。搜索服务管理员可选择他们要在范围中提供的托管属性并创建其他属性,以满足其组织的需求。

规划要搜索的属性

您可以将具有共同主题的内容放在同一位置,以此来组织网站集中的内容,从而实现高效搜索。这样,您可以利用网站和列表级别的默认范围来搜索内容。例如,您可以创建一个网站,存储某个特定项目的所有信息。在该网站中,您可以创建单独的文档库和列表来存储与该项目相关的不同类型的信息。用户可使用默认范围“此网站”在网站的所有内容中进行搜索,或者使用“此列表”范围在网站上特定列表或库的内容中进行搜索。搜索服务和网站集管理员可根据需要为用户创建自定义范围,以在不同部分的内容中进行搜索。

尽管这样可以简便地组织内容以实现高效搜索,但这种方法本身无法满足所有组织的需求,尤其是需要搜索大量内容时。其原因如下:

  • 有时,不可能在同一位置组织所有具有共同主题的内容。

  • 即使部署时在同一位置组织所有具有共同主题的内容,这些内容也可能会随着时间的推移而分散到网站集的各个位置。

我们建议您在必要时按位置组织内容,然后使用属性补充这种组织方式。

托管属性和已爬网属性

对内容进行爬网时,爬网程序还会爬网与该内容关联的属性。已爬网属性包括存储在您的组织使用的文件和数据库中的内容元数据。已爬网属性可以表示不同种类的信息,如作者、标题和电子邮件地址。

利用 Search Server 2008,搜索服务管理员可以创建托管属性。然后,搜索服务管理员可以将爬网程序在爬网内容时收集并添加到属性存储区的已爬网属性映射到搜索查询使用的托管属性。

托管属性和已爬网属性之间的关系很简单,但非常紧密。搜索服务管理员可将一个或多个已爬网属性(爬网程序发现的属性)映射到托管属性(可在范围规则和查询中使用的属性)。这种映射非常重要,原因是:许多已爬网属性包含相同种类的元数据,并且已爬网属性的名称通常不太直观。例如,默认情况下,名为“Mail:6”和“Office:4”的已爬网属性映射到名为“作者”的托管属性。这是因为,这两个已爬网属性的值包含作者的姓名。已爬网属性与托管属性之间的这种映射关系可简化管理,并使用户受益。管理员会受益是因为他们在创建范围时需要处理的属性将减少。而在搜索框中构造高级查询的最终用户也会受益,因为他们需要记住的属性名称不但数量减少,而且更加直观。

托管属性具有下列优点:

  • 用户可以使用托管属性在搜索框中构造查询,以筛选搜索结果。

  • 您可以在高级搜索页面上使用属性,以便最终用户能够轻松地筛选搜索结果。

  • 网站所有者可以自定义高级搜索页面,以使用不同的托管属性。

  • 搜索服务管理员和网站集管理员可以用基于查询来筛选搜索结果的规则创建自定义范围。最终用户不需要学习如何构造高级查询,即可利用基于属性的高级查询。

默认情况下,系统会创建多个托管属性并将其映射到已爬网属性。搜索服务管理员可将其他已爬网属性映射到现有托管属性,并创建新的托管属性。

在查询中使用属性

要使已爬网属性的值对搜索查询生效,已爬网属性必须映射到托管属性,而且该托管属性必须可用于各个范围,用户必须对该托管属性执行搜索。如果包含太多已爬网属性的值,则可能会对搜索相关性和性能产生负面影响。

规划 Search Server 2008 初始部署的管理员应记录搜索服务规划的第一组托管属性。

查看应用程序中显示的各种内容类型的属性可发现许多已爬网属性,例如 Microsoft Office Word 或 Office Excel 文档。

如果您可以访问测试服务器,则可以对高优先级的内容进行爬网并使用显示的已爬网属性帮助进行规划。

您可以通过仔细规划托管属性以及它们的实现方式,来使网站上的内容更易于查找。规划部署时,我们建议您尽量减少托管属性的数量。这意味着,需要仔细考虑哪些属性对贵组织最有用,并将那些属性部署为起点。如果需要,您可以在部署完成后随时创建其他托管属性。

规划托管属性

确定潜在托管属性的一种可行方法是:检查现有的内容及其高优先级元数据。如果您在实际部署 Search Server 2008 之前能够访问测试场,则可以对内容进行爬网并查看有哪些已爬网属性出现,然后使用这些属性来确定部分信息体系结构。但是,对于大多数组织而言,在进行部署之前,以书面形式规划信息体系结构会很有帮助,原因是:这有助于将重点放在规划上并确定哪些内容和流程的组织效果不够理想。

创建一组有用的托管属性的关键在于确定最重要的概念,并在内容中查找可映射到托管属性(使用户能够在搜索时找到相关内容)的属性。映射过多的属性会使数据库增大,也会相应地降低性能,因此最好仅在确信映射的相关性时才映射属性。

有些概念用于建议网站集结构和网站集中的内容。其他概念则用来创建特殊的字词,如突出显示相关搜索结果的关键字。

如果不先对内容进行爬网,将很难发现内容的属性。因此,最好在充分了解每个网站集的内容之后,再规划托管属性。然后,可以在测试服务器上对所有这些内容进行爬网,以便拥有已爬网属性的列表,创建托管属性时要根据信息体系结构对这些已爬网属性进行比较。即使在对内容进行爬网之后,可能也很难对属性进行映射,原因是:很难确定使用该属性的内容类型或应用程序。如果无法确定特定属性的性质和内容,则可能需要在测试环境中设置映射,然后试验通过此属性进行搜索。

许多最有用的托管属性是在安装 Search Server 2008 时自动创建的。在规划其他托管属性时,应使用这些托管属性作为起点。自动创建的属性包括:

  • 作者

  • 说明

  • 网站名称

  • 类型

  • 文件大小

  • 上次修改日期

  • URL

  • 标题

请记住,要有效地使用属性执行搜索,必须首先为已爬网属性分配值。例如,如果您的一个文档中包含映射到名为“作者”的托管属性的属性,但在该文档中没有为这个属性分配值,则当用户使用“作者”属性查询特定作者时,该文档不会显示在搜索结果中。

避免重复的托管属性

有些属性的级别相当低,可能会在不同类型的内容中显示为不同的属性。例如,文档的作者和标题属性。

在规划期间,可以对这些基本属性执行的最重要的操作是减少重复,方法为:创建一组托管属性,并将具有相同含义的已爬网属性映射到该组托管属性。对于“作者”属性,可以将作者的某个已爬网属性的每个特殊外观映射到一个“作者”托管属性。

可以将一个或多个已爬网属性映射到一个或多个托管属性。

提示

作为一个单独的托管属性添加每个“作者”属性没有任何意义,因为它只是向数据库中添加了其他托管属性,而不会提高相关性。

您可以选择排列多个已爬网属性的优先级,这样,如果在爬网过程中发现多个属性,只会将优先级最高的属性的值用于使用托管属性执行的查询。如果不排列已爬网属性的优先级,则会将映射到托管属性的所有已爬网属性的值用于查询,这样,该托管属性便会成为多值属性。这意味着,只要内容包含与查询匹配的任何映射属性的值,搜索结果就会返回其结果。对于单值属性,明智的方法是选择最常见的已爬网属性作为托管属性,然后根据已映射属性的出现频率排列这些属性的优先级。确定哪个属性被爬网的频率最高通常并不轻松,但可通过一种策略来确定这一点,即,对您确定与常用应用程序相关联的属性排列优先级。

在映射具有不同数据类型的属性时,搜索功能通常使用托管属性的数据类型。

因为不精确的映射实际上会降低搜索结果的相关性,所以映射属性时应注意不要映射匹配度不高或无关的属性。如有可能,请在进行初始部署之前针对托管属性测试搜索,并计划在正常操作过程中检查搜索查询的使用率数据以精确调整映射的属性。

添加用于表示信息体系结构中重要概念的属性

默认情况下,除了映射到托管属性的已爬网属性之外,其他已爬网属性也可以明确地映射到信息体系结构中尚未由现有托管属性捕获的概念。例如,公司可以将客户服务确定为其信息体系结构中的一项关键业务流程。信息体系结构中与客户服务相关联的重要概念可能包括客户、客户服务代表以及客户服务区域。

对于信息体系结构中的每个概念,询问自己是否存在表示可映射到托管属性的此概念的已爬网属性。如果存在,则将该属性转换为托管属性。

请注意,尽管信息体系结构中的许多概念都不用属性表示,但是,在规划网站结构和实现其他搜索功能的过程中,这些概念非常有用。通过信息体系结构可以发现自己没有注意到的托管属性,但这仅仅是因为:某个概念列在信息体系结构中并不表示该概念具有或应该具有相应的托管属性。

在搜索范围中使用托管属性

每个托管属性都可以作为搜索范围规则的一个属性公开。有关规划搜索范围的详细信息,请参阅上文中的“规划搜索范围”部分。

计划使用 IFilter 集成新文件类型的属性

Search Server 2008 使用属性类别在每个类别中按文档对属性进行爬网。属性类别包括搜索功能在为内容编制索引时所使用的协议处理程序和 IFilter。在对内容进行爬网之前,需要将内容与属性类别相关联;在创建托管属性之前,可以通过这些属性类别以最有效的方式找到所需的已爬网属性。若要向 Search Server 2008 注册 IFilter,请参阅如何向 SharePoint Server 2007 和 Search Server 2008 注册 Microsoft 筛选包

如果要将内容添加到要求不同 IFilter 或协议处理程序的内容索引,您可以通过编程方式为该内容创建新的属性类别。作为初始规划过程的一部分,您应当确定哪些内容需要新的 IFilter 和协议处理程序。尽管系统提供了一些 IFilter 和协议处理程序,这仍可能需要自定义代码。

有关属性类别的信息,请参阅管理元数据属性映射 (Search Server 2008)。有关对内容爬网的详细信息,请参阅规划内容爬网 (Search Server 2008)

规划用户在搜索结果中看到的内容

Search Server 2008 提供了几个设置,使搜索服务和网站集管理员能够控制用户在搜索结果页面中看到的内容。尽管您可以通过许多不同方式控制搜索结果,但我们建议您在部署过程中进行以下规划:

  • 规划关键字、最佳匹配和同义词。

  • 规划最相关和最不相关的网站,以控制他们距搜索结果顶部的距离。

  • 规划是否使用联合位置和联合 Web 部件。

  • 规划链接的外观。

  • 规划用户是否可以使用基于搜索的通知。

规划关键字和最佳匹配

关键字 有时称为关键字短语,是指用户在构造查询时在搜索框中键入的单词。当用户执行简单的关键字搜索时,例如在搜索框中输入单词“widget”,然后单击“开始搜索”按钮,Search Server 2008 会显示选定范围内所有包含该关键字的内容的搜索结果。

Search Server 2008 使网站集管理员能够创建一个名为关键字的实体,该实体与索引中的同名关键字短语直接相关。网站集管理员可以使用一个或多个单词创建关键字。例如,关键字可以是单个单词(如“OOF”)或一组必须以特定顺序键入的单词(如“out of office”)。

除关键字(也称为关键字短语)的名称外,网站集管理员还可以创建由下面一个或多个选项组成的关键字:

  • 搜索结果中显示的关键字的定义

  • 一个或多个同义词

  • 一个或多个最佳匹配,它们是搜索服务管理员指定与某特定关键字高度相关的 URL

提示

虽然您可以创建不包含上面列出的任何可选信息的关键字,但是这样做不会提高搜索结果的相关性。

利用关键字,网站集管理员可以提高最终用户查询的相关性。对于任何网站集的搜索结果,都可以对其进行修改以提升特定内容,使该内容以更加醒目的方式显示,从而响应使用特定搜索条件的查询。尽管关键字是在网站集级别规划、实现和管理的,但是最好确保其规划和实现在整个组织内保持一致。

关键字定义是一个好方法,通过它,用户可以轻松地对每个网站集中的高优先级概念的相关信息进行访问。对于每个概念,网站集管理员可以创建一个关键字,以使该关键字的定义显示在搜索结果旁边的搜索最佳匹配 Web 部件中。例如,致力于销售特定产品系列的销售门户可能会为该产品系列中的重要项目提供定义。这些定义可用来帮助销售合作伙伴更好地了解他们的产品,或者这些定义可在面向客户大众的门户网站上的搜索结果中显示。

关键字示例

网站集管理员知道最终用户很难找到用于跟踪工作组成员何时外出的日历。用户报告说,他们搜索日历时,查询会产生很多页无关的搜索结果,他们查看过前几页之后便会放弃。

网站集管理员决定创建一个名为“oof”的关键字,其中包含以下项目:

关键字定义:这是“out of office”的缩写。

同义词:time off

最佳匹配:指向日历的 URL 和最佳匹配的说明。

然后,网站集管理员让最终用户在搜索日历时使用新关键字“oof”或它的同义词“time off”。

下图演示在此应用场景中,最终用户在搜索中心中搜索关键字“oof”时会看到的默认搜索结果页面示例。请注意,默认情况下,最佳匹配和关键字说明仅显示在通过搜索中心运行的搜索所对应的搜索结果页中。

Office SharePoint Server 最终用户搜索

上图显示了最终用户运行的查询(标注 1)。“关键字突出显示”功能还以粗体文本显示内容中的关键字(标注 2)。网站集管理员分配给该关键字的说明默认显示在搜索结果页面的右上角(标注 3)。每个关键字可与一个定义相关联,并且您可以在定义中包括一个 URL。因此,最好执行以下操作:

  • 在规划过程中确定定义来源。

  • 在规划阶段包括一个单独的步骤,以设计一个词汇表并在其中包括每个网站集内的关键字使用的全部定义。

  • 创建一些专门用来将关键字与定义关联的关键字。

如果有,会直接在关键字说明下方显示最佳匹配(标注 4)。最佳匹配不只是一个 URL。它们还可以具有标题,也可以具有说明。在此示例中,网站集管理员将最佳匹配命名为“Out of Office 页面”。管理员分配给该最佳匹配的说明直接在其名称下方显示,然后依次显示最佳匹配的 URL。

常用的最佳匹配包括与搜索词在概念上相关联的特定文档、网站和专业人员。在内容规划过程中,一定要考虑每个最佳匹配的标题和说明,以提高每个最佳匹配的相关性和可用性。在管理用户界面中,最多可以将 25 个最佳匹配与每个关键字相关联;在对象模型中,还可以关联更多的最佳匹配,但最好不要过度使用最佳匹配。有效的内容规划可帮助您确定每个关键字适当的最佳匹配数量,以平衡搜索结果数量与搜索的相关性。

提示

因为最佳匹配的 URL 是由网站集管理员硬编码的,所以它可以为任意 URL。甚至可以指向尚未被爬网的内容。

您可以为多个关键字使用相同的最佳匹配。如果已存在最佳匹配,您可以将其添加到任何关键字,而不必再次输入最佳匹配的属性,但这可能导致多余的最佳匹配。也可以为所有使用它的关键字同步更改最佳匹配的 URL 和说明。如果要在规划过程中和初始部署前使用测试网站,此功能尤其有用。

了解同义词

同义词指一个或多个与某特定关键字密切相关的单词。例如,关键字“car”的有效同义词可以是“auto”、“automobile”或“SUV”。因为您预计有些用户会在搜索框中键入这些词来搜索汽车,所以,这些词都是该特定关键字的有效同义词。网站集管理员可以为每个关键字定义一个或多个同义词。同义词的目的是为了在使用关键字时在搜索结果页面上显示相同的关键字定义和最佳匹配。在前面的示例中,如果最终用户使用同义词“out of office”运行搜索查询,他们会看到与使用关键字“oof”运行搜索查询时所看到的完全相同的关键字说明和最佳匹配。但有一个区别,即,他们看到的搜索结果只有包含短语“out of office”的内容,而没有包含单词“oof”的内容。

当使用多个搜索词来搜索同一概念和内容时,同义词非常有用,这样,搜索结果将合并到一起,而不是分散在几个搜索词中。在网站集管理员创建关键字并添加同义词时进行更新的列表称为同义词库。Search Server 2008 的同义词库可兼容 Microsoft Office SharePoint Portal Server 2003 的同义词库。

使用信息体系结构来确定关键字

可以使用由内容规划工作组创建的信息体系结构来确定要与关键字关联的高优先级内容。因为信息体系结构包含搜索词列表,所以您可以使用其中一些搜索词快速创建可与高度相关的特定内容相关联的关键字。

相关内容 是指您希望人们在使用特定关键字进行搜索时最先看到的或最可能看到的特定内容。对于每个重要的业务概念或内容区域,相关内容的示例包括:

  • 文档

  • 网站

  • 人员

  • 定义

  • 表示相同事物、但未包括在搜索查询中的已批准的或正式搜索词

将关键字与最佳匹配相关联有助于鼓励人们查看在关键业务流程上开展协作所需的关键文档。例如,某个公司可能有适用于费用报表的特殊模板,还有一个将该模板提升到搜索结果顶部的关键字“expense report”。如果没有该关键字,那么每位员工都可能需要花几分钟的时间向同事询问正确的 URL 或者浏览公司网站。有了与作为最佳匹配的费用报表模板 URL 关联的关键字,员工便可迅速找到该模板。

网站的关键字有助于确定大型组织中提供相关信息的网站的位置。例如,对于包含有关员工的带薪休假信息的人力资源网站,“holidays”可能是与包含该网站 URL 的最佳匹配相关联的关键字。理想情况下,最佳匹配可能包含提供公司休假信息的确切页面的 URL。

关键字的安全注意事项

与早期版本的 Office SharePoint Portal Server 不同,关键字和最佳匹配不会受安全权限的影响,而且网站集上的所有读者都可以看到搜索结果中显示的、该网站集的所有最佳匹配和关键字。如果用户没有权限查看最佳匹配链接到的页面,则用户不能转到该页面。但是,他们可以在搜索结果页面上看到最佳匹配说明和指向该内容的 URL。这可能会使某些用户看到他们并未打算查看的信息。

关键字是为了向所有用户提供高优先级的结果。如果您希望基于特定用户的权限向他们显示内容,则可以在网站集上的适当位置使用访问群体和目标 Web 部件。

规划组织中的关键字

应事先规划关键字以帮助确保在整个组织中使用一致的关键字,这一点非常重要。尽管关键字是在网站集级别实现的,但您应尽可能确保关键字在各网站集间保持一致。

较差的关键字规划示例

网站集管理员在市场营销网站集上创建名为“super list”的关键字,并为该关键字创建了一个包含公司客户列表 URL 的最佳匹配。另一个网站集管理员在销售网站集上创建名为“Master list”的关键字,并为该关键字创建一个包含相同客户列表 URL 的最佳匹配。

使用这两个网站集的用户会感到困惑,因为他们的关键字搜索无法一致地显示他们希望在搜索结果页面上看到的最佳匹配。例如,主要使用市场营销网站集的员工习惯使用关键字“super list”进行搜索,并且认为该关键字适用于所有网站集。

提示

如果要规划在组织间保持一致的关键字,则各网站集管理员之间需要有良好的协作。

在小型组织中,内容规划工作组可能会很小且是围绕单个网站集进行组织的,而且,关键字的规划工作可能会由一位或两位人员进行组织。而在大型组织中,使用较大的规划工作组可能更有用。您应该包括每个级别的业务规划人员和管理员,以确保满足所有业务需求。

即使尚未对内容进行爬网,最佳匹配也会出现在搜索结果中。这是在初始部署期间规划关键字(以便在对所有内容源进行爬网之前的早期部署阶段可以使用高优先级内容)的另外一个原因。在极少数情况下,由于搜索中缺少相关的 IFilter 或者由于其他任何技术原因而导致无法对内容进行爬网,此时可以使用最佳匹配来使内容更便于查找,即使尚未对内容进行爬网也是如此。

组织的各个级别的重要人员均可为自己的网站集规划关键字。这些人员将使用同一整体内容规划,并针对他们所规划的网站集上的内容对该计划加以修改。关键字规划会在部署之前开始,随着时间的推移,在部署之后,关键字规划将继续分阶段实施,规划关键字时,各组内容规划人员需要相互沟通,确保总体规划中的一致性。

并非所有关键字都是在部署之前规划的。内容规划工作组负责确定与组织中的搜索查询最为相关的高优先级概念,以便搜索查询从部署的第一天起就与用户相关。该规划工作组还可以确定每个关键字的联系人,联系人可以是也可以不是该规划工作组的成员。在部署之后,网站集管理员可以先在查询日志中确定常见的搜索词,然后对关键字列表进行扩展。

在规划阶段,关键字列表管理人员应当考虑关键字如何与查询相匹配。关键字必须与搜索词的整个字符串完全匹配,而且在搜索列表中的内容时不得使用 + 和 - 等特殊语法。这有助于防止针对同一个搜索查询返回多个关键字列表,从而简化搜索结果。

规划关键字管理

关键字管理的细节与网站集的日常操作最为相关,但是某些方面的管理应当在部署规划过程中加以考虑。尤其是网站集管理员可以分配给属性的可选联系人和发布属性。

提示

在部署之前规划得越周密,在日常操作过程中所需的管理就越少。

每个关键字都具有下列可选属性:

  • 开始日期、结束(到期)日期和检查日期

  • 联系人

关键字可能需要先经过审批才能对搜索结果产生影响,而且还可以设置为在某段时间之后开始或到期。在初始规划过程中确定的高优先级关键字不太可能是临时性的,但与在初始部署过程中使用网站集的人员相关的内容除外。

每个关键字的联系人是指关键字过期(如果为关键字设置了过期)时应该联系的人员。每个网站集的内容规划人员应考虑在初始部署后谁将管理关键字,并且,在网站集级别的规划过程中至少包括一部分这类人员。

但是,规划过程应当包括预测谁将在以后就关键字做出决定。在规划过程中做出这些决定可以改进向网站集常规操作的过渡,并提高在将来使用关键字的一致性和有效性。

有关管理关键字的详细信息,请参阅管理设置以改进搜索结果 (Search Server 2008)

规划搜索结果的相关性

要在其中进行搜索的内容正文越大,特定查询就越有可能显示多页搜索结果。使用基本关键字查询而非高级查询时,尤为如此。为了改善最终用户体验,应确保尽量在搜索结果页面中靠前的位置显示指向最相关内容的链接。

Search Server 2008 允许搜索服务管理员分配已索引网页相关性设置。每个与特定网页关联的相关性设置将确定指向特定网页的链接在搜索结果页面中显示的靠前程度。已分到相关性设置的页面也称为权威页面

权威页面设置是决定搜索结果优先级的因素之一,但不会高于任何其他因素,如网站集管理员管理的关键字、搜索服务管理员管理的托管属性或者搜索技术对内容应用的自动权重。

权威页面设置在搜索管理级别上配置,搜索服务管理员可以为网站分配下列四个权威页面级别之一:

  • 最权威

  • 二级权威

  • 三级权威

  • 要降级的网站

网页的权重基于其权威性来计算,每个级别与相关性权重是成比例的。默认情况下,Web 应用程序的所有顶级页面均会作为最权威的页面自动添加。您可以将这些页面移动到其他权威页面级别,或者将它们从权威页面设置中完全删除。

如果考虑了所有其他相关性权重因素,则获得了“要降级的网站”设置的网站通常会在靠近搜索结果末尾的位置显示。

这意味着,它们在搜索结果页面中经常会显示在甚至未被指定为权威页面的页面之后。我们建议您对包含不相关信息的网站(例如,存档网站)使用该设置。

规划权威页面设置时,应考虑每个网站的用途并检查它的子网站。按重要性将权威网站分为三个级别,并将不可能相关的网站归到“要降级的网站”组中。

在规划权威页面设置时,可采用以下效果不错的做法:

  • 高优先级业务流程的核心 SharePoint 网站通常最为权威。

  • 鼓励协作或操作的网站可能比仅提供信息的网站权威性高。

  • 对于单纯提供信息、但并不是高优先级业务流程的核心或者并不用于开展协作的网站,可能属于二级或三级权威网站。

  • 外部网站的权威性通常较低,原因是:组织无法控制这些网站上的内容。

  • 不需要为每个网站分配一个权威页面设置。最好为少数几个已知最权威或不太相关的网站选择相关性,然后在正常操作期间基于用户的反馈以及查询日志和爬网日志中的信息来调整权威页面设置。

规划是否使用联合位置和联合 Web 部件

联合是 Search Server 2008 中的一项新功能,可以通过最终用户后来的搜索体验来规划联合。通过利用联合,最终用户能够执行查询,以便搜索多个源并将结果合并到单个搜索结果页面。这些源可能包括:

  • 贵公司的企业内容库

  • 贵公司使用的 Internet 搜索引擎或订阅服务

  • 其他部门或世界区域中由 Search Server 2008 编制索引的企业文档

最终用户执行查询时,Search Server 2008 将使用新的联合 Web 部件对结果进行格式设置并将其显示在索引结果的旁边。

对用户搜索联合位置时的体验进行规划时,可尝试主要根据公司用户的搜索需求和习惯来进行规划。问问您自己:用户为提高工作效率最需要查找哪些内容?他们目前使用哪些查询?确定目标联合位置以解决公司的关键信息问题。

使用联合时,该功能往往会添加许多联合位置,以满足用户所有可能的需求。令人遗憾的是,这样会导致许多用户因联合结果过于混乱而将其忽略掉。

为了帮助确保查询的联合结果为有用的查询结果,联合位置可以将特定查询格式与触发器规则匹配。如果为联合位置创建触发器规则,则与该位置相关联的 Web 部件将只显示与您指定的模式或前缀匹配的查询结果。

例如,假定您在一家生产小组件产品的 Contoso 公司工作。该公司的员工每天都需要使用十位数的小组件 ID 频繁查找这些小组件。这些小组件存储在 Search Server 2008 无法进行爬网的数据库中。为了使 Contoso 员工能够搜索到小组件,您生成了一个可以搜索小组件数据库的联合连接器。但是,显示每个查询的小组件信息可能会让您的用户感到沮丧。因此,您使用一个可识别十位数查询的模式创建了联合位置触发器。现在,用户搜索小组件 ID 时会从小组件数据库中获取顶部联合结果。

有关使用触发器和触发器规则的详细信息,请参阅 Search Server 2008 帮助中的“使用触发器和查询模板”。

可以使用联合结果 Web 部件或顶部联合结果 Web 部件在搜索结果页面上添加和配置联合结果。默认情况下,搜索结果页面包含两个联合搜索结果 Web 部件和一个顶部联合结果 Web 部件。可以在搜索结果页面上设置 Web 部件中的联合位置及其属性。

有关联合的详细信息,请查看 Search Server 2008 帮助中其他位置的联合搜索结果。

规划链接的外观

搜索服务管理员可使用服务器名称映射更改特定 URL 或系列 URL 在搜索结果中的显示方式。服务器名称映射是针对由该搜索服务进行爬网的所有内容在搜索管理级别设置的,并在执行查询时应用。在以下情况下,您可能希望使用服务器名称映射:

  • 您希望避免由显示服务器上的本地地址的链接所导致的访问问题和可能的安全漏洞。例如,根据内容的爬网方式,URL 可能会显示服务器上的本地路径。

  • 您希望在搜索结果中隐藏复杂的 URL,以便将它们替换为服务器上更简洁的名称。

  • 出于安全原因,您希望隐藏内容原始来源的名称,如服务器名称或共享名称。

仅在您遇到以上列表所描述的一个显示问题时使用服务器名称映射。在大多数情况下,将尽可能减少在初始部署之前对服务器名称映射进行规划。

规划基于搜索的通知

搜索服务管理员可以决定是否为特定搜索中心激活基于搜索的通知。如果激活基于搜索的通知,并且将服务器配置为发送电子邮件,则最终用户可以单击搜索结果页面顶部的“通知我”链接,并指定他们希望系统针对哪种更改向他们发出通知以及收到电子邮件通知的频率。请注意,允许基于搜索的通知时,系统会使用邮件服务器上的其他资源,并会增加查询服务器的负载,这是因为,每次处理基于搜索的通知时,都会运行针对每个基于搜索的通知的查询。在规划初始部署时,请考虑可供通知使用的资源以及网站使用人员高效使用这些通知的可能性。默认情况下,基于搜索的通知处于激活状态。

在操作过程中,每当对内容源进行重置时,都会自动禁用基于搜索的通知,以避免针对所有基于搜索的通知发送通知。管理员随后必须重新启用基于搜索的通知。