云混合搜索服务(云 SSA)常见问题解答

我们经常收到有关云混合搜索服务应用程序、混合及其围绕各种用例的支持性的问题。 本文的目标是整理并归纳这些问题,方便读者参考。

是否有可帮助配置环境中的混合配置的自动向导?

是的,可以使用 SharePoint 管理中心的“更多功能”页上的混合配置向导进行混合配置。 此向导可自动执行连接本地 SharePoint Server 环境与 SharePoint in Microsoft 365 所需的某些配置步骤。 详细了解混合配置向导

是否可以利用 SharePoint 混合配置向导来清理混合环境或停用向导激活的混合功能?

混合配置向导自动执行某些配置步骤,以在本地 SharePoint Server 与 Microsoft 365 中的 SharePoint 之间配置混合。 这并非用于在向导完成后撤消更改。 混合配置向导在 Microsoft 365 中的 SharePoint 与本地 SharePoint 之间创建服务器到服务器 (S2S) /OAuth 信任。 配置此项后,重新运行向导不会清理信任。 请参阅 SharePoint 管理中心的混合配置向导中的文档。

重要

如果在未选中已启用的功能的情况下再次运行混合配置向导,则不会导致卸载该功能。 会安装任何其他选项,并保留以前安装的功能。

我计划使用高可用性 (HA) 拓扑配置云混合搜索。是否有可用于配置相同云混合搜索的脚本?

如果计划在 SharePoint Server 中使用 HA 拓扑配置云混合搜索,可以使用混合配置向导对其进行配置。 混合配置向导自动执行了将本地 SharePoint Server 环境与 Microsoft 365 for Cloud 中的 SharePoint 进行混合搜索所需的某些配置步骤。 了解详细信息

什么是混合联合搜索?它与云混合搜索有何不同?

混合联合搜索和云混合搜索是搜索管理员在使用 Microsoft 365 配置混合搜索时可以选择的两种混合体验。

使用 Microsoft 365 中 SharePoint 的混合联合搜索解决方案,结果从 SharePoint Server 中的搜索索引和 Microsoft 365 中的索引进行联合。 本地 SharePoint 对本地内容进行爬网, SharePoint in Microsoft 365 对 SharePoint 数据库进行爬网。 混合配置后,当经过身份验证的用户在搜索中心提交查询时,将同时针对索引触发实时查询,授权用户将从 Microsoft 365 搜索索引和 SharePoint Server 搜索索引获取搜索结果。 但是,结果相互独立,彼此不同,通常显示在单独的垂直搜索或结果块中。

适用于 SharePoint Server 的云混合搜索服务应用程序是基于爬网的解决方案。 所有已爬网内容(包括本地内容)均由 Microsoft 365 搜索引擎处理,并驻留在 Office 365 中的搜索索引中。 经过身份验证的用户在 Microsoft 365 搜索中心的 SharePoint 中提交查询时,他们从 Microsoft 365 搜索索引获取搜索结果,从而同时查看来自本地和 Microsoft 365 内容的项。 如果想要在本地 SharePoint Server 搜索中心获得同样的体验,需要在本地场中配置远程结果源,以便从 Microsoft 365 索引提取结果。

混合联合搜索中支持哪些拓扑?

混合联合搜索有三种拓扑类型。

混合基础结构设置(服务器到服务器 (S2S) 身份验证)是以下任何方案正常运行的必备条件。

出站:在出站方案中,仅在本地 SharePoint Server 场中配置远程结果源。 可将出站定义为仅从本地场查询到 SharePoint in Microsoft 365 搜索场的功能。 结果将显示在本地搜索中心单独的垂直搜索中(一个用于 SharePoint in Microsoft 365 结果,另一个用于本地 SharePoint)。 如果配置了出站,则从 SharePoint in Microsoft 365 搜索中心查询不会返回本地 SharePoint Server 场中的任何搜索结果。

入站:在入站方案中,仅在 SharePoint in Microsoft 365 搜索中心中配置远程结果源。 可将入站定义为仅从 SharePoint in Microsoft 365 场查询到本地场的功能。 结果将显示在 SharePoint in Microsoft 365 搜索中心单独的垂直搜索中(一个用于 SharePoint in Microsoft 365 结果,另一个用于本地 SharePoint)。 除了上述出站配置外,还有其他证书和反向代理要求。 在配置从 SharePoint in Microsoft 365 到 SharePoint Server 的混合联合搜索 - 路线图一文的步骤 3 和步骤 5 中对此进行了概述。

双向:上述两种类型(出站和入站)的组合是双向混合联合搜索。 双向通常是组织中混合联合搜索部署的所需状态,在这种情况下,可在 SharePoint in Microsoft 365 和 SharePoint Server 场中创建结果源。 从任一搜索中心查询时,用户都会看到一组垂直搜索,其中包含来自 SharePoint in Microsoft 365 和本地 SharePoint Server 场的结果。

有哪些已测试和已记录的反向代理可用于混合?

在混合联合搜索中,反向代理必须能够:

  • 通过通配符或 SAN 证书支持客户端证书身份验证。

  • 支持 OAuth 2.0 的直通身份验证。

  • 在 TCP 端口 443 (HTTPS) 上接受未经请求的入站通信。

  • 将通配符或 SAN SSL 证书绑定到已发布的终结点。

  • 将通信中继到本地 SharePoint Server 场或负载均衡器,而无需重新编写任何数据包标头。

为 SharePoint Server 混合配置反向代理设备一文概述了已测试的反向代理解决方案。

何时应部署云混合搜索或混合联合搜索?是否有任何建议?

建议选择云混合搜索以获得以下优势。

  • 即使你的组织混合部署本地和 Microsoft 365 中的内容,你的用户也可以获得统一的搜索结果、搜索相关性排名和精简条件。

  • 用户自动获取最新的 SharePoint in Microsoft 365 搜索体验,组织无需更新现有的 SharePoint Server。

  • 用户可以使用云功能,例如 Office Delve 也可用于本地内容。

  • 不再需要担心搜索索引的大小,因为搜索索引处于Office 365中。 这意味着 SharePoint Server 搜索场的占用空间更小,搜索的总拥有成本更低。

  • 由于 SharePoint Server 支持对现有 SharePoint Server 2007 至 SharePoint Server 2019 内容场进行爬网,因此,无需升级任何现有的 SharePoint in Microsoft 365 安装,即可在云中进行企业搜索。

  • 无需再将搜索场迁移到较新版本的 SharePoint in Microsoft 365,因为这会在 Microsoft 365 中自动执行。

如果你有一些高度敏感且不应在本地网络外部编制索引的本地内容,则混合联合搜索可能是一种选择。

注意

经过身份验证的用户查询将实时路由到两个单独的索引(SharePoint in Microsoft 365 索引和 SharePoint 本地索引),结果将显示在单独的垂直搜索中。

混合搜索结果是否可显示在 SharePoint 2010 搜索中心中?

在 SharePoint 2010 环境中,无法配置服务器到服务器的身份验证。 云混合搜索服务应用程序只能在 SharePoint Server 2013 至 SharePoint Server 2019 环境中安装。 理想情况下,建议按照升级准则将 SharePoint 2010 场升级到 SharePoint Server 2013 或更高版本。 但是,如果有业务要求保留在 SharePoint 2010 上,则可以通过一种解决方法显示结果。 需要从 SharePoint Server 2013 发布搜索服务应用程序并从 SharePoint 2010 场中使用。 无论部署什么混合搜索模型(云混合搜索服务应用程序还是联合混合搜索),从 SharePoint 2010 场使用相同的应用程序都会显示来自 Microsoft 365 的经过身份验证的用户搜索结果。

注意

SharePoint 2010 中的搜索中心网站必须是企业搜索中心。

发布/使用云混合搜索服务应用程序时支持哪些拓扑?

发布/使用云搜索服务应用程序将遵循与 SharePoint 中任何其他服务应用程序完全相同的支持矩阵。 下表列出了支持的选项:

发布的 CloudSSA 版本 可由以下版本使用
SharePoint Server 2019 SharePoint Server 2019
SharePoint Server 2019 SharePoint Server 2016
SharePoint Server 2016 SharePoint Server 2016
SharePoint Server 2016 SharePoint Server 2013
SharePoint Server 2013 SharePoint Server 2013
SharePoint Server 2013 SharePoint Server 2010

什么是用户解除冻结?为什么它在 Microsoft 365 混合设置中起关键作用?

服务器到服务器身份验证 (S2S) 允许服务器(例如,SharePoint Server)从代表用户的另一台服务器访问和请求资源。 这是混合搜索正常运行的关键要求。 例如,在云混合搜索服务场中,当用户在 SharePoint Server 搜索中心中查询项目时,需要将查询路由到 SharePoint in Microsoft 365 场(因为索引位于 SharePoint in Microsoft 365 场中)。 用户身份需要重新补充,然后必须进行 ACL 匹配,并且只有在此之后,才会在搜索结果中返回用户有权访问的一组结果。 为此,必须完成以下任务:

  • 将请求解析到特定的 SharePoint in Microsoft 365 用户。

  • 确定与用户关联的角色声明组,此过程称为解除冻结用户标识。

当发出请求从另一台服务器获取资源 (例如 Microsoft 365 Server 中的 SharePoint) 时,将应用来自传入安全令牌的声明,以将其解析给特定的 SharePoint 用户。 默认情况下,SharePoint Server 使用内置 User Profile Service 应用程序来解析标识。 针对用于定位相应用户配置文件的一些用户属性完成一组声明的匹配。 将针对以下属性之一执行匹配:

  • Windows 安全标识符 (SID)

  • 简单邮件传输协议 (SMTP) 地址

  • 用户主体名称 (UPN)

  • 会话初始协议 (SIP) 地址

因此,建议在本地 SharePoint 和 SharePoint in Microsoft 365 中,这些用户属性中必须至少有一个是用户配置文件中最新的属性。

由 Azure Active Directory 同步工具同步的属性列表

本文包含 Azure Active Directory 同步工具现成同步的属性列表。

本地 SharePoint Server 2013/2016 场中的搜索服务应用程序已分区。是否可以配置混合查询联合?

在分区模式下部署本地搜索服务应用程序代理时,Microsoft 365 不支持传入混合搜索查询。 将搜索服务应用程序或代理分区后,出站搜索将失败。 这是因为搜索查询将 partitionID (tenantID) 传递给搜索查询处理器,由于这是 GUID,因此是唯一的,从而导致出站搜索失败。 在 Microsoft 365 搜索索引中将找不到唯一的 partitionID,因此不能将搜索查询范围限定为该 ID。 安全修整不允许将一个 ID 的结果传递给另一个 ID。 搜索管理员需要修复/重新生成服务应用程序,使其完全受支持。 混合部署故障排除一文描述了错误和一些解决方法。

可使用云混合搜索服务应用程序对哪些内容源进行爬网?

支持所有 SharePoint Server 内容源。

我的 SharePoint in Microsoft 365 拓扑由多个 SharePoint 场组成(例如,内容场、服务场)。配置云混合搜索服务应用程序的首选场是什么?

在内容/服务 SharePoint in Microsoft 365 方案中,假设搜索位于服务场中,理想情况下应在服务场中配置云 SSA。 有关实施详细信息,请参阅在 SharePoint Server 中跨服务器场共享服务应用程序

配置服务器到服务器身份验证或云混合搜索服务应用程序时,是否强制使用单一登录?

配置服务器到服务器身份验证或云混合搜索服务应用程序时,单一登录不是必需的先决条件。 下面概述了在 Microsoft 365 和 SharePoint Server 之间配置混合环境所需配置的功能。

  1. 注册 Microsoft 365。

  2. 将域注册到 Microsoft 365 中。

  3. 将帐户与 Microsoft 365 同步。

  4. 将许可证分配给你的用户。

  5. 创建云混合搜索服务应用程序。

  6. 载入云混合搜索服务应用程序。

是否可以将多个云混合搜索服务应用程序连接到同一 Microsoft 365 组织?

公司在不同的地理位置都拥有 SharePoint 场。 支持具有跨地理位置的云 SSA 并将其连接到同一 Microsoft 365 组织。 云 SSA 提供了对本地内容进行爬网和分析的功能,并在这些云 SSA 场已连接到的单个 Microsoft 365 组织中处理和索引该内容。

请务必注意,每个云 SSA 场只能对唯一内容进行爬网 (例如,不支持从连接到同一 Microsoft 365 组织的多个云 SSA 场对同 源内容进行爬网) 。

提示

本地 SharePoint 中的内容源名称包含在托管属性“ContentSource”中。 如果在不同的场中为内容源单独命名,则可以在查询中按名称标识内容源。 如果使用默认的“本地 SharePoint 网站”,则必须找到另一种隔离内容的方法。

是否支持在同一场中运行多个云混合搜索服务应用程序?或者是否支持托管同时具有常规搜索服务应用程序以及云混合搜索服务应用程序共享场硬件的场?

应使用单独的场来托管个别云搜索服务应用程序,从而避免资源消耗和可能的意外行为。 但是,如果只有一个 SSA 是云混合搜索服务应用程序,则支持将两个搜索服务应用程序 (SSA) 在同一场上运行。 此外,还需要确保场中的服务器仅托管一个 SSA 中的组件。 如果云混合搜索服务应用程序和常规搜索服务应用程序组件不在任何组件之间共享硬件,则仅支持服务器场中的计算机可用于托管这两个 SSA。

使用 Exchange Server 2016、Office Online Server (OOS) 和 SharePoint Server 进行的文档协作支持哪些拓扑?

下面是记录和支持的拓扑:

是否可以在具有多个林的环境中部署云混合搜索服务应用程序?

云混合搜索服务应用程序适用于具有多个林的环境。 需要确保跨这些林的帐户与 Microsoft 365 同步。 Microsoft Entra Connect Sync 应处理这种情况。 如果有多个林,则单个Microsoft Entra Connect Sync 服务器必须可访问所有林。 不需要将服务器加入域。 如有必要,可以将服务器放在外围网络中以访问所有林。 下面的文章讨论了此配置。

当云混合搜索服务应用程序对本地内容进行爬网时,本地 SharePoint 中的已爬网属性是否会传播到 SharePoint in Microsoft 365?

在通过云混合搜索服务应用程序对内容进行爬网之后,本地 SharePoint Server 中的已爬网属性将传播到 SharePoint in Microsoft 365 搜索架构。 本地环境中的已爬网属性应为默认属性集的一部分。 您还需要确保使用从 Active Directory 同步到的帐户在 Microsoft 365 搜索架构的 SharePoint 中查找爬网属性,以Microsoft Entra ID 和对已爬网内容具有权限的帐户。 例如,如果可以使用本地云混合搜索服务应用程序场的内容访问帐户进行查找,则可以在 SharePoint in Microsoft 365 搜索架构中看到“爬网属性”。

是否可以在已针对提供程序托管应用配置的场中载入云混合搜索服务应用程序?

此问题主要与以下用例相关:

  • 你有一个 SharePoint Server 场,你计划在其中实现提供程序托管的加载项和/或与工作流管理器关联。

  • 你有一个 SharePoint Server 场,该服务器场已具有提供程序托管的加载项,并且/或使用工作流管理器。

混合功能/云搜索服务应用程序可以在上述同一 SharePoint 场上实现。 尝试通过云 SSA 载入脚本或混合配置向导建立 S2S 信任时,本地场的身份验证领域将更新为与 Microsoft 365 组织上下文 ID 匹配。 在脚本中,我们使用 Set-SPAuthenticationRealm 对其进行设置。 更改身份验证领域后,现有 SharePoint 外接程序将无法进行身份验证;当用户重定向到加载项时,将获取 HTTP 401。配置 SharePoint 场混合功能后,还可以阅读有关该问题的详细信息,并在 提供程序托管的加载项停止工作和 HTTP 401 错误一文中修复。

注意

如果使用 SharePoint 管理中心的“更多功能”页中的“混合配置向导”配置混合,则该向导将负责修复。

什么是现成的云混合搜索服务应用程序爬网限制?另外,我可以为我的租户请求额外的索引配额吗?

可以在 Microsoft 365 中编制索引的云混合搜索服务爬网的本地项的最大数量为 2,000 万。 对于组织在 Microsoft 365 中拥有的每个 1 TB 存储空间,可以在租户的搜索索引中索引 100 万个本地内容项。 达到可编制索引的项目数的限制后,托管云搜索服务应用程序的本地场将在爬网新项目时开始看到错误。 以下是来自 SharePoint 2016 场的 ULS 日志的错误摘录:

mssearch.exe (0x5304) 0x97D0 SharePoint Server Search Crawler:Azure Plugin a9sz7 Verbose AzureServiceProxy::SubmitDocuments: submit returned : Forbidden, docid : 4653596 DocIDString : sts4s://
SharePoint Server Search Crawler:Azure Plugin ayg2m High AzureServiceProxy::SubmitDocuments: submit failed for the document: HTTP status: Forbidden

如果在 SharePoint Server 2013 环境中托管云搜索服务应用程序,用于跟踪错误的 uls 标记将为 amnz2amoeu

需要请求增加可用的配额才能修复问题。 若要在 2,000 万的基础上增加可索引的项的最大数量,需要通过 Microsoft 365 管理中心联系 Microsoft 支持。

我的 Microsoft 365 组织配置了混合。我是否可以只查询已使用云混合搜索服务应用程序进行爬网的本地项?

混合云 SSA 会公开一个新的托管属性,即 IsExternalContent。 对本地内容进行爬网时,将使用值 1 自动填充此属性。 可以利用托管属性 IsExternalContent 并为本地爬网的内容搜索值 1。 此示例的 querystring 的构造如下

http://<searchcenter url>/Pages/results.aspx?k=IsExternalContent:1

只能通过规定 NOT IsExternalContent:1 测试联机内容,如下所示:

http://<searchcenter url>/Pages/results.aspx?k=(NOT IsExternalContent:1)

如果使用云混合搜索服务应用程序对本地配置文件存储进行爬网,“人员”爬网体验会是怎样的?

默认情况下,SharePoint in Microsoft 365 User Profile 应用程序中的所有人员都将由 SharePoint in Microsoft 365 搜索服务编制索引。 支持搜索人员的建议方法是使 Microsoft 365 中的此用户配置文件服务成为用户信息的主要源,并让 Microsoft 365 搜索处理索引和演示。 使用此方法,无需在本地对人员进行爬网,也无需对 Microsoft 365 中的 SharePoint 中的默认搜索配置进行任何更改。

如果另外使用本地云搜索服务应用程序对人员进行爬网,则会在 Microsoft 365 搜索索引中生成另一组人员内容项。 这些结果的 URL 将指向本地 SharePoint 中的用户的 OneDrive 网站,而不是 Microsoft 365 中的 SharePoint。 使用人员结果源进行搜索时 ,不会 显示这些结果。 如果要将这些本地配置文件显示为主要人员搜索源,可以按照以下步骤操作:

  1. 创建新的结果源或复制现有的 SharePoint 结果源。

  2. 编辑新的结果源,并修改“查询转换”框以指定托管属性 ContentClass 和 IsExternalContent,如下所示: {?{searchTerms} ContentClass=urn:content-class:SPSPeople IsExternalContent:1}

  3. 创建新的搜索结果页,并配置核心搜索结果 Web 部件以使用此新的搜索结果源。

  4. 通过将新页添加到搜索导航设置来完成实现。 这将在搜索中心内添加新页作为垂直搜索。

如果内容驻留在 SharePoint in Microsoft 365 中,我只能在搜索结果中看到 Office 文档的预览。驻留在本地 SharePoint 中的 Office 文档不显示预览。这是预期的吗?

若要启用本地内容预览,需要设置本地 Office Web Apps Server(仅限 SharePoint Server 2013)或 Office Online Server(SharePoint Server 2013 及更高版本),并配置 SharePoint Server 以使用它。 此处记录了这些指南。 该行为与网站/网页预览 (aspx) 稍有不同。 从 SharePoint in Microsoft 365 进行搜索时,将在 SharePoint in Microsoft 365 场中显示 aspx 页面预览,而不是在 SharePoint Server 中显示 aspx 页面预览。 目前,站点和网页悬停模板检查结果项是否与当前主机具有相同的主机名。 这是有意设计的。

是否可以利用 Perfmon 查看云混合搜索服务应用程序的爬网统计信息?如果是,那么 Perfmon 计数器是什么?

已为云混合搜索服务应用程序引入了 perfmon 计数器。 若要在 PowerShell 中获取所有计数器的列表,请运行以下命令:

((Get-Counter -ListSet "Search Gatherer Azure Plugin - SharePointServerSearch").counter

云混合搜索服务应用程序的建议爬网数据库数是多少?

对内容数据库中的每 2,000 万个项目使用一个爬网数据库。 有关详细信息,请参阅此文章

我使用云混合搜索服务应用程序对内容进行爬网。在我的云 SSA 中,我看到了搜索拓扑的所有 6 个组件。本地托管的是哪些组件?例如,是否有本地索引?

否。 云混合搜索服务应用程序是爬网程序。 爬网组件从本地场获取内容,并将此内容发送到 Office 365 中的搜索索引。 它使用连接器与内容源进行交互,并使用爬网数据库存储有关它所爬网项目的临时和历史信息,就像一个普通的爬网组件。

在爬网过程中,云混合搜索服务应用程序将什么内容推送到 SharePoint in Microsoft 365 终结点?

云混合搜索服务应用程序标识 SharePoint in Microsoft 365 中已更改的文档。 爬网程序选取文档并进行分析,提取内容的结构化视图并删除不需要的标记。 爬网程序将加密的内容发送到与 SharePoint in Microsoft 365 内容场相关联的索引 API。 执行加密批量提交,包括 ACL、关键字、元数据、目标租户信息等。可以从爬网程序提交以下类型的操作:

  1. 插入:创建或覆盖文档的内容和访问控制列表。

  2. 安全更新:覆盖现有文档的访问控制列表。

  3. 删除:删除文档的所有内容。

在云混合搜索服务应用程序场的 ULS 日志中,可以跟踪项(包括已爬网的属性)的提交情况。 为此,需要为 [SharePoint Server 搜索] “Crawler:Azure Plugin” 类别启用 VerboseEx。

我需要什么规模的云混合搜索服务体系结构?

云混合搜索服务应用程序的搜索体系结构由搜索组件和数据库组成。 理想情况下,需要规划拓扑的爬网组件数、托管组件和数据库的服务器,以及每个服务器所需的硬件。 设置云混合搜索服务应用程序时,将设置搜索服务应用程序的所有组件,并且它们需要处于联机状态。

TechNet 文章中所示的灰色组件在云混合搜索中处于非活动状态,但仍需按照文章中的建议将其放置在服务器上。

应用程序服务器 数据库服务器
管理 管理数据库
爬网。 爬网数据库
内容处理组件。 链接数据库
分析 分析数据库
索引
查询处理组件

部署更多爬网程序将为爬网程序函数提供高可用性。 当本地场配置为向 Microsoft 365 发送搜索查询时,添加查询处理器还可以提供高可用性。 内容处理在 Microsoft 365 服务中执行,因此无需在本地使用更多内容处理器。 无论云搜索服务应用程序爬网的项数如何,都不需要更多索引组件。 该索引存储在 Microsoft 365 搜索场中,可节省大量的本地容量和大型数据库的资本支出。 必须扩展本地爬网数据库以匹配已爬网的项数,因为云搜索服务应用程序必须维护已爬网项的最新爬网日志。 扩展采用与常规搜索服务应用程序相同的过程,按照在 SharePoint Server 中更改默认搜索拓扑中的步骤操作。 如果需要调整爬网,请按照在 SharePoint 2016 中针对特定性能要求重新设计企业级搜索拓扑中的建议操作。 云混合搜索服务应用程序适用相同的指南。

对于云混合搜索服务应用程序的高可用性 (HA) 和灾难恢复 (DR) 有什么建议?

对于 HA,建议在同一本地 SharePoint 场中配置至少两台服务器,并且每台计算机都托管所有搜索角色。 可以使用更多服务器,但如果每个组件中至少有两个存在,则可以将云 SSA 视为高度可用。

对于灾难恢复,可以在灾难恢复场中生成第二个云混合搜索服务应用程序。 除非已启动故障转移,否则需要确保禁止云混合搜索服务应用程序度与主场相同的内容进行爬网。 如果发生故障转移,灾难恢复场可以立即从同一 Microsoft 365 搜索索引提供搜索结果。

如果由云搜索服务应用程序爬网,用户能否查询使用 SAML 声明保护的项?

使用云搜索服务应用程序进行爬网时,使用 SAML 声明保护的项不会显示在搜索结果中。 这不起作用,因为无法在云搜索服务应用程序中的 ACL 映射过程中解释这些标识。 目前还没有办法将本地 SAML 标识映射到 Microsoft 365 用户,这是 ACL 映射工作的核心要求。 这是设计使然的。 对于此类可支持性问题,可以在 SharePoint 反馈门户 提交请求进行评估。

本地环境 云搜索服务应用程序对由 NT Authority\Authenticated 用户保护的网站集进行爬网。这如何转换为 Microsoft 365 SharePoint 中的 ACL 映射?

使用云混合搜索服务应用程序对本地内容进行爬网时,传入 ACL 中的一个或多个 SID 声明将在 SharePoint in Microsoft 365 中进行转换。 用户安全标识符 (SID) 映射到 Passport 唯一 ID (PUID)。 同样,组 SID 映射到对象 ID。 NT AUTHORITY\Authenticated Users and Everyone (内置 SIDSS S-1-5-11 和 S-1-1-0) 将转换为 SharePoint 中的“除外部用户以外的所有人” (例如,租户中的所有用户(已通过电子邮件邀请共享的外部用户除外)) 。 云搜索服务应用程序仅支持已同步到Microsoft Entra ID 的 Windows 标识。 如果客户未使用 Windows 标识,并且想要使用云 SSA 进行爬网,一种解决方法是将 Everyone 声明添加到源内容,以确保用户能够搜索该内容。

结果类型规则在网站集中配置。使用云混合搜索时,在哪里可以配置结果类型规则和显示模板?

来自我们的朋友 MVP Matthew McDermott 的精彩博客文章重点介绍了要配置的内容及具体配置位置。 另外,感谢 Matt 为这篇文章提供了一些有价值的评论。

是否可以在 SharePoint in Microsoft 365 中查看使用云搜索服务应用程序爬网的内容的热门趋势报告?

热门趋势基于分析生成。 截至目前,使用情况分析报告无法在云搜索服务应用程序下运行。 使用情况分析使用在实际内容所在的场中创建的查看事件。 将云 SSA 配置为从本地 SharePoint 场对内容进行爬网时,视图事件不会传递到 Microsoft 365 搜索场中的 SharePoint。 分析处理在 SharePoint in Microsoft 365 搜索场上进行,不会看到查看事件,因此无法更新使用情况报告。 这也意味着将不再显示文档悬停面板上显示的视图数。

云混合搜索服务应用程序正在对默认区域中具有 http:// 前缀的 SharePoint 场进行爬网,Extranet 区域为 https://。来自 SharePoint in Microsoft 365 的查询最终显示搜索结果中的 http,这是预期行为吗?

是的,这是预期行为。 在搜索结果中,用户将看到 http:// 前缀。 正如我的朋友 Brian 在此处详细说明的那样,SharePoint Server 与 URL 相关的托管属性(包括 Path、ParentURL 和 SPSiteUrl)都存储了与已爬网的 URL 相关的值。 爬网程序只是将其可以收集的内容传递到云中的搜索内容服务。 SharePoint in Microsoft 365 搜索不了解本地场中的备用访问映射,因此无法正确设置你希望看到的映射。 因此,建议对 SharePoint Server Web 应用程序的默认区域进行爬网。

云搜索服务应用程序正在对我的本地内容进行爬网。可以从 SharePoint in Microsoft 365 删除本地项吗?

不能利用 SharePoint 管理中心 (https://< tenantname-admin.sharepoint.com/_layouts/15/searchadmin/searchresultremoval.aspx) >删除 URL 选项从 Microsoft 365 索引中的 SharePoint 中删除项目。 如果要删除特定 URL,可以选择使用本地云搜索服务应用程序服务器中的爬网日志删除相同的 URL。

如果在我的租户中启用了多重身份验证 (MFA),是否可以运行云混合搜索载入脚本?

是的,需要确保拥有最新版本的 Microsoft Graph PowerShell。 可从此处下载它。

用于配置云混合搜索服务应用程序的防火墙端口和协议要求是什么?

以下文章概述了对 Microsoft 365 的端到端连接的完整基础结构防火墙要求。 下面的第一个博客讨论了云搜索服务应用程序的特定端口和协议。

混合云搜索服务应用程序的端口和协议要求

Microsoft 365 URL 和 IP 地址范围

混合标识所需的端口和协议

我网络中的所有出站请求都已经过筛选或通过代理服务器路由。对于运行云混合搜索服务应用程序是否有特定要求?

需要确保在云搜索服务应用程序场中(出于运行爬网和查询联合方案的目的)运行搜索服务的帐户(msssearch、noderunner 帐户)具有不受限制的出站 Internet 访问权限。 如果没有,请为这些搜索服务帐户设置系统级代理设置。 可按照本文中介绍的步骤操作。

云搜索服务应用程序始终使用端口 443 与终结点进行通信。 假设场中有多个 SharePoint 服务器托管云搜索服务应用程序组件,则所有 SharePoint 服务器都需要与以下站点通信。

  1. *.sharepoint.com

  2. https://accounts.accesscontrol.windows.net

  3. https://login.windows.net/common/oauth2/authorize

  4. https://sts.windows.net/*

  5. https://login.microsoftonline.com

如果场拓扑中有专用的搜索服务器,它们应能与以下站点进行通信。

  1. https://provisioningapi.microsoftonline.com

  2. *.search.production.us.trafficmanager.net

  3. *.search.production.emea.trafficmanager.net

  4. *.search.production.apac.trafficmanager.net

注意

云混合搜索服务应用程序环境要求将其他终结点 (CA 和 CRL) URL 添加到允许列表中,如Office 365 URL 和 IP 地址范围中所述。 必须将 Microsoft 365 Common and Office Online 部分中的文章中提到的证书颁发机构和 CRL URL (点 125) 添加到允许列表中。 这是本地服务器与 Azure 建立 SSL 连接并验证新的中间证书所必需的。

在哪里可以下载云混合搜索服务应用程序载入脚本?

可以在此处下载用于配置 SharePoint in Microsoft 365 云混合搜索的最新版 Windows PowerShell 脚本。

政府社区云 (GCC) 和由世纪互联运营的 Office 365 是否支持云混合搜索服务应用程序载入?

支持,可以参考我们的帖子了解详细信息。

是否可以仅对已通过云混合搜索服务应用程序爬网的内容执行索引重置和清理?

是的,可以按照本博客文章中所述的步骤操作。

是否有论坛可供讨论和提出有关云混合搜索的问题?

有,可以在 TechNet 论坛上提交有关云搜索服务应用程序的问题。

是否有任何电子图书可用来配置 SharePoint 混合功能?

有,可以下载电子图书配置 Microsoft SharePoint 混合功能 (ISBN 9781509302437)