什么是 Azure 信息保护统一标签扫描程序?

适用于:Azure信息保护、Windows Server 2019、Windows Server 2016、Windows Server 2012 R2

相关:仅 AIP 统一标签客户端

使用本部分的信息了解 Azure 信息保护统一标签扫描程序,以及如何成功安装、配置、运行以及在必要时对其进行故障排除。

AIP 扫描程序作为服务在 Windows 服务器上运行,可用于发现、分类和保护以下数据存储上的文件:

  • 使用 SMB 或 NFS 预览版协议的网络 (UNC) 路径。

  • SharePoint Server 2013 SharePoint Server 2019文档库SharePoint文件夹。 此外SharePoint 2010 年 2010 年 1 月,已扩展对此版本的 SharePoint的支持。

为了对文件进行分类和保护,扫描仪使用在扫描器中配置的Microsoft 365 合规中心。

Azure 信息保护统一标签扫描程序概述

AIP 扫描程序可以检查任何可Windows的文件。 如果已配置敏感度标签以应用自动分类,扫描程序可以标记已发现的文件以应用该分类,并选择性地应用或删除保护。

下图显示了 AIP 扫描程序体系结构,扫描程序可发现本地服务器和 SharePoint文件。

Azure 信息保护统一标签扫描程序体系结构

为了检查文件,扫描仪使用计算机上安装的 IFilter。 为了确定文件是否需要标记,扫描程序使用 Microsoft 365 内置数据丢失防护 (DLP) 敏感度信息类型和模式检测,或 Microsoft 365 正则表达式模式。

扫描程序使用 Azure 信息保护客户端,可以分类和保护与客户端相同的文件类型。 有关详细信息,请参阅 Azure 信息保护统一标签客户端 支持的文件类型

执行下列任一操作,根据需要配置扫描:

  • 仅在发现模式下运行扫描程序 ,以创建报告,检查标记文件时会发生什么情况。
  • 运行扫描仪以发现包含敏感信息的文件,而无需配置应用自动分类的标签。
  • 自动运行扫描仪 以应用已配置的标签。
  • 定义文件类型列表以 指定要扫描或排除的特定文件。

注意

扫描仪不会实时发现和标记。 它会对指定的数据存储上的文件进行系统性的爬网。 将此周期配置为运行一次或重复运行。

提示

统一标签扫描仪支持具有多个节点的扫描程序群集,使组织能够横向扩展,从而加快扫描时间并扩大范围。

从一开始部署多个节点,或者从单节点群集开始,以后随着增长添加更多节点。 为 Install-AIPScanner cmdlet 使用相同的群集名称和数据库部署多个节点。

AIP 扫描过程

扫描文件时,AIP 扫描程序会运行以下步骤:

1. 确定是包含还是排除文件进行扫描

2. 检查和标记文件

3. 无法检查的标签文件

有关详细信息,请参阅 扫描程序未标记的文件

1. 确定是包含还是排除文件进行扫描

扫描程序会自动跳过从分类和保护中排除的文件,例如可执行文件和系统文件。 有关详细信息,请参阅 从分类和保护中排除的文件类型

扫描程序还会考虑显式定义用于扫描或从扫描中排除的任何文件列表。 默认情况下,文件列表适用于所有数据存储库,也可以仅为特定存储库定义。

若要定义用于扫描或排除的文件列表,请使用"文件类型" 内容扫描作业中扫描设置。 例如:

配置文件类型以扫描 Azure 信息保护扫描程序

有关详细信息,请参阅部署 Azure 信息保护扫描程序以自动对文件进行分类和保护

2. 检查和标记文件

识别排除的文件后,扫描程序再次筛选以识别支持检查的文件。

这些筛选器与操作系统用于搜索和索引Windows筛选器相同,无需额外配置。 Windows IFilter 还用于扫描 Word、Excel 和 PowerPoint 以及 PDF 文档和文本文件使用的文件类型。

有关支持检查的文件类型的完整列表,以及有关将筛选器配置为包括 .zip 和 .tiff 文件的其他说明,请参阅检查支持的 文件类型

检查后,使用为标签指定的条件标记支持的文件类型。 如果使用发现模式,可以报告这些文件包含为标签指定的条件,或报告包含任何已知的敏感信息类型。

已停止的扫描仪进程

如果扫描仪停止并且无法完成对存储库中大量文件的扫描,可能需要为托管文件的操作系统增加动态端口数。

例如,服务器强化SharePoint扫描程序会超过允许的网络连接数并因此停止的其中一个原因。

若要检查 SharePoint 的服务器强化是否是扫描程序停止的原因,请在%localappdata%\Microsoft\MSIP\Logs\MSIPScanner.iplog (中检查扫描程序日志中是否有以下错误消息) :

Unable to connect to the remote server ---> System.Net.Sockets.SocketException: Only one usage of each socket address (protocol/network address/port) is normally permitted IP:port

若要详细了解如何查看当前端口范围并根据需要增加端口范围,请参阅设置可修改以提高网络性能的端口。

提示

对于大型SharePoint场,可能需要提高列表视图阈值,默认值为5,000。

有关详细信息,请参阅管理库中的大型列表和SharePoint。

3. 无法检查的标签文件

对于无法检查的任何文件类型,AIP 扫描程序将在 Azure 信息保护策略中应用默认标签,或应用为扫描程序配置的默认标签。

未由扫描仪标记的文件

在下列情况下,AIP 扫描程序无法标记文件:

  • 如果标签应用分类,但不应用保护,并且文件类型不支持仅由客户端分类。 有关详细信息,请参阅统 一标记客户端文件类型

  • 当标签应用分类和保护,但扫描仪不支持文件类型时。

    默认情况下,在使用 ISO 标准进行 PDF 加密保护时,Office仅保护这些文件类型和 PDF 文件。

    当更改要保护的文件类型时,可以添加 其他类型的文件进行保护

示例:检查.txt后,扫描程序无法应用配置为仅分类的标签,因为 .txt 文件类型不支持仅分类。

但是,如果标签同时针对分类和保护进行配置,并且.txt扫描程序要保护的文件类型,扫描程序可以标记文件。

下一步

有关部署扫描程序的信息,请参阅以下文章:

详细信息