基于精确数据匹配的敏感信息类型入门

提示

如果你不是 E5 客户,请使用为期 90 天的 Microsoft Purview 解决方案试用版来探索其他 Purview 功能如何帮助组织管理数据安全性和合规性需求。 立即从Microsoft Purview 合规门户试用中心开始。 了解有关 注册和试用条款的详细信息。

适用对象

(基于 EDM) 的敏感信息类型 (SIT) 创建和完全匹配是一个多阶段过程。 可以使用现有经典体验的新体验,也可以通过 PowerShell 使用。 本文可帮助你了解这两种体验之间的差异,并帮助你根据需要选择合适的体验。

EDM SIT 可用于:

  • Microsoft Purview 数据丢失防护
  • 自动标记 (服务和客户端)
  • Microsoft Purview 内部风险管理策略
  • Microsoft Purview 电子数据展示
  • Microsoft Purview 内部风险管理
  • Microsoft Defender for Cloud Apps

开始之前

熟悉以下文章中的概念和术语:

支持的区域

精确数据匹配功能在以下区域中可用:

  • 亚太地区
  • 澳大利亚
  • 巴西
  • 加拿大
  • 欧洲
  • 法国
  • 德国
  • 印度
  • 日本
  • 韩国
  • 挪威
  • 南非
  • Switzerland(瑞士)
  • 阿拉伯联合酋长国
  • 英国
  • 美国
  • US DoD
  • 美国 GCC
  • US GCCH

可以按照以下过程了解租户在何处托管静态数据,其中 介绍了 Microsoft 365 客户数据的存储位置 ,并参考该文章中的数据中心城市位置。

所需的许可证和权限

您必须是全局管理员、合规性管理员或 Exchange 管理员才能执行本文中所述的任务。 若要了解有关 DLP 权限的详细信息,请参阅Microsoft Purview 合规门户中的权限

有关完整的许可信息,请参阅数据丢失防护服务说明

门户 全球 /GCC GCC-High DOD
Office SCC compliance.microsoft.com scc.office365.us scc.protection.apps.mil
Microsoft Defender 门户 security.microsoft.com security.microsoft.us security.apps.mil
Microsoft Purview 合规性门户 compliance.microsoft.com compliance.microsoft.us compliance.apps.mil

新的 EDM 体验

新的 EDM 体验将 EDM 架构和 EDM 敏感信息类型工具的功能合并到单个用户体验中。 新体验具有以下优势:

有关这些优点的详细信息,请继续阅读。

简化的工作流

使用新体验时,架构和 SIT 是通过一种用户体验创建的。 这意味着点击次数更少,更好地指导将主要元素映射到默认 SIT,并更清楚地描述规则的默认置信度级别。

当你需要在创建过程中查看 EDM SIT 的状态时,新体验会在此 UI 中报告。

  • 尚未上传的数据
  • 数据上传百分比
  • 数据上传完成
  • 索引完成
  • 数据上传失败
  • 数据索引失败

自动创建架构和 SIT

在新体验中,可以提供具有相同标头值和足够行的示例数据文件, (10-20) 系统代表性数据。 系统将验证格式,并根据标头创建架构。 然后,确定架构中的主字段,系统会建议最匹配要与之关联的主字段的 SIT。 如果不想上传文件,可以在 UI 中手动输入相同的值。

重要

请务必使用不敏感的示例数据值;但是,还要确保示例值的格式与实际敏感数据的格式相同。 使用非敏感数据至关重要,因为在上传示例数据文件时,不会以与实际敏感信息表相同的方式对其进行加密和哈希处理。 创建 EDM SIT 后,不会保留或访问示例数据文件中的数据。

系统生成 EDM SIT 检测规则,每个主字段一个。 根据主要字段的检测,系统使用所有其他字段作为确凿证据创建高置信度和中等置信度规则。 如果需要,可以手动添加低置信度规则。

额外的防护措施,以确保更好的性能

如果系统发现映射到 SIT 的主字段(称为 松散定义的 SIT),它会发出警告。 这可能会导致系统对大量与你要查找的内容类型无关的字符串执行查找。 这些类型的 SCT 和主字段之间的映射可能会导致假负并降低性能。

注意

松散定义的 SIT(例如查找所有个人标识号的自定义 SIT)具有允许检测到的项目更大的可变性的检测规则。 强定义的 SIT(例如美国社会安全号码)具有检测规则,仅允许检测一组狭窄且定义明确的项目。

如果选择的主字段中的值在大量行中多次出现,系统还会发出警告。 这可能会导致返回并处理大量结果集,这可能会导致超时。超时可能会导致错过检测和性能不佳。

为你选择正确的 EDM SIT 创建体验

可以在新体验和经典体验之间来回切换,但我们建议使用新体验,除非你的需求属于这四个用例中的一个或多个,如下所述。

若要选择根据需要创建 EDM SIT 的最佳方法,

  1. 通读本部分
  2. 选择要使用的体验
  3. 为所需体验选择 下一步 的链接。

将多个 EDM SITS 映射到同一架构

在 EDM 中,最多可以创建 10 个架构。 每次使用新体验创建 EDM SIT 时,都会创建一个新架构。 这会导致 EDM 架构与 EDM SIT 之间的 1:1 映射。 新体验不支持将多个 SNET 映射到同一架构。

创建或管理 10 个以上的 EDM SIT

由于新体验不支持将多个 SIT 映射到同一架构,因此只能创建和管理 10 个 EDM SITS。 在经典体验中,可以将多个 EDM SIT 映射到同一架构,因此具有 10 个以上的 EDM SIT。 使用新流时,如果尝试创建第 11 个 EDM 架构,并且无法查看超过 10 个 EDM SIT,将收到错误。

指定 EDM 架构的名称

如果需要为 EDM SIT 架构指定名称,则必须使用经典体验来创建和管理它们。 由于新体验会自动创建架构,因此你没有机会为架构提供自定义名称。 自动生成的名称是 EDM SIT 名称和单词 schema 的串联。 例如,如果 EDM SIT 名称为 PatientNumber,则架构名称将为 PatientNumberschema

编辑在经典体验中创建的 EDM 架构

使用经典体验创建或使用 PowerShell 作为 XML 文件上传的所有架构在新体验中都不可查看或管理。

后续步骤

另请参阅