了解資料完全相符的敏感性資訊類型

敏感性資訊類型 (SIT) 用來協助識別敏感數據,以避免不小心或不當共用。 它們也可用來協助找出電子檔探索中的相關數據,以及將治理動作套用至特定類型的資訊。 您可以根據下列項目定義自訂 SIT:

  • 模式
  • 關鍵字證據,例如員工社會安全號碼識別碼
  • 字元以特定模式接近證據
  • 信賴等級

但是,如果您想要使用精確或接近精確數據值的自定義 SIT,而不是根據一般模式尋找相符專案的自定義 SIT,該怎麼辦? 使用以精確資料比對 (EDM) 為基礎的分類,您可以建立其設計目的為以下的自訂敏感性資訊類型:

  • 充滿活力並可以輕鬆刷新;
  • 導致誤判較少
  • 使用結構化的敏感性資料;
  • 更安全地處理敏感性資訊,而不與任何人共用,包括 Microsoft
  • 能與數個 Microsoft 雲端服務搭配使用。

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

以EDM為基礎的分類可讓您建立自訂SIT,以參考敏感性資訊資料庫中的確切值。 資料庫可以每天重新整理,最多可包含1億個數據列。 因此,當員工、病患和用戶端來來去去時,隨著記錄的變更,您的自定義敏感性資訊類型會保持最新且適用。 此外,您可以使用EDM分類搭配原則,例如 Microsoft Purview 資料外洩防護 原則或 Microsoft Cloud App Security 檔案原則

下圖顯示 EDM 分類的基本工作:

以 EDM 為基礎的分類。

注意事項

Microsoft Purview 資訊保護 支援下列使用雙位元組位元集的語言:

  • 中文 (簡體)
  • 中文 (繁體)
  • 韓文
  • 日文

這項支援適用於敏感性資訊類型。 如需詳細資訊,請 參閱雙位元組位元集的資訊保護支援:版本資訊 (預覽)

EDM SIT 有何不同

當您使用 EDM SIT 時,了解一些 EDM SIT 特有的概念會很有幫助。

Schema

是 XML 檔案。 Microsoft Purview 會使用架構來判斷您的數據是否包含符合敏感性資訊類型設計來偵測的字串。

架構 XML 檔案會定義:

  • 結構描述的名稱,以下稱為 DataStore
  • 敏感性資訊來源資料表包含的欄位名稱。 架構功能變數名稱與敏感性資訊源數據表中的數據行名稱有1:1的對應。
  • 哪些相互關聯辨識項字段需要多重令牌比對模式。
  • 哪些數據欄位可以搜尋。
  • 每個欄位是否支援可設定的相符專案。 可設定的比對是具有可修改搜尋之參數的比對,例如忽略搜尋值中的分隔符和大小寫。

敏感性資訊來源資料表

敏感性資訊源數據表包含EDM SIT所尋找的值。 數據表是由數據行和數據列所組成。 數據行標頭是功能變數名稱、數據列是專案的實例,而數據列中的每個儲存格都包含該欄位之該專案實例的值。

以下是敏感性資訊來源資料表的簡單範例。

名字 姓氏 出生日期
Isaiah Langer 05-05-1960
Ana Bowman 11-24-1971
Oscar Ward 02-12-1998

規則套件

每個敏感性資訊類型都有規則套件。 您可以使用 EDM SIT 中的規則套件來定義 EDM SIT 的各種元件。 下表提供每個元件的描述。

元件 描述
Match 指定要在完全查閱中使用 (數據欄位) 的主要元素。 它可以是包含或不含總和檢查碼驗證、關鍵字清單、關鍵字字典或函式的規則運算式。
分類 指定觸發EDM查閱的敏感性資訊類型比對。
支援元素 找到時,提供有助於提高相符專案信賴度之辨識項的專案。 例如,出現接近實際社會安全號碼的姓氏。 支援專案可以是具有或不含總和檢查碼驗證、關鍵詞清單、關鍵詞字典或單一或多重標記字串相符的正則表達式。
信賴等級
(高、中、低)
除了主要元素之外,還偵測到多少支持辨識項的指示。 項目包含的支援證據越多,相符項目包含您要尋找之敏感性資訊的信賴度就越高。 如需信賴等級的詳細資訊,請參閱 敏感性資訊類型的基本部分
鄰近 主要和支援專案之間的字元數。

您要提供您自己的結構描述和資料

Microsoft Purview 隨附許多預先定義的內建 SIT 。 這些 SIT 隨附架構、REGEX 模式、關鍵詞和信賴等級。 不過,使用 EDM SIT 時,您必須負責定義架構,以及識別敏感性專案的主要和次要字段。 因為架構和主要和次要數據值都高度敏感,所以您會透過包含隨機產生或自我提供 Salt 值的哈希函式來加密它們。 只有哈希值會上傳至服務,因此您的敏感數據永遠不會處於開啟狀態。

主要和次要支援元素

當您建立 EDM SIT 時,您要在規則套件中定義主要元素欄位。 EDM 接著會搜尋您所有內容中的主要元素。 因此,EDM 可以偵測它們,主要元素必須可透過現有的 SIT 來探索。

注意事項

如需可用 SIT 的完整清單,請參閱 敏感性資訊類型實體定義

您需要尋找內建的 SIT,以偵測您想要 EDM SIT 偵測到的敏感性資訊。 例如,如果您的EDM SIT架構具有 美國社會安全號碼 作為主要元素,當您建立EDM架構時,您會將其與 SSN (SSN) SIT 相關 聯。 主要元素必須遵循定義的模式,才能偵測到。

在掃描的專案中找到主要元素時,EDM 接著會尋找 次要 元素, (也稱為 支持 專案) 。 不同於主要元素,次要元素可以選擇遵循模式。 如果次要元素包含多個令牌,則這些元素必須與可偵測該內容的 SIT 相關聯,或是可針對多重令牌比對進行設定。 在所有情況下,次要元素必須位於與主要元素的特定鄰近範圍內,才能偵測到相符專案。

比對的運作方式

EDM 的運作方式是比較文件和電子郵件中的字串與敏感性資訊源數據表中的值。 它會使用此比較來判斷所掃描內容中的值是否存在於數據表中。 此判斷是透過比較單向密碼編譯哈希來完成。

提示

您可以在 DLP 規則中同時使用 EDM SIT 和它們所依據的預先定義 SIT,以改善敏感數據的偵測。 使用信賴等級較高的EDM SIT,以及信賴等級較低的預先定義 SIT。 例如,使用EDM SIT,以高信賴度尋找社會安全號碼和其他具有嚴格需求的支持數據。 如果針對高信賴度比對進行設定,EDM 會在只偵測到少數實例時產生 DLP 比對。 若要在偵測到更多專案時觸發 DLP 比對,請使用內建 SIT,例如 美國社會安全號碼

支援元素如何與EDM搭配運作

EDM SIT中的不同專案中所討論,支援 元素是一些元素,可在找到時提供有助於提高相符專案信賴度的證據

透過EDM SIT的支援,您可以尋找並偵測由多個字段組成的支持元素。 支援專案比對可以包含關鍵詞清單、關鍵詞字典、單一英數位元字串或多標記字串。

讓我們看看範例。 假設您想要偵測美國社會安全號碼。 為了提高比對信賴度,您的支援元素包括 first namelast namedate of birth (DoB) 。 因此,您的源數據表看起來會像這樣:

Ssn FirstName LastName DoB
987-65-4320 Isaiah Langer 05-05-1960
078-05-1120 Ana Bowman 11-24-1971
219-09-9999 Oscar Ward 02-12-1998

在受保護的檔案中尋找相符的支持專案時,您的EDM SIT會在偵測到主要元素之後,檢查每個支援專案 (個別和組合) 。

例如,假設偵測到第一個社會安全號碼。 確切的數據比對功能接下來會尋找來源資料表中所有資料行的支援元素組合:

  • Isaiah
  • Langer
  • 05-05-1960
  • Isaiah Langer
  • Isaiah 05-05-1960
  • Langer 05-05-1960
  • Isaiah Langer 05-05-1960

多重令牌比對

多重令牌比對的設計目的是要在您的相互關聯辨識項欄位包含多重令牌值時使用,但無法輕鬆地完成將這類值比對到 SIT。 例如,當您有包含 Address 或等1 Microsoft Way, Redmond, WA123 Main Street, New York, NY值的欄位時。

這項功能可讓EDM將內容中連續字組的哈希與數據源中多標記欄位的哈希進行比較。 如果它們相同,EDM 會產生相符專案。 如此一來,EDM 就可以偵測多重令牌欄位,例如名稱、位址、醫療條件,或任何其他可能包含多個字組的驗證辨識項字段,只要它們在EDM架構中標示為多重令牌即可。

例如,如果您選取多重令牌比對作為比對選項,您會獲得兩個額外的優點:

  1. 您的原則會偵測到在源數據表中跨數據行比對多個字段的內容。
  2. 您的源數據表可以包含包含字串值的欄位,這些欄位包含預先設定的字數。 下表顯示範例源資料表:
Ssn 名稱 街道地址
987-65-4320 Isaiah Langer 1432 路由
078-05-1120 Ana Bowman 8250 第一條街
219-09-9999 Oscar Ward 424 205th Avenue

使用多重令牌比對時, [名稱 ] 和 [ 街地道址] 字 段會以獨立支持專案字串的方式進行比對,並以個別欄位的組合進行比對。 因此,當比對為多標記字串做為社會安全號碼 987-65-4320 的支援元素時,相符專案如下:

  • Isaiah Langer
  • 1432 路由

組合比對時,比對如下:

  • Isaiah Langer + 1432 Lincoln Road

雙位元組字元集也支援多重標記比對,這通常不會使用空格來分隔文字。

EDM 支援的服務

服務 位置
Microsoft Purview 資料外洩防護 - SharePoint
- OneDrive
- Teams 聊天
- Exchange Online
- 裝置
Microsoft 雲端 App 安全性 - SharePoint
- OneDrive
自動套用標籤 (服務端) - SharePoint
- OneDrive
- Exchange Online
用戶端 (自動套用標籤) - Word
- Excel
- PowerPoint
- Exchange 桌面用戶端
客戶管理的金鑰 - SharePoint
- OneDrive
- Teams 聊天
- Exchange Online
- Word
- Excel
- PowerPoint
- Exchange 桌面客戶
端 - 裝置
電子文件探索 - SharePoint
- OneDrive
- Teams 聊天
- Exchange Online
- Word
- Excel
- PowerPoint
- Exchange 桌面用戶端
測試人員風險管理 - SharePoint
- OneDrive
- Teams 聊天
- Exchange Online
- Word
- Excel
- PowerPoint
- Exchange 桌面用戶端

請參閱