修改精確數據比對架構以使用可設定的比對

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

適用於

  • 使用 PowerShell (建立 SIT) ,完全符合 EDM) 敏感性資訊類型 (EDM。

以精確資料比對 (EDM) 為基礎的分類可讓您參考敏感性資訊資料庫中的確切值來建立自訂敏感性資訊類型。 當您需要允許確切字串的變體時,可以使用 可設定的比對 來告知 Microsoft Purview 忽略大小寫和一些分隔符。

重要事項

使用這個程序來修改現有的 EDM 結構描述和資料檔案。

  1. 從您用來連線到 Microsoft 365 以進行 EDM 架構和資料檔上傳的電腦卸載EdmUploadAgent.exe

  2. 使用下列連結下載訂用帳戶的適當 EdmUploadAgent.exe 檔案:

    • 商業 + GCC - 大部分的商業客戶都應該使用此選項
    • GCC-High - 此選項特別適用於高安全性政府雲端訂閱者
    • DoD - 此選項特別適用於 美國 美國國防部雲端客戶
  3. 授權 EDM 上傳代理、開啟命令提示字元視窗 (以系統管理員身分),然後執行下列命令:

    EdmUploadAgent.exe /Authorize
    
  4. 如果您沒有現有架構的目前複本,則必須下載現有架構的複本。 若要這樣做,請執行此命令:

    EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]
    
  5. 自訂架構,讓每個資料列都使用 caseInsensitive 和 / 或 ignoredDelimiters。 的預設值為 caseInsensitive 「false」,而 針對 ignoredDelimiters,預設值為空字串。

    注意事項

    用來偵測一般 regex 模式的基礎自定義敏感性資訊類型或內建敏感性資訊類型,必須支援偵測以 ignoredDelimiters 列出的輸入變化。 例如,SSN) 敏感性資訊類型的內建美國社會安全號碼 (可以偵測數據中的變化,包括虛線、空格,或組成 SSN 的群組編號之間缺少空格。 因此,與包含在EDM的 ignoredDelimiters SSN資料相關的唯一分隔符是:破折號和空格。

    以下是範例架構,可藉由建立辨識敏感數據中案例變化所需的額外數據行,來模擬不區分大小寫的比對。

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
               <Field name="PolicyNumber" searchable="true" />
               <Field name="PolicyNumberLowerCase" searchable="true" />
               <Field name="PolicyNumberUpperCase" searchable="true" />
               <Field name="PolicyNumberCapitalLetters" searchable="true" />
      </DataStore>
    </EdmSchema>
    

    在上述範例中,如果同時caseInsensitive新增 和 ignoredDelimiters ,則不需要原始PolicyNumber數據行的變化。

    若要更新此架構,讓EDM使用可設定的比對,請使用 caseInsensitiveignoredDelimiters 旗標。 以下是如何運作:

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
             <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
      </DataStore>
    </EdmSchema>
    

    如需 旗標所支援字元的資訊 ignoredDelimiters ,請 參閱使用 caseInsensitive 和 ignoredDelimiters 字段

  6. 連線到安全性與合規性 PowerShell

    注意事項

    如果您的組織已在租用戶層級設定 Microsoft 365 的客戶密鑰,則精確數據比對會自動使用其加密功能。 這僅適用商業雲端中的 E5 授權租用戶。 如需詳細資訊,請參閱 客戶密鑰概觀

  7. 執行下列命令以更新您的架構:

    Set-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    
  8. 如果需要時,更新資料檔案以符合新的結構描述版本。

    提示

    您可以選擇性地執行下列命令,對 CSV 檔案執行驗證,然後再上傳它:

    EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

    例如:EdmUploadAgent.exe /ValidateData /DataFile C:\data\testdelimiters.csv /Schema C:\EDM\patientrecords.xml

    如需 EdmUploadAgent.exe 支援之所有參數的詳細資訊,請執行

    EdmUploadAgent.exe /?

  9. 以系統管理員) 身 (開啟 [命令提示字元] 視窗,然後執行下列命令來哈希並上傳您的敏感數據:

    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]