構成可能な一致を使用するように正確なデータ一致スキーマを変更する

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview コンプライアンス ポータルのトライアル ハブで今すぐ開始してください。 サインアップと試用期間の詳細については、こちらをご覧ください。

適用対象

  • PowerShell を使用した完全なデータ一致 (EDM) 機密情報の種類 (SIT) の作成。

完全一致 (EDM) ベースの分類を使用すると、機密情報のデータベース内の正確な値を参照するカスタムの機密情報タイプを作成できます。 正確な文字列のバリアントを許可する必要がある場合は、 構成可能な一致 を使用して、大文字と小文字と一部の区切り記号を無視するように Microsoft Purview に指示できます。

重要

既存の EDM スキーマとデータファイルを変更するには、以下の手順を実行します。

  1. EDM スキーマとデータ ファイルのアップロードのために Microsoft 365 に接続するために使用する コンピューターからEdmUploadAgent.exe をアンインストールします

  2. 次のリンクを使用して、サブスクリプションの適切な EdmUploadAgent.exe ファイルをダウンロードします。

    • 商用 + GCC - ほとんどの商用顧客は、このオプションを使用する必要があります
    • GCC-High - このオプションは、セキュリティの高い政府機関のクラウド サブスクライバー専用です
    • DoD - このオプションは、米国国防総省クラウドのお客様向けです
  3. EDM アップロード エージェントを承認し、管理者としてコマンドプロンプト ウィンドウを開いて、次のコマンドを実行します。

    EdmUploadAgent.exe /Authorize
    
  4. 既存のスキーマの現在のコピーがない場合は、既存のスキーマのコピーをダウンロードする必要があります。 これを行うには、次のコマンドを実行します。

    EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]
    
  5. 各列が および または ignoredDelimitersを利用するようにスキーマをcaseInsensitiveカスタマイズします。 の caseInsensitive 既定値は "false" で、 の ignoredDelimiters場合、既定値は空の文字列です。

    注:

    一般的な正規表現パターンを検出するために使用される基になるカスタム機密情報の種類または組み込みの機密情報の種類は、ignoredDelimiters で一覧表示されている入力バリエーションの検出をサポートする必要があります。 たとえば、組み込みの米国社会保障番号 (SSN) の機密情報の種類では、ダッシュ、スペース、または SSN を構成するグループ化された数値間のスペースの不足を含むデータのバリエーションを検出できます。 その結果、EDM ignoredDelimiters の SSN データに含めるのに関連する区切り記号は、ダッシュとスペースだけです。

    機密データの大文字と小文字のバリエーションを認識するために必要な追加の列を作成することで、大文字と小文字を区別しない照合をシミュレートするサンプル スキーマを次に示します。

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
               <Field name="PolicyNumber" searchable="true" />
               <Field name="PolicyNumberLowerCase" searchable="true" />
               <Field name="PolicyNumberUpperCase" searchable="true" />
               <Field name="PolicyNumberCapitalLetters" searchable="true" />
      </DataStore>
    </EdmSchema>
    

    上の例では、 と の両方caseInsensitiveignoredDelimitersが追加されている場合、元PolicyNumberの列のバリエーションは必要ありません。

    EDM で構成可能な一致が使用されるようにこのスキーマを更新するには、 フラグと ignoredDelimiters フラグをcaseInsensitive使用します。 外観は以下の通りです。

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
             <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
      </DataStore>
    </EdmSchema>
    

    フラグで ignoredDelimiters サポートされる文字については、「 caseInsensitive フィールドと ignoredDelimiters フィールドの使用」を参照してください。

  6. セキュリティ/コンプライアンス PowerShell に接続する

    注:

    organizationがテナント レベルで Microsoft 365 のカスタマー キーを設定している場合、Exact Data Match は暗号化機能を自動的に使用します。 この機能を利用できるのは、商用クラウド内の E5 ライセンスが割り当てられたテナントのみです。 詳細については、「 顧客キーの概要」を参照してください。

  7. 次のコマンドを実行して、スキーマを更新します。

    Set-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    
  8. 必要に応じて、新しいスキーマ バージョンと一致するようにデータ ファイルを更新します。

    ヒント

    必要に応じて、次を実行してアップロードする前に、CSV ファイルに対して検証を実行できます。

    EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

    例: EdmUploadAgent.exe /ValidateData /DataFile C:\data\testdelimiters.csv /Schema C:\EDM\patientrecords.xml

    EdmUploadAgent.exe でサポートされているすべてのパラメーターの詳細については、

    EdmUploadAgent.exe /?

  9. コマンド プロンプト ウィンドウ (管理者として) を開き、次のコマンドを実行して機密データをハッシュしてアップロードします。

    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]