구성 가능한 일치를 사용하도록 정확한 데이터 일치 스키마 수정

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 규정 준수 포털 평가판 허브에서 지금 시작하세요. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

적용 대상

  • PowerShell을 사용하여 EDM(정확한 데이터 일치) SIT(중요한 정보 형식) 만들기

EDM(정확한 데이터 일치) 기반 분류를 사용하면 중요한 정보 데이터베이스의 정확한 값을 참조하는 사용자 지정 중요한 정보 유형을 만들 수 있습니다. 정확한 문자열의 변형을 허용해야 하는 경우 구성 가능한 일치 를 사용하여 Microsoft Purview에 대/소문자 및 일부 구분 기호를 무시하도록 지시할 수 있습니다.

중요

이 절차를 사용하여 기존 EDM 스키마 및 데이터 파일을 수정합니다.

  1. EDM 스키마 및 데이터 파일 업로드를 위해 Microsoft 365에 연결하는 데 사용하는 컴퓨터에서EdmUploadAgent.exe 제거

  2. 다음 링크를 사용하여 구독에 대한 적절한 EdmUploadAgent.exe 파일을 다운로드합니다.

    • 상업용 + GCC - 대부분의 상용 고객은 이 옵션을 사용해야 합니다.
    • GCC-High - 이 옵션은 특히 보안이 높은 정부 클라우드 구독자를 위한 것입니다.
    • DoD - 이 옵션은 미국 국방부 클라우드 고객을 위한 것입니다.
  3. EDM 업로드 에이전트에 권한을 부여하고 명령 프롬프트 창을 열어(관리자 권한으로) 다음 명령을 실행합니다.

    EdmUploadAgent.exe /Authorize
    
  4. 기존 스키마의 현재 복사본이 없는 경우 기존 스키마의 복사본을 다운로드해야 합니다. 이렇게 하려면 다음 명령을 실행합니다.

    EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]
    
  5. 각 열이 및/또는 ignoredDelimiters를 활용하게 스키마를 사용자 지정합니다caseInsensitive. 의 caseInsensitive 기본값은 "false"이고 의 경우 ignoredDelimiters기본값은 빈 문자열입니다.

    참고

    일반 정규식 패턴을 검색하는 데 사용되는 기본 사용자 지정 중요한 정보 유형 또는 기본 제공 중요한 정보 유형은 ignoredDelimiters로 나열된 입력 변형의 검색을 지원해야 합니다. 예를 들어 기본 제공 SSN(미국 사회 보장 번호) 중요한 정보 유형은 SSN을 구성하는 그룹화된 숫자 사이의 대시, 공백 또는 공백 부족을 포함하는 데이터의 변형을 검색할 수 있습니다. 따라서 SSN 데이터용 EDM ignoredDelimiters 에 포함할 수 있는 유일한 구분 기호는 대시 및 공간입니다.

    다음은 중요한 데이터의 대/소문자 변형을 인식하는 데 필요한 추가 열을 만들어 대/소문자를 구분하지 않는 일치를 시뮬레이션하는 샘플 스키마입니다.

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
               <Field name="PolicyNumber" searchable="true" />
               <Field name="PolicyNumberLowerCase" searchable="true" />
               <Field name="PolicyNumberUpperCase" searchable="true" />
               <Field name="PolicyNumberCapitalLetters" searchable="true" />
      </DataStore>
    </EdmSchema>
    

    위의 예제에서는 및 ignoredDelimiters 가 모두 caseInsensitive 추가된 경우 원래 PolicyNumber 열의 변형이 필요하지 않습니다.

    EDM에서 구성 가능한 일치를 사용하도록 이 스키마를 업데이트하려면 및 ignoredDelimiters 플래그를 caseInsensitive 사용합니다. 다음과 같은 경우입니다.

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
             <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
      </DataStore>
    </EdmSchema>
    

    플래그에서 지원하는 ignoredDelimiters 문자에 대한 자세한 내용은 caseInsensitive 및 ignoredDelimiters 필드 사용을 참조하세요.

  6. Security & Compliance PowerShell에 연결

    참고

    organization 테넌트 수준에서 Microsoft 365용 고객 키를 설정한 경우 정확한 데이터 일치는 해당 암호화 기능을 자동으로 사용합니다. 상업용 클라우드의 E5 라이선스 테넌트에서만 사용할 수 있습니다. 자세한 내용은 고객 키 개요를 참조하세요.

  7. 다음 명령을 실행하여 스키마를 업데이트합니다.

    Set-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    
  8. 필요한 경우, 새 스키마 버전과 일치하도록 데이터 파일을 업데이트합니다.

    필요에 따라 다음을 실행하여 업로드하기 전에 CSV 파일에 대한 유효성 검사를 실행할 수 있습니다.

    EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

    예: EdmUploadAgent.exe /ValidateData /DataFile C:\data\testdelimiters.csv /Schema C:\EDM\patientrecords.xml

    EdmUploadAgent.exe 지원하는 모든 매개 변수에 대한 자세한 내용은 를 실행합니다.

    EdmUploadAgent.exe /?

  9. 관리자 권한으로 명령 프롬프트 창을 열고 다음 명령을 실행하여 중요한 데이터를 해시하고 업로드합니다.

    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]