정확한 데이터 일치 기반 중요한 정보 유형에 대한 스키마 만들기

정확한 데이터 일치 스키마 및 중요한 정보 유형 패턴 마법사를 사용하거나 수동으로 스키마 및 EDM SIT를 만들 수 있습니다. 또한 한 메서드를 사용하여 스키마를 만들고 나중에 다른 메서드를 사용하여 편집하여 둘 다 결합할 수도 있습니다.

EDM 기반 SITS 또는 해당 구현에 익숙하지 않은 경우 다음 사항을 숙지해야 합니다.

동일한 중요한 데이터 테이블을 사용하는 여러 중요한 정보 형식에서 단일 EDM 스키마를 사용할 수 있습니다. Microsoft 365 테넌트에서 최대 10개의 다른 EDM 스키마를 만들 수 있습니다.

정확한 데이터 일치 스키마 및 중요한 정보 유형 마법사 사용

이 마법사를 사용하여 스키마 파일 만들기 프로세스를 간소화할 수 있습니다.

필수 구성 요소

정확한 데이터 일치 스키마 및 중요한 정보 유형 패턴 마법사 사용

  1. 테넌트에 대한 Microsoft Purview 규정 준수 포털 데이터 분류 > 로 이동 정확한 데이터는****EDM 스키마와 일치 > 합니다.

  2. EDM 스키마 생성 을 선택하여 스키마 마법사 구성 플라이아웃을 선택합니다.

    EDM 스키마 만들기 마법사 구성 플라이아웃.

  3. 적절한 이름설명 을 입력합니다.

  4. 전체 스키마에 대해 해당 동작을 원하는 경우 모든 스키마 필드에 대해 구분 기호 및 문장 부호 무시 를 선택합니다. 대/소문자 또는 구분 기호를 무시하도록 EDM을 구성하는 방법에 대한 자세한 내용은 이 기능에 대한 자세한 내용은 caseInsensitive 및 ignoredDelimiters 필드 사용을 참조하세요.

  5. Schema 필드 #1 에 대해 원하는 값을 입력하고 필요에 따라 필드를 추가합니다. 각 스키마 필드는 중요한 정보 원본 파일의 열 머리글과 동일해야 합니다.

  6. 원하는 경우 다음의 필드별 값을 설정합니다.

    1. 필드를 검색할 수 있습니다.
    2. 필드는 대/소문자를 구분하지 않습니다.
    3. 이 필드에 대해 무시할 구분 기호 및 문장 부호 선택
    4. 이 필드에 대한 사용자 지정 구분 기호 및 문장 부호 입력

    중요

    하나 이상의 스키마 필드를 검색 가능으로 지정해야 합니다.

  7. 저장 을 선택합니다. 이제 스키마가 나열되고 사용할 수 있습니다.

    중요

    스키마를 제거하려면 해당 스키마가 EDM에 중요한 정보 유형과 이미 연결되어 있는 경우 먼저 EDM에 중요한 정보 유형을 삭제한 후 스키마를 삭제할 수 있습니다. 연결된 데이터 저장소가 있는 스키마를 삭제하면 24시간 이내에 데이터 저장소도 삭제됩니다.

XML 형식으로 EDM 스키마 파일 내보내기

EDM 스키마 마법사에서 EDM 스키마를 만든 경우 EDM 스키마 파일을 XML 형식으로 내보내야 합니다. 해시에 필요 하고 정확한 데이터 일치 중요한 정보 유형 단계를 위해 중요한 정보 원본 테이블을 업로드 합니다.

  1. Security & Compliance PowerShell에 연결

  2. EDM 스키마 파일을 내보내려면 다음 구문을 사용합니다.

    $Schema = Get-DlpEdmSchema -Identity "[your EDM Schema name]"
    Set-Content -Path ".\Schemafile.xml" -Value $Schema.EdmSchemaXML
    
  3. 나중에 사용하기 위해 이 파일을 저장합니다.

정확한 데이터 일치 스키마를 수동으로 만들고 업로드

스키마 파일에서 다음 구문을 사용하여 중요한 정보 원본 테이블의 각 열에 대한 항목을 구성합니다.

<Field name="FieldName" searchable="true/false" caseInsensitive="true/false" ignoredDelimiters="delimiter characters" />

caseInsensitive 및 ignoredDelimiters 필드 사용

다음 스키마 XML 샘플에서는 caseInsensitiveignoredDelimiters 필드를 사용합니다.

caseInsensitive 필드를 스키마 정의의 true 값으로 포함하는 경우 EDM은 대/소문자 차이에 따라 항목을 제외하지 않습니다. 예를 들어 EDM은 FOO-1234fOo-1234 값이 필드에 대해 PatientID 동일한 것으로 표시됩니다.

지원되는 문자가 있는 ignoredDelimiters 필드를 포함하면 EDM은 해당 문자를 무시합니다. 따라서 EDM은 FOO-1234FOO#1234 값이 필드에 대해 PatienID 동일한 것으로 표시됩니다.

둘 다 caseInsensitive ignoredDelimiters 사용되는 이 예제에서 EDM은 FOO-1234fOo#1234 를 동일하게 표시하고 항목을 환자 레코드 중요한 정보 유형으로 분류합니다.

이러한 매개 변수는 모두 필드별로 사용됩니다.

중요

무시하도록 공백 을 구성하는 경우 기본 필드 열 및 여러 단어 문자열을 검색할 수 있는 중요한 정보 형식이 정의된 경우에만 유효합니다. 그렇지 않으면 분석 중인 콘텐츠의 각 개별 단어와 비교됩니다.

ignoredDelimiters 플래그는 영숫자가 아닌 문자를 지원합니다. 다음은 몇 가지 예입니다.

  • .
  • -
  • /
  • _
  • *
  • ^
  • #
  • !
  • ?
  • [
  • ]
  • {
  • }
  • \
  • ~
  • ;

ignoredDelimiters 플래그는 지원하지 않습니다.

  • 0~9 사이 문자
  • A-Z
  • a-z
  • "
  • ,

중요

EDM 중요한 정보 유형을 정의할 때 ignoreDelimiters 는 EDM 패턴의 기본 요소와 연결된 분류 중요한 정보 유형이 항목의 콘텐츠를 식별하는 방식에 영향을 미치지 않습니다. 따라서 검색 가능한 필드에 대해 ignoreDelimiters 를 구성하는 경우 해당 필드를 기반으로 하는 기본 요소에 사용되는 중요한 정보 형식이 해당 문자가 있는 문자열과 없는 문자열을 모두 선택해야 합니다.

중요한 정보 원본 테이블의 열 수와 스키마의 필드 수가 일치해야 하며 순서는 중요하지 않습니다.

  1. XML 형식으로 스키마를 정의합니다(아래 예제와 유사). 이 스키마 파일 의 이름을edm.xml 지정하고 중요한 정보 원본 테이블의 각 열에 구문을 사용하는 줄이 있도록 구성합니다.

    \<Field name="" searchable=""/\>.

    • 필드 이름 값에 열 이름을 사용합니다.
    • 검색할 수 있는 필드와 최대 5개 필드의 기본 필드에 searchable="true" 를 사용합니다. 하나 이상의 필드를 검색할 수 있어야 합니다.

    예를 들어 다음 XML 파일은 검색 가능하도록 지정된 5개의 필드(PatientID, MRN, SSN, PhoneDOB)가 있는 환자 레코드 데이터베이스의 스키마를 정의합니다.

    (여기에 있는 예제를 복사, 수정 및 사용할 수 있습니다.)

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
          <DataStore name="PatientRecords" description="Schema for patient records" version="1">
                <Field name="PatientID" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
                <Field name="MRN" searchable="true" />
                <Field name="FirstName" />
                <Field name="LastName" />
                <Field name="SSN" searchable="true" />
                <Field name="Phone" searchable="true" />
                <Field name="DOB" searchable="true" />
                <Field name="Gender" />
                <Field name="Address" />
          </DataStore>
    </EdmSchema>
    

    XML 형식으로 EDM 스키마 파일을 만든 후에는 클라우드 서비스에 업로드해야 합니다.

  2. Security & Compliance PowerShell에 연결

  3. 데이터베이스 스키마를 업로드하려면 다음 명령을 실행합니다.

    New-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    

    다음과 같이 확인하라는 메시지가 표시됩니다.

    확인

    이 작업을 수행하시겠습니까?

    'patientrecords' 데이터 저장소의 새로운 EDM 스키마를 가져옵니다.

    [Y] 예 [A] 모두 예 [N] 아니요 [L] 모두 아니요 [?] 도움말(기본값: "Y"):

    확인 없이 변경 내용을 적용하려면 3단계에서 사용하지 -Confirm:$true 마세요.

참고

EDMSchema를 추가 사항으로 업데이트하는 데 10~60분이 소요될 수 있습니다. 추가 사항을 사용하는 단계를 실행하기 전에 업데이트를 완료해야 합니다.

다음 단계