다음을 통해 공유


정확한 데이터 일치 기반 중요한 정보 유형에 대한 스키마 만들기

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 규정 준수 포털 평가판 허브에서 지금 시작하세요. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

적용 대상

  • EDM(클래식 정확한 데이터 일치) SIT(중요한 정보 형식) 만들기 환경입니다.

정확한 데이터 일치 스키마 및 중요한 정보 유형 패턴 도구 사용

EDM 기반 SITS 또는 해당 구현에 익숙하지 않은 경우 다음 사항을 숙지해야 합니다.

동일한 중요한 데이터 테이블을 사용하는 여러 중요한 정보 유형에서 단일 EDM 스키마를 사용할 수 있습니다. Microsoft 365 테넌트에서 최대 10개의 다른 EDM 스키마를 만들 수 있습니다.

정확한 데이터 일치 스키마 및 중요한 정보 유형 도구 사용

이 도구를 사용하여 스키마 파일 만들기 프로세스를 간소화할 수 있습니다.

필수 구성 요소

정확한 데이터 일치 스키마 및 중요한 정보 유형 패턴 도구 사용

사용 중인 포털에 적합한 탭을 선택합니다. Microsoft Purview 포털에 대한 자세한 내용은 Microsoft Purview 포털을 참조하세요. 규정 준수 포털에 대한 자세한 내용은 Microsoft Purview 규정 준수 포털 참조하세요.

  1. Microsoft Purview 포털>Information Protection>Classifiers>EDM 분류자>EDM 스키마에 로그인합니다(새 EMD 환경을해제로 전환할 때 사용 가능).

  2. EDM 스키마 만들기를 선택하여 스키마 도구 구성 플라이아웃을 엽니다.

    EDM 스키마 만들기 마법사 구성 플라이아웃.

  3. 적절한 이름설명을 입력합니다.

  4. 전체 스키마에 대해 Ignore... 동작을 적용하려면 모든 스키마 필드에 대해 구분 기호 및 문장 부호 무시를 선택합니다. 대/소문자 또는 구분 기호를 무시하도록 EDM을 구성하는 방법에 대한 자세한 내용은 이 기능에 대한 자세한 내용은 caseInsensitive 및 ignoredDelimiters 필드 사용을 참조하세요.

  5. Schema 필드 #1에 대해 원하는 값을 입력하고 필요에 따라 필드를 추가합니다. 각 스키마 필드는 중요한 정보 원본 파일의 열 머리글과 동일해야 합니다.

  6. 원하는 경우 다음 항목에 대한 필드별 값을 설정합니다.

    • 필드를 검색할 수 있습니다.
    • 필드는 대/소문자를 구분하지 않습니다.
    • 이 필드에 대해 무시할 구분 기호 및 문장 부호 선택
    • 이 필드에 대한 사용자 지정 구분 기호 및 문장 부호 입력

    중요

    스키마 필드 중 하나 이상(10개 이하)을 검색 가능으로 지정해야 합니다.

  7. 저장을 선택합니다. 이제 스키마가 나열되고 사용할 수 있습니다.

    중요

    이미 EDM SIT와 연결된 스키마를 제거하려면 먼저 EDM SIT를 삭제해야 합니다. 연결된 데이터 저장소가 있는 스키마를 삭제하면 24시간 이내에 데이터 저장소도 삭제됩니다.

XML 형식으로 EDM 스키마 파일 내보내기

EDM 스키마 도구에서 EDM 스키마를 만든 경우 스키마 파일을 XML 형식으로 내보내야 합니다. 해시를 완료 하고 정확한 데이터 일치 중요한 정보 유형 단계를 위해 중요한 정보 원본 테이블을 업로드 하려면 XML 파일이 필요합니다.

  1. Security & Compliance PowerShell에 연결

  2. EDM 스키마 파일을 내보내려면 다음 구문을 사용합니다.

    $Schema = Get-DlpEdmSchema -Identity "[your EDM Schema name]"
    Set-Content -Path ".\Schemafile.xml" -Value $Schema.EdmSchemaXML
    
  3. 나중에 사용할 수 있는 이 파일을 저장합니다.

정확한 데이터 일치 스키마 파일을 수동으로 만들고 업로드합니다.

스키마 파일을 만들 때 열 머리글(데이터 필드)은 다음 명명 요구 사항을 준수해야 합니다.

  • 문자로 시작해야 하며 세 개 이상의 영숫자로 구성되어야 합니다.
  • 영숫자 문자만 포함해야 합니다.

각 열/데이터 필드에 대해 다음 구문을 사용합니다.

<Field name="FieldName" searchable="true/false" caseInsensitive="true/false" ignoredDelimiters="delimiter characters" />

caseInsensitive 및 ignoredDelimiters 필드 사용

다음 스키마 XML 샘플은 및 ignoredDelimiters 필드를 사용합니다caseInsensitive.

스키마 정의에 caseInsensitive 의 값 true 으로 설정된 필드를 포함하면 EDM은 대/소문자 차이에 따라 항목을 제외하지 않습니다. 예를 들어 EDM은 FOO-1234fOo-1234 값이 필드에 대해 PatientID 동일하다고 봅니다.

지원되는 문자가 ignoredDelimiters 있는 필드를 포함하면 EDM은 해당 문자를 무시합니다. 따라서 EDM은 FOO-1234FOO#1234 값이 필드에 대해 PatientID 동일하다고 봅니다.

ignoredDelimiters 가 모두 caseInsensitive 사용되는 이 예제에서 EDM은 FOO-1234fOo#1234를 동일하게 보고 항목을 환자 레코드 중요한 정보 유형으로 분류합니다.

이러한 매개 변수는 모두 필드별로 사용됩니다.

중요

무시하도록 공백 을 구성하는 경우 기본 필드 열과 다중 단어 문자열을 검색할 수 있는 중요한 정보 유형이 정의된 경우에만 유효합니다. 그렇지 않으면 분석 중인 콘텐츠의 각 개별 단어와 비교됩니다.

플래그는 ignoredDelimiters 숫자가 아닌 문자를 지원합니다. 몇 가지 예는 다음과 같습니다.

  • .
  • -
  • /
  • _
  • *
  • ^
  • #
  • !
  • ?
  • [
  • ]
  • {
  • }
  • \
  • ~
  • ;

ignoredDelimiters 플래그는 지원하지 않습니다.

  • 0~9 사이 문자
  • A-Z
  • a-z
  • "
  • ,

중요

EDM 중요한 정보 유형을 정의할 때 는 ignoredDelimiters EDM 패턴의 주 요소와 연결된 분류 중요한 정보 유형이 항목의 콘텐츠를 식별하는 방식에 영향을 미치지 않습니다. 따라서 검색 가능한 필드에 대해 구성하는 ignoredDelimiters 경우 해당 필드를 기반으로 하는 기본 요소에 사용되는 중요한 정보 유형이 해당 문자가 있는 문자열과 없는 문자열을 모두 선택해야 합니다.

중요한 정보 원본 테이블의 열 수와 스키마의 필드 수가 일치해야 합니다. 순서는 중요하지 않습니다.

토큰 구분 기호로 사용되는 문자는 다른 구분 기호와 다르게 동작합니다. 다음은 몇 가지 예입니다.

  • \ (space)
  • \T
  • ,
  • .
  • ;
  • ?
  • !
  • \R
  • \n

토큰 구분 기호를 포함하면 EDM은 구분 기호가 있는 토큰을 중단합니다. 예를 들어 EDM은 중간-성 값을 중간-성으로, 필드에는 이름 값을 표시 LastName 합니다. ignoredDelimiters 가 '-' 문자가 LastName 있는 필드에 포함된 경우 해당 작업은 값이 끊어진 후에만 발생합니다. 결국 EDM에는 MiddleLastName 값이 표시됩니다.

토큰 구분 기호가 아닌 다음 ignoredDelimiters 문자를 사용하려면 해당 형식과 일치하는 SIT를 필드와 연결해야 합니다. 예를 들어 대시가 있는 다중 단어 문자열을 검색하는 SIT는 필드와 LastName 연결되어야 합니다.

  • .
  • ;
  • !
  • ?
  • \

PowerShell을 사용하여 SIT를 보조 요소와 연결할 수 있습니다.

  1. XML 형식으로 스키마를 정의합니다(다음 예제와 유사). 이 스키마 파일 의 이름을edm.xml 다음, 중요한 정보 원본 테이블의 각 열에 구문을 사용하는 줄이 있도록 구성합니다.

    \<Field name="" searchable=""/\>.

    • 필드 이름 값에 열 이름을 사용합니다.
    • 검색할 수 있는 필드와 최대 5개의 필드까지 기본 필드에 사용합니다 searchable="true" . 하나 이상의 필드를 검색할 수 있어야 합니다.

    예를 들어 다음 XML 파일은 검색 가능PatientID으로 지정된 5개의 필드(, , MRN, SSNDOB)를 사용하여 환자 레코드 데이터베이스에 대한 스키마를 Phone정의합니다.

    (여기에 있는 예제를 복사, 수정 및 사용할 수 있습니다.)

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
          <DataStore name="PatientRecords" description="Schema for patient records" version="1">
                <Field name="PatientID" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
                <Field name="MRN" searchable="true" />
                <Field name="FirstName" />
                <Field name="LastName" />
                <Field name="SSN" searchable="true" />
                <Field name="Phone" searchable="true" />
                <Field name="DOB" searchable="true" />
                <Field name="Gender" />
                <Field name="Address" />
          </DataStore>
    </EdmSchema>
    

    XML 형식으로 EDM 스키마 파일을 만든 후에는 클라우드 서비스에 업로드해야 합니다.

  2. Security & Compliance PowerShell에 연결

  3. 데이터베이스 스키마를 업로드하려면 다음 명령을 실행합니다.

    New-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    

    다음과 같이 확인하라는 메시지가 표시됩니다.

    확인

    이 작업을 수행하시겠습니까?

    데이터 저장소 'patientrecords'에 대한 새 EDM 스키마를 가져옵니다.

    [Y] 예 [A] 모두에 예 [N] 아니 [L] 모두에 아니요 [?] 도움말(기본값은 "Y"):

    확인 없이 변경이 수행되도록 하려면 3단계에서 를 사용하지 -Confirm:$true 마세요.

참고

EDMSchema를 추가 사항으로 업데이트하는 데 10~60분이 소요될 수 있습니다. 추가 사항을 사용하는 단계를 실행하기 전에 업데이트를 완료해야 합니다.

다음 단계