다음을 통해 공유


EDM SIT 샘플 파일 만들기(새 환경)

EDM(정확한 데이터 일치) 기반 SIT(중요한 정보 유형)를 만들고 만드는 것은 다단계 프로세스입니다. Microsoft Purview 데이터 손실 방지 정책, eDiscovery 및 특정 콘텐츠 거버넌스 작업에서 사용할 수 있습니다.

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 규정 준수 포털 평가판 허브에서 지금 시작하세요. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

적용 대상

  • 새로운 환경

클래식 환경을 사용하여 EDM SIT를 만들려면 EDM SIT 클래식 환경 만들기를 참조하세요.

시작하기 전에

샘플 파일 서식 지정

시스템은 샘플 파일에서 열 이름을 추출하여 스키마를 만들고 기본 SID를 권장하여 샘플 필드 데이터를 매핑합니다. 원본 중요한 정보 테이블 파일과 동일하게 서식을 지정해야 하며 실제 데이터를 나타내는 합성 값을 포함해야 합니다. 파일은 .csv (쉼표로 구분된 값), .tsv (탭으로 구분된 값) 또는 파이프로 구분된(|) 형식으로 저장할 수 있지만 실제 원본 중요한 정보 테이블 파일과 동일해야 합니다. 데이터 값에 거리 주소와 같은 쉼표가 포함된 경우 .tsv 형식을 사용하는 것이 좋습니다.

  • 약 10-20개의 데이터 행을 사용하여 시스템에 작업할 수 있는 충분한 샘플이 있는지 확인합니다.
  • 쉼표가 포함된 필드 값은 따옴표 "로 묶어야 합니다.
  • 첫 번째 행은 머리글 행이어야 하며 열 이름을 포함해야 합니다.
  • 파일에는 하나 이상의 데이터 행이 포함되어야 합니다.
  • 데이터의 각 행에는 헤더에 해당하는 올바른 필드 수가 포함되어야 합니다.
  • 샘플 파일에는 최대 32개의 열이 포함될 수 있습니다.
  • 샘플 파일의 크기는 2.5MB를 초과할 수 없습니다.
  • 열(필드) 이름은 문자로 시작하고, 길이가 3자 이상이어야 하며, 영숫자 문자(A-Z, a-z, 0-9)로만 구성되며 공백, 밑줄 또는 기타 특수 문자를 포함할 수 없습니다.

예를 들어 실제 데이터가 탭으로 구분된(.tsv) 형식을 사용하는 경우 다음과 같습니다.

4개의 열과 3개 행의 인공 실제 데이터 데이터가 있는 탭으로 구분된 테이블을 보여 주는 이미지

그런 다음 샘플 파일에는 동일한 열 머리글이 있어야 하지만 다음과 같이 행에 가상 값을 사용합니다.

FirstName LastName PatientNumber CreditCardNumber
에릭 솔로몬 987-65-4321 9000000000000000
리사 테일러 123-45-6789 500000000000000
앙드레 Lawson 234-56-7890 200000000000000

샘플 파일 템플릿을 사용하는 방법

미국 의료, 미국 금융 서비스 또는 미국 보험 업계 분야에 있는 경우 다음 샘플 파일 템플릿으로 시작하여 샘플 파일 생성 프로세스를 가속화할 수 있습니다. 이러한 파일에는 해당 산업 전반에서 가장 일반적으로 사용되는 열 헤더와 필드의 합성 값이 포함됩니다.

이러한 템플릿을 사용하려면 다음을 수행합니다.

  1. 업계용 샘플 파일 템플릿을 다운로드합니다.
  2. 템플릿의 열 머리글을 실제 원본 데이터와 비교하고 사용자 지정된 샘플 파일에서 기본 필드로 사용할 열을 선택합니다.
  3. 실제 원본 데이터의 서식을 가상 값의 서식과 비교합니다. 원본 데이터 값의 서식과 일치하도록 가상 값의 서식을 변경합니다.
  4. EDM SIT 스키마 및 규칙 패키지를 만들 때 사용할 사용자 지정된 샘플 파일을 저장합니다.

새 환경에서 작업할 때 샘플 파일을 업로드하거나 샘플 파일 값을 수동으로 입력하는 옵션이 있습니다. 샘플 파일을 만드는 것이 좋습니다.

다음 단계