정확한 데이터 일치 기반 중요한 정보 유형에 대해 중요한 정보 원본 테이블을 해시하고 업로드합니다.

이 문서에서는 중요한 정보 원본 테이블을 해시하고 업로드하는 방법을 보여줍니다.

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 규정 준수 포털 평가판 허브에서 지금 시작하세요. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

적용 대상

중요한 정보 원본 테이블 해시 및 업로드

이 단계에서는 다음을 수행합니다.

  1. 사용자 지정 보안 그룹 및 사용자 계정을 설정합니다.
  2. EDM 업로드 에이전트 도구를 설정합니다.
  3. EDM 업로드 에이전트 도구를 사용하여 솔트 값, 중요한 정보 원본 테이블을 사용하여 해시하고 업로드합니다.

해시 및 업로드는 한 컴퓨터를 사용하여 수행하거나 보안 강화를 위해 업로드 단계에서 해시 단계를 분리할 수 있습니다.

한 대의 컴퓨터에서 해시하고 업로드하려면 Microsoft 365 테넌트에 직접 연결할 수 있는 컴퓨터에서 수행해야 합니다. 이렇게 하려면 텍스트가 중요한 정보 원본 테이블 파일이 해시를 위해 해당 컴퓨터에 있어야 합니다.

직접 액세스 컴퓨터에 텍스트가 중요한 정보 원본 테이블 파일을 노출하지 않으려면 안전한 위치에 있는 컴퓨터에서 해시할 수 있습니다. 이 시나리오에서는 두 컴퓨터에 동일한 버전의 EDM 업로드 에이전트를 설치해야 합니다. 그런 다음 보안 컴퓨터에서 Microsoft 365 테넌트로 직접 연결할 수 있는 컴퓨터로 해시 파일과 솔트 파일을 복사할 수 있습니다.

중요

정확한 데이터 일치 스키마 및 중요한 정보 유형 도구를 사용하여 스키마 파일을 만든 경우 아직 스키마를 다운로드하지 않은 경우 이 절차의 스키마를 다운로드 해야 합니다 . XML 형식으로 EDM 스키마 파일 내보내기를 참조하세요.

참고

organization 테넌트 수준에서 Microsoft 365에 대한 고객 키를 설정한 경우 정확한 데이터 일치는 암호화 기능을 자동으로 사용합니다. 상업용 클라우드의 E5 라이선스 테넌트에서만 사용할 수 있습니다.

모범 사례

프로세스에서 문제를 보다 쉽게 격리할 수 있도록 중요한 데이터를 해시하고 업로드하는 프로세스를 분리합니다.

프로덕션 환경에서는 대부분의 경우 두 단계를 별도로 유지합니다. 인터넷 연결로 인해 손상될 수 있는 컴퓨터의 명확한 텍스트 형식으로 실제 데이터를 사용할 수 없도록 하려면 격리된 컴퓨터에서 해시 프로세스를 실행합니다. 그런 다음 파일을 인터넷 연결 컴퓨터로 전송하여 업로드합니다.

중요한 데이터 테이블에 서식 문제가 없는지 확인

중요한 데이터를 해시하고 업로드하기 전에 검색을 수행하여 콘텐츠를 구문 분석하는 데 문제가 발생할 수 있는 특수 문자가 있는지 확인합니다.

다음 구문과 함께 EDM 업로드 에이전트를 사용하여 테이블이 EDM과 함께 사용하기에 적합한 형식인지 확인할 수 있습니다.

EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

도구가 열 수의 불일치를 나타내는 경우 열 구분 기호와 혼동되는 테이블의 값 내에 쉼표 또는 따옴표 문자가 있기 때문일 수 있습니다. 전체 값을 둘러싼 경우가 아니면 작은따옴표와 큰따옴표로 인해 도구가 개별 열이 시작되거나 끝나는 위치를 잘못 확인할 수 있습니다.

전체 값을 둘러싼 작은따옴표 또는 큰따옴표 문자를 찾으면 그대로 둘 수 있습니다.

값 내에서 작은따옴표 문자 또는 쉼표(예: 사람의 이름 Tom O'Neil 또는 아포스트로피 문자로 시작하는 도시 's-Gravenhage)'를 찾으면 중요한 정보 테이블을 생성하고 이러한 열을 큰따옴표로 둘러싸는 데 사용되는 데이터 내보내기 프로세스를 수정해야 합니다.

값 내에서 큰따옴표 문자를 찾을 경우 테이블의 Tab으로 구분된 형식을 사용하는 것이 좋습니다. 이 형식은 이러한 문제에 덜 취약합니다.

필수 구성 요소

  • EDM_DataUploaders 보안 그룹에 추가할 Microsoft 365의 회사 또는 학교 계정
  • EDM 업로드 에이전트를 실행하기 위한 Windows 10, .NET 버전 4.6.2를 사용하는 Windows Server 2016 또는 Windows Server 2019 컴퓨터
  • 업로드 컴퓨터의 디렉터리에서 다음을 수행합니다.
    • EDM 업로드 에이전트
    • 예제에서PatientRecords.csv.csv, .tsv 또는 파이프(|) 형식의 중요한 항목 파일
    • 이 절차를 완료할 때 생성된 출력 해시 및 솔트 파일
    • edm.xml 파일의 데이터 저장소 이름(이 예에서는 PatientRecords)

중요

  1. Windows Server 2016 또는 얼러를 사용하는 경우 EDM 업로드 에이전트를 설치하기 전에 Visual C++도 설치해야 합니다.

보안 그룹 및 사용자 계정 설정

  1. 전역 관리자는 구독에 대한 적절한 링크를 사용하여 관리 센터로 이동하여 EDM_DataUploaders라는 보안 그룹을 만듭니다.

  2. EDM_DataUploaders 보안 그룹에 하나 이상의 사용자를 추가합니다. (이러한 사용자는 중요한 정보의 데이터베이스를 관리합니다.)

한 대의 컴퓨터에서 해시 및 업로드

이 컴퓨터는 Microsoft 365 테넌트에 직접 액세스할 수 있어야 합니다.

참고

이 절차를 시작하기 전에 EDM_DataUploaders 보안 그룹의 구성원인지 확인합니다.

필요에 따라 다음을 실행하여 업로드하기 전에 중요한 정보 원본 테이블 파일에 대한 유효성 검사를 실행하여 오류를 검사 수 있습니다.

EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

EdmUploadAgent.exe지원되는 모든 매개 변수에 대한 자세한 내용은 를 실행합니다.

EdmUploadAgent.exe /?

  • EDM 업로드 에이전트
  • 상업용 + GCC - 대부분의 상용 고객은 이 옵션을 사용해야 합니다.
  • GCC-High - 이 옵션은 특히 보안이 높은 정부 클라우드 구독자를 위한 것입니다.
  • DoD - 이 옵션은 특히 미국 국방부 클라우드 고객을 위한 것입니다.

참고

위의 링크에 있는 EDM 업로드 에이전트가 해시된 데이터에 솔트 값을 자동으로 추가하도록 업데이트되었습니다. 또는 자신의 솔트 값을 입력할 수 있습니다. 이 버전을 사용한 후에는 이전 버전의 EDM 업로드 에이전트를 사용할 수 없습니다.

EDM 업로드 에이전트를 사용하여 데이터를 지정된 데이터 저장소에 하루에 최대 5번 업로드할 수 있습니다.

  1. EDM 업로드 에이전트에 권한을 부여하고, 관리자 권한으로 명령 프롬프트 창을 열고, C:\EDM\Data 디렉터리로 전환한 다음, 다음 명령을 실행합니다.

    EDM Upload Agent.exe /Authorize

    중요

    설치된 폴더에서 EDM 업로드 에이전트 애플리케이션을 실행하고 데이터 파일의 전체 경로를 표시해야 합니다.

  2. EDM_DataUploaders 보안 그룹에 추가된 Microsoft 365의 회사 또는 학교 계정으로 로그인합니다. 테넌트 정보는 연결을 위해 사용자 계정에서 추출됩니다.

    중요: 정확한 데이터 일치 스키마 및 중요한 정보 유형 도구를 사용하여 스키마를 만든 경우 아직 이 절차에서 사용할 수 있도록 다운로드 해야 합니다 . 명령 프롬프트 창에서 다음 명령을 실행합니다.

    EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>
    
  3. 중요한 데이터를 해시하고 업로드하려면 명령 프롬프트 창에서 다음 명령을 실행하세요.

    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /AllowedBadLinesPercentage [value]
    

    참고

    중요한 데이터 파일의 기본 형식은 쉼표로 구분된 값입니다. /ColumnSeparator 매개 변수를 사용하여 "{Tab}" 옵션을 표시하여 탭으로 구분된 파일을 지정하거나 "|" 옵션을 표시하여 파이프로 구분된 파일을 지정할 수 있습니다.

    예: EdmUploadAgent.exe /UploadData /DataStoreName PatientRecords /DataFile C:\Edm\Hash\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5

EDM 및 더블 바이트 문자 집합 언어

정확한 데이터 일치는 중국어, 일본어 및 한국어로 사용되는 것과 같은 더블 바이트 문자를 지원합니다. 그러나 이중 바이트 문자로 인코딩된 부식 증명 정보에 대한 문자열 일치는 지원하지 않습니다. 아래 설명된 대로 EDM에 대한 세계화를 사용하도록 설정하지 않는 한 분류된 콘텐츠에서 검색된 다중 토큰 CJK 텍스트와도 일치하지 않습니다. 모든 경우에 SIT는 기본 필드와 확증 증거 필드 모두에 대한 모든 다중 토큰 텍스트에 매핑되어야 합니다.

중요

더블 바이트 문자에 대한 정확한 데이터 일치를 호출하려면 다음 단계를 수행해야 합니다.

  1. 일본어 간지와 같은 더블 바이트 문자 집합 언어에서 일치하도록 EDM SIT(중요한 정보 유형)를 만듭니다.

  2. EDM 업로드 에이전트 버전 17.01.0495.0 이상을 다운로드하고 설치했는지 확인합니다.

  3. EdmUploadAgent.exe.config 파일의 세계화 매개 변수를 true로 업데이트합니다.<add key=" IsGlobalizationEnabled" value="true">

  4. 일치시킬 데이터를 사용하여 원본 테이블을 해시하고 업로드합니다.

별도의 해시 및 업로드

안전한 환경의 컴퓨터에서 해시를 수행합니다. 두 컴퓨터에 동일한 버전의 EDM 업로드 에이전트가 설치되어 있어야 합니다.

선택 사항: 정확한 데이터 일치 스키마 및 SIT 도구를 사용하여 스키마 파일을 만든 경우 명령 프롬프트 창에서 다음 명령을 실행하여 XML 형식으로 파일을 다운로드합니다.

EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>
  1. 보안 환경의 컴퓨터에서 명령 프롬프트 창에서 다음 명령을 실행합니다.

    EdmUploadAgent.exe /CreateHash /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /AllowedBadLinesPercentage [value]
    

    예를 들면

    EdmUploadAgent.exe /CreateHash /DataFile C:\Edm\Data\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5
    

    참고

    중요한 데이터 파일의 기본 형식은 쉼표로 구분된 값입니다. /ColumnSeparator 매개 변수를 사용하여 "{Tab}" 옵션을 표시하여 탭으로 구분된 파일을 지정하거나 "|" 옵션을 표시하여 파이프로 구분된 파일을 지정할 수 있습니다.

    /Salt saltvalue 옵션을 지정하지 않은 경우 다음 확장명에서 해시된 파일과 솔트 <파일을 출력합니다.>

    • .EdmHash
    • .EdmSalt
  2. 중요한 정보 원본 테이블 파일(PatientRecords)을 테넌트로 업로드하는 데 사용하는 컴퓨터에 이러한 파일을 안전한 방식으로 복사합니다.

  3. EDM 업로드 에이전트에 권한을 부여하고, 관리자 권한으로 명령 프롬프트 창을 열고, C:\EDM\Data 디렉터리로 전환한 다음, 다음 명령을 실행합니다.

    EdmUploadAgent.exe /Authorize
    

    중요

    설치된 폴더에서 EDM 업로드 에이전트 애플리케이션을 실행하고 데이터 파일의 전체 경로를 표시해야 합니다.

  4. EDM_DataUploaders 보안 그룹에 추가된 Microsoft 365의 회사 또는 학교 계정으로 로그인합니다. 테넌트 정보는 연결을 위해 사용자 계정에서 추출됩니다.

  5. 해시된 데이터를 업로드하려면 Windows 명령 프롬프트에서 다음 명령을 실행합니다.

    EdmUploadAgent.exe /UploadHash /DataStoreName \<DataStoreName\> /HashFile \<HashedSourceFilePath\ /ColumnSeparator ["{Tab}"|"|"]
    

    예를 들어,

    EdmUploadAgent.exe /UploadHash /DataStoreName PatientRecords /HashFile C:\\Edm\\Hash\\**PatientRecords.EdmHash**
    
  6. 중요한 데이터의 업로드가 성공했는지 확인하려면 명령 프롬프트 창에서 다음 명령을 실행합니다.

    EdmUploadAgent.exe /GetDataStore
    

    데이터 저장소 목록 및 데이터 저장소가 마지막으로 업데이트된 시점이 표시됩니다.

  7. 모든 데이터 업로드를 특정 저장소에 표시하고 업데이트할 때 명령 프롬프트 창에서 다음 명령을 실행합니다.

    EdmUploadAgent.exe /GetSession /DataStoreName <DataStoreName>
    

참고

해시 및 업로드 프로세스를 처음 만든 후 자동화하려면 정확한 데이터 일치 중요한 정보 원본 테이블 파일 새로 고침을 참조하세요.

다음 단계

또는