정확한 데이터 일치 기반 중요한 정보 유형에 대해 중요한 정보 원본 테이블을 해시하고 업로드합니다.
이 문서에서는 중요한 정보 원본 테이블을 해시하고 업로드하는 방법을 보여줍니다.
중요한 정보 원본 테이블 해시 및 업로드
이 단계에서는 다음을 수행합니다.
- 사용자 지정 보안 그룹 및 사용자 계정 설정
- EDM 업로드 에이전트 도구 설정
- EDM 업로드 에이전트 도구를 사용하여 솔트 값, 중요한 정보 원본 테이블을 사용하여 해시하고 업로드합니다.
해시 및 업로드는 한 대의 컴퓨터를 사용하여 수행하거나 보안 강화를 위해 업로드 단계에서 해싱 단계를 분리할 수 있습니다.
한 대의 컴퓨터에서 해시하고 업로드하려면 Microsoft 365 테넌트에 직접 연결할 수 있는 컴퓨터에서 수행해야 합니다. 이렇게 하려면 명확한 텍스트 중요한 정보 원본 테이블 파일이 해시를 위해 해당 컴퓨터에 있어야 합니다.
일반 텍스트 중요한 정보 원본 테이블 파일을 직접 액세스 컴퓨터에 노출하지 않으려면 안전한 위치에 있는 컴퓨터에서 해시한 다음 업로드를 위해 Microsoft 365 테넌트에 직접 연결할 수 있는 컴퓨터에 해시 파일과 솔트 파일을 복사할 수 있습니다. 분리된 해시 및 업로드 시나리오에서는 두 컴퓨터 모두에 EDMUploadAgent가 필요합니다.
중요
정확한 데이터 일치 스키마 및 중요한 정보 유형 마법사를 사용하여 스키마 파일을 만든 경우 아직 수행하지 않은 경우 이 절차의 스키마를 다운로드 해야 합니다 . XML 형식으로 EDM 스키마 파일 내보내기를 참조하세요.
참고
조직 에서 테넌트 수준에서 Microsoft 365에 대한 고객 키를 설정한 경우 정확한 데이터 일치는 암호화 기능을 자동으로 사용합니다. 상업용 클라우드의 E5 라이선스 테넌트에서만 사용할 수 있습니다.
모범 사례
프로세스의 문제를 보다 쉽게 격리할 수 있도록 중요한 데이터를 해시 및 업로드하는 프로세스를 분리합니다.
프로덕션 환경에서는 대부분의 경우 두 단계를 별도로 유지합니다. 격리된 컴퓨터에서 해시 프로세스를 수행한 다음 인터넷 연결 컴퓨터에 업로드하기 위해 파일을 전송하면 인터넷 연결로 인해 손상되었을 수 있는 컴퓨터의 일반 텍스트 형식으로 실제 데이터를 사용할 수 없습니다.
중요한 데이터 테이블에 서식 문제가 없는지 확인
중요한 데이터를 해시하고 업로드하기 전에 검색을 수행하여 콘텐츠 구문 분석에서 문제를 일으킬 수 있는 특수 문자가 있는지 확인합니다. 다음 구문과 함께 EDM 업로드 에이전트를 사용하여 테이블이 EDM과 함께 사용하기에 적합한 형식인지 확인할 수 있습니다.
EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]
도구가 열 수의 불일치를 나타내는 경우 열 구분 기호와 혼동되는 테이블의 값 내에 쉼표 또는 따옴표 문자가 있기 때문일 수 있습니다. 전체 값을 둘러싸고 있지 않으면 작은따옴표와 큰따옴표로 인해 도구가 개별 열이 시작되거나 끝나는 위치를 잘못 지정할 수 있습니다.
전체 값을 둘러싼 단일 또는 큰따옴표 문자를 찾으면 그대로 둘 수 있습니다.
값 내에서 작은따옴표 문자나 쉼표를 찾을 경우(예: 사람의 이름 Tom O'Neil 또는 아포스트로피 문자로 시작하는 도시 's-Gravenhage)'는 이러한 열을 큰따옴표로 둘러싸는 중요한 정보 테이블을 생성하는 데 사용되는 데이터 내보내기 프로세스를 수정해야 합니다.
값 내에서 큰따옴표 문자를 찾을 경우 이러한 문제에 덜 취약한 테이블에 대해 탭으로 구분된 형식을 사용하는 것이 좋습니다.
필수 구성 요소
- EDM_DataUploaders 보안 그룹에 추가될 Microsoft 365용 회사 또는 학교 계정
- .NET 버전 4.6.2를 사용하는 Windows 10 또는 Windows Server 2016 컴퓨터 EDMUploadAgent를 실행하기 위한
- 다음에 대한 업로드 컴퓨터의 디렉토리 :
- EDM 업로드 에이전트
- 예제에서PatientRecords.csv.csv, .tsv 또는 파이프(|) 형식의 중요한 항목 파일
- 이 절차에서 만든 출력 해시 및 솔트 파일
- edm.xml 파일의 데이터 저장소 이름(이 예에서는
PatientRecords)
보안 그룹 및 사용자 계정 설정
전역 관리자로서 구독에 대한 적절한 링크를 사용하여 관리 센터로 이동하고 EDM_ DataUploaders 라는 보안 그룹을 만듭니다.
한 명 이상의 사용자를 EDM_DataUploaders 보안 그룹에 추가합니다. (이러한 사용자가 중요한 정보 데이터베이스를 관리합니다.)
한 대의 컴퓨터에서 해시 및 업로드
이 컴퓨터는 Microsoft 365 테넌트에 직접 액세스할 수 있어야 합니다.
참고
이 절차를 시작하기 전에 본인이 EDM_DataUploaders 보안 그룹의 구성원인지 확인하세요.
팁
필요에 따라 다음을 실행하여 업로드하기 전에 중요한 정보 원본 테이블 파일에 대한 유효성 검사를 실행하여 오류를 확인할 수 있습니다.
EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]
지원되는 모든 EdmUploadAgent.exe 매개 변수 실행에 대한 자세한 내용
EdmUploadAgent.exe /?
구독 유형별 EDM 업로드 에이전트에 대한 링크
EDMUploadAgent에 대한 작업 디렉터리를 만듭니다. 예를 들어, C:\EDM\Data. 여기에 PatientRecords.csv 파일을 배치하세요.
구독에 적합한 EDM 업로드 에이전트를 1단계에서 만든 디렉토리에 다운로드하여 설치합니다.
참고
위 링크의 EDMUploadAgent는 해시된 데이터에 솔트 값을 자동으로 추가하도록 업데이트되었습니다. 또는 자신의 솔트 값을 입력할 수 있습니다. 이 버전을 사용한 후에는 이전 버전의 EDMUploadAgent를 사용할 수 없습니다.
EDMUploadAgent를 사용하여 하루에 두 번만 지정된 데이터 저장소에 데이터를 업로드할 수 있습니다.
EDM 업로드 에이전트에 권한을 부여하고, 관리자 권한으로 명령 프롬프트 창을 열고, C:\EDM\Data 디렉터리로 전환한 다음, 다음 명령을 실행합니다.
EdmUploadAgent.exe /Authorize중요
설치된 폴더에서 EdmUploadAgent 를 실행하고 데이터 파일의 전체 경로를 표시해야 합니다.
EDM_DataUploaders 보안 그룹에 추가된 Microsoft 365용 회사 또는 학교 계정으로 로그인합니다. 테넌트 정보는 연결을 위해 사용자 계정에서 추출됩니다.
선택 사항: 정확한 데이터 일치 스키마 및 중요한 정보 유형 마법사를 사용하여 스키마를 만든 경우 아직 이 절차에서 사용할 수 있도록 다운로드 해야 합니다 . 명령 프롬프트 창에서 다음 명령을 실행합니다.
EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>중요한 데이터를 해시하고 업로드하려면 명령 프롬프트 창에서 다음 명령을 실행하세요.
EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /ColumnSeparator ["{Tab}"|"|"] /AllowedBadLinesPercentage [value]참고
중요한 데이터 파일의 기본 형식은 쉼표로 구분된 값입니다. /ColumnSeparator 매개 변수로 "{Tab}" 옵션을 표시하여 탭으로 구분된 파일을 지정하거나 "|" 옵션을 표시하여 파이프로 구분된 파일을 지정할 수 있습니다.
예:
EdmUploadAgent.exe /UploadData /DataStoreName PatientRecords /DataFile C:\Edm\Hash\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5중요한 정보 테이블에 잘못된 형식의 값이 있지만 잘못된 행을 무시하고 나머지 데이터를 가져오려는 경우 명령에서 /AllowedBadLinesPercentage 매개 변수를 사용할 수 있습니다. 위의 예제에서는 5% 임계값을 지정합니다. 즉, 행의 최대 5%가 유효하지 않은 경우에도 도구가 중요한 정보 테이블을 해시하고 업로드합니다.
이 명령은 보안을 강화하기 위해 해시에 임의로 생성된 솔트 값을 자동으로 추가합니다. 선택에 따라, 고유한 솔트 값을 사용하려면 /Salt <saltvalue> 를 명령에 추가하세요. 이 값은 길이가 64자여야 하며 a-z 문자와 0-9만 포함할 수 있습니다.
다음 명령을 실행하여 업로드 상태를 확인하세요.
EdmUploadAgent.exe /GetSession /DataStoreName \<DataStoreName\>예:
EdmUploadAgent.exe /GetSession /DataStoreName PatientRecords상태가 ProcessingInProgress 인지 확인합니다. 상태가 완료 로 변경될 때까지 몇 분마다 다시 확인하세요. 상태가 완료되면 EDM 데이터를 사용할 수 있습니다. 중요한 정보 원본 테이블 파일의 크기에 따라 몇 분에서 몇 시간까지 걸릴 수 있습니다.
팁
업로드된 중요한 데이터를 사용할 준비가 되면 알림을 받으려면 정확한 데이터 일치 활동에 대한 알림 만들기의 절차를 따르세요.
별도의 해시 및 업로드
안전한 환경의 컴퓨터에서 해시를 수행합니다. 두 컴퓨터에 모두 EDMUploadAgent 가 설치되어 있어야 합니다.
선택 사항: 정확한 데이터 일치 스키마 및 중요한 정보 유형 마법사를 사용하여 스키마를 만들고 아직 다운로드하지 않은 경우 명령 프롬프트 창에서 다음 명령을 실행하여 XML 형식으로 파일을 다운로드합니다.
EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>
보안 환경의 컴퓨터에서 명령 프롬프트 창에서 다음 명령을 실행합니다.
EdmUploadAgent.exe /CreateHash /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /AllowedBadLinesPercentage [value]예를 들면 다음과 같습니다.
EdmUploadAgent.exe /CreateHash /DataFile C:\Edm\Data\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5참고
중요한 데이터 파일의 기본 형식은 쉼표로 구분된 값입니다. /ColumnSeparator 매개 변수로 "{Tab}" 옵션을 표시하여 탭으로 구분된 파일을 지정하거나 "|" 옵션을 표시하여 파이프로 구분된 파일을 지정할 수 있습니다.
/Salt <saltvalue> 옵션을 지정하지 않은 경우 해시 파일과 이러한 확장자를 가진 솔트 파일이 출력됩니다.
- .EdmHash
- .EdmSalt
중요한 정보 원본 테이블 파일(PatientRecords)을 테넌트에 업로드하는 데 사용할 컴퓨터에 이러한 파일을 안전하게 복사합니다.
EDM 업로드 에이전트에 권한을 부여하고, 관리자 권한으로 명령 프롬프트 창을 열고, C:\EDM\Data 디렉터리로 전환한 다음, 다음 명령을 실행합니다.
EdmUploadAgent.exe /Authorize중요
설치된 폴더에서 EdmUploadAgent 를 실행하고 데이터 파일의 전체 경로를 표시해야 합니다.
EDM_DataUploaders 보안 그룹에 추가된 Microsoft 365용 회사 또는 학교 계정으로 로그인합니다. 테넌트 정보는 연결을 위해 사용자 계정에서 추출됩니다.
해시된 데이터를 업로드하려면 Windows 명령 프롬프트에서 다음 명령을 실행합니다.
EdmUploadAgent.exe /UploadHash /DataStoreName \<DataStoreName\> /HashFile \<HashedSourceFilePath\ /ColumnSeparator ["{Tab}"|"|"]예를 들어,
EdmUploadAgent.exe /UploadHash /DataStoreName PatientRecords /HashFile C:\\Edm\\Hash\\**PatientRecords.EdmHash**중요한 데이터가 업로드 되었는지 확인하려면 명령 프롬프트 창에서 다음 명령을 실행합니다.
EdmUploadAgent.exe /GetDataStore데이터 저장소 목록 및 마지막 업데이트 날짜를 볼 수 있습니다.
특정 저장소에 대한 모든 데이터 업로드를 보려면 Windows 명령 프롬프트에서 다음 명령을 실행하여 모든 데이터 저장소의 목록과 업데이트된 시기를 확인합니다.
EdmUploadAgent.exe /GetSession /DataStoreName <DataStoreName>
참고
해시를 처음 만든 후 해시 및 업로드 프로세스를 자동화하려면 정확한 데이터 일치 중요한 정보 원본 테이블 파일 새로 고침을 참조하세요.