규정 준수 센터에서 사용자 지정 중요한 정보 유형 만들기
미리 구성된 중요한 정보 유형이 요구 사항을 충족하지 않는 경우 사용자가 완전히 정의하는 고유 사용자 지정 중요한 정보 유형을 만들거나 미리 구성된 정보 유형을 복사하여 수정할 수 있습니다.
이 방법으로 만드는 사용자 지정 중요한 정보 유형은 이름이 Microsoft.SCCManaged.CustomRulePack인 규칙 패키지에 추가됩니다.
새로운 중요한 정보 유형을 만드는 방법에는 두 가지가 있습니다.
시작하기 전에
중요한 정보 유형과 해당 유형이 무엇으로 구성되어 있는지 잘 알고 있어야 합니다. 중요한 정보 유형에 대해 자세히 알아보기를 참조하세요. 다음의 역할을 이해하는 것이 중요합니다.
- 정규식 - Microsoft 365 중요한 정보 유형에서는 Boost.RegEx 5.1.3 엔진을 사용합니다.
- 키워드 목록 - 중요한 정보 유형을 정의할 때 직접 만들거나 기존 키워드 목록에서 선택할 수 있습니다.
- 키워드 사전
- 중요한 정보 유형 함수
- 신뢰 수준
조직에는 Microsoft Purview 데이터 손실 방지(DLP)를 포함하는 Office 365 Enterprise 같은 구독이 있어야 합니다. 메시징 정책 및 규정 준수 서비스 설명을 참조하세요.
조직에는 DLP(데이터 손실 방지)를 포함하는 구독(예: Office 365 Enterprise)이 있어야 합니다. 메시징 정책 및 규정 준수 서비스 설명을 참조하세요.
중요
Microsoft 고객 서비스 및 지원은 사용자 지정 분류 또는 정규식 패턴 만들기를 지원할 수 없습니다. 지원 엔지니어는 테스트 목적으로 샘플 정규식 패턴 제공 또는 예상대로 트리거되지 않는 기존 정규식 패턴 문제 해결 지원과 같은 기능을 제한적으로 지원할 수 있습니다. 그러나 사용자 지정 콘텐츠 일치 개발이 귀하의 요구 사항이나 의무를 충족할 것이라고 확신할 수는 없습니다.
사용자 지정 중요한 정보 유형 만들기
이 절차를 사용하여 사용자가 완전히 정의하는 중요한 정보 유형을 새로 만들 수 있습니다.
준수 센터에서 데이터 분류 > 중요 정보 유형 으로 이동하고 중요한 정보 유형 만들기 를 선택합니다.
이름 및 설명 값을 입력하고 다음 을 선택합니다.
패턴 만들기 를 선택합니다. 새 중요한 정보 유형을 정의할 때 각각 서로 다른 요소와 신뢰 수준이 있는 여러 개의 패턴을 만들 수 있습니다.
패턴의 기본 신뢰 수준을 선택합니다. 값에는 낮은 신뢰 신뢰도, 보통 신뢰도 및 높은 신뢰도 가 있습니다.
기본 요소 를 선택하고 정의합니다. 기본 요소는 선택적 유효성 검사기가 있는 정규식, 키워드 목록, 키워드 사전 또는 미리 구성된 함수 중 하나가 될 수 있습니다. DLP 함수에 대한 자세한 내용은 중요한 정보 형식 함수를 참조하세요. 날짜 및 체크섬 유효성 검사기에 대한 자세한 내용은 중요한 정보 유형 정규식 유효성 검사기를 참조하세요.
문자 근접성 값을 입력합니다.
(선택 사항) 있는 경우 지원 요소를 추가합니다. 지원 요소는 선택적 유효성 검사기가 있는 정규식, 키워드 목록, 키워드 사전 또는 미리 정의된 함수 중 하나가 될 수 있습니다. 지원 요소는 고유한 문자 근접 구성을 가질 수 있습니다.
(선택 사항) 사용 가능한 검사 목록에서 추가 검사를 추가합니다.
만들기 를 선택합니다.
다음 을 선택합니다.
이 중요한 정보 유형에 대한 권장 신뢰 수준 을 선택합니다.
설정을 확인하고 제출 을 선택합니다.
중요
Microsoft 365는 SharePoint Online 및 비즈니스용 OneDrive 사이트에서 중요한 정보를 식별하고 분류하기 위해 검색 크롤러를 사용합니다. 기존 콘텐츠에서 새로운 사용자 지정 중요한 정보 유형을 식별하려면 해당 콘텐츠에 대한 크롤링을 다시 수행해야 합니다. 콘텐츠는 일정을 기반으로 크롤링되지만 사이트 모음, 목록 또는 라이브러리의 콘텐츠를 수동으로 다시 크롤링할 수 있습니다. 자세한 내용은 사이트, 라이브러리 또는 목록을 크롤링 및 다시 인덱싱하도록 수동으로 요청을 참조하세요.
데이터 분류 페이지에 모든 중요한 정보 유형이 나열됩니다. 새로 고침 을 선택한 다음 검색 도구를 찾아보거나 사용하여 방금 만든 중요한 정보 유형을 찾을 수 있습니다.
중요한 정보 유형을 복사하여 수정하기
기존 중요한 정보 유형을 기반으로 하는 새 중요한 정보 유형을 만들기 위해 이 절차를 사용합니다.
참고
이러한 SIT는 복사할 수 없습니다.
- 캐나다 운전 면허증 번호
- EU 운전 면허증 번호
- EU 국가 식별 번호
- EU 여권 번호
- EU 사회 보장 번호 또는 동등한 식별
- EU 세금 식별 번호
- 질병의 국제 분류 (ICD-10-CM)
- 국제 질병 분류(ICD-9-CM)
- 미국 운전 면허증 번호
PowerShell 및 정확한 데이터 매치 기능을 사용하여 사용자 지정 중요한 정보 유형을 만들 수도 있습니다. 해당 방법에 대한 자세한 내용은 다음을 참조하세요.
규정 준수 센터에서 데이터 분류 > 중요한 정보 유형 으로 이동하고 복사하려는 사용자 지정 중요한 정보 유형을 선택합니다.
플라이아웃에서 복사 를 선택합니다.
중요한 정보 유형 목록에서 새로 고침 을 선택하고 방금 만든 복사본을 찾아보거나 검색합니다. 부분 문자열 검색이 작동하므로
copy을(를) 검색하면 이름에copy단어를 포함하는 모든 중요한 정보 유형이 반환됩니다.이름 및 설명 값을 입력하고 다음 을 선택합니다.
중요한 정보 유형 복사본을 선택하고 편집 을 선택합니다.
새 중요한 정보 유형에 새 이름 을 입력하고 설명 을 입력합니다.
기존 패턴을 편집하거나 제거하고 새 패턴을 추가할 수 있습니다. 새 패턴의 기본 신뢰 수준을 선택합니다. 값에는 낮은 신뢰 신뢰도, 보통 신뢰도 및 높은 신뢰도 가 있습니다.
기본 요소 를 선택하고 정의합니다. 기본 요소는 정규식, 키워드 목록, 키워드 사전 또는 미리 구성된 함수 중 하나가 될 수 있습니다. 중요한 정보 유형 함수를 참조하세요.
문자 근접성 값을 입력합니다.
(선택 사항) 지원 요소 또는 추가 검사가 있는 경우 추가 요소를 추가합니다. 필요한 경우 지원 요소 를 그룹화할 수 있습니다.
만들기 를 선택합니다.
다음 을 선택합니다.
이 중요한 정보 유형에 대한 권장 신뢰 수준 을 선택합니다.
설정을 확인하고 제출 을 선택합니다.
중요한 정보 유형 테스트
목록에서 중요한 정보 유형을 테스트할 수 있습니다. 정책에서 중요한 정보 유형을 사용하기 전에 만든 모든 중요한 정보 유형을 테스트할 것을 권장합니다.
Word 문서와 같은 두 개의 파일을 준비합니다. 하나는 중요한 정보 유형에서 지정한 요소와 일치하는 콘텐츠가 있는 파일이고 하나는 일치하지 않는 파일입니다.
규정 준수 센터에서 데이터 분류 > 중요한 정보 유형 으로 이동하고 목록에서 중요한 정보 유형을 선택하여 세부 정보 창을 열고 테스트 를 선택합니다.
파일을 업로드하고 테스트 를 선택합니다.
결과 일치 페이지에서 결과를 검토한 다음 마침 을 선택합니다.
사용자 지정 중요한 정보 유형 제한
높은 성능과 짧은 대기 시간을 보장하기 위해 사용자 지정 SID 구성에는 제한이 있습니다.
| 제한 유형 | 값 |
|---|---|
| 규정 준수 센터를 통해 만든 사용자 지정 SID의 최대 수 | 500 |
| 정규식의 최대 길이 | 1024자 |
| 키워드 목록에서 지정된 용어의 최대 길이 | 50자 |
| 키워드 목록의 최대 용어 수 | 2048 |
| 중요한 정보 유형당 고유 regexe의 최대 수 | 20 |
| 키워드 사전의 최대 크기(압축 후) | 1MB(~1,000,000자) |
| 테넌트에서 키워드 사전 기반 SIT의 최대 수 | 50 |
참고
500개 이상의 사용자 지정 SIT를 만들어야 하는 비즈니스가 있는 경우 지원 티켓을 제기하세요.
SIT에 대해 지원되는 인스턴스 수 값
SIT 인스턴스 수 제한은 이러한 솔루션에서 SIT를 사용하는 경우에 적용됩니다.
- DLP 정책
- 정보 보호
- 데이터 수명 주기 관리
- 커뮤니케이션 규정 준수
- 레코드 관리
- Microsoft Defender for Cloud Apps
- Microsoft Priva
검사된 항목이 규칙 조건을 충족하려면 단일 항목에 있는 SIT의 고유 인스턴스 수가 최소값과 최대값 사이에 있어야 합니다. 이를 인스턴스 수라고 합니다.
- 최소 필드: 일치 항목을 트리거하기 위해 항목에서 찾아야 하는 SIT의 고유 인스턴스의 하한(최소 수)입니다. 최소 필드는 다음 값을 지원합니다.
- 1 ~500
- 최대 필드: 항목에서 찾을 수 있고 여전히 일치 항목을 트리거하는 SIT의 고유 인스턴스 수에 대한 상한입니다. 최대 필드는 다음 값을 지원합니다.
- 1에서 500까지 - 항목의 SIT 인스턴스 수에 대해 500 이하인 특정 상한을 설정하려는 경우 사용합니다.
- Any - 검사된 항목에서 정의되지 않은 수의 SIT 고유 인스턴스가 발견되고 고유 인스턴스 수가 최소 고유 인스턴스 값 수를 충족하거나 초과하는 경우 고유 인스턴스 개수 조건을 충족하도록 하려는 경우에 사용합니다
Any. 즉, 최소값이 충족되는 한 고유한 인스턴스 수 조건이 충족됩니다.
예를 들어 SIT의 고유 인스턴스가 500개 이상 단일 항목에 있을 때 규칙이 일치 항목을 트리거하도록 하려면 최소 값과 최대 값 Any``500 을 설정합니다.
참고
Microsoft 365 Information Protection은 다음의 더블 바이트 문자 집합 언어를 지원합니다.
- 중국어(간체)
- 중국어(번체)
- 한국어
- 일본어
이 지원은 중요한 정보 유형에 대해 사용할 수 있습니다. 자세한 정보는 더블 바이트 문자 집합 릴리스 정보(미리 보기)에 대한 정보 보호 지원을 참조하세요.
팁
중국어/일본어 문자와 단일 바이트 문자가 포함된 패턴을 검색하거나 중국어/일본어 및 영어가 포함된 패턴을 검색하려면 키워드 또는 regex의 두 가지 변형을 정의합니다.
- 예를 들어 "机密的document"와 같은 키워드를 검색하려면 해당 키워드의 두 변형을 사용합니다. 일본어와 영어 텍스트 사이에 공백이 있고 일본어 텍스트와 영어 텍스트 사이에 공백이 없는 다른 텍스트가 있습니다. 따라서 SIT에 추가할 키워드는 "机密的 document" 및 "机密的document"여야 합니다. 마찬가지로 "東京オリンピック2020"라는 구를 검색하려면 두 가지 변형("東京オリンピック 2020" 및 "東京オリンピック2020")을 사용해야 합니다.
중국어/일본어/더블 바이트 문자와 함께 키워드/구 목록에 중국어/일본어 이외의 단어도 포함되어 있는 경우(예: 영어만 해당) 두 개의 사전/키워드 목록을 만드는 것이 좋습니다. 하나는 중국어/일본어/더블 바이트 문자가 포함된 키워드용이고 다른 하나는 영어 전용입니다.
- 예를 들어 "극비", "機密性が高い" 및 "机密的문서"라는 세 개의 구가 포함된 키워드 사전/목록을 만들려는 경우, 두 개의 키워드 목록을 만들어야 합니다.
- 극비
- 機密性が高い, 机密的문서 및 机密的 문서
더블 바이트 하이픈 또는 더블 바이트 마침표로 regex를 만드는 동안 regex에서 하이픈이나 마침표가 이스케이프되는 것처럼 두 문자를 모두 이스케이프해야 합니다. 다음은 참조용 샘플 regex입니다.
(?<!\d)([4][0-9]{3}[\-?\-\t]*[0-9]{4})
이중 바이트 특수 문자는 키워드에 사용하면 안 됩니다.
키워드 목록에서 단어 일치 대신 문자열 일치를 사용하는 것이 좋습니다.