중요한 정보 유형에 대해 자세히 알아보기

조직에서 제어하는 중요한 항목을 식별하고 분류하는 것은 정보 보호 분야 의 첫 번째 단계입니다. Microsoft 365 분류할 수 있도록 항목을 식별하는 세 가지 방법을 사용할 수 있습니다.

  • 사용자가 수동으로
  • 중요한 정보 유형과 같은 자동화된 패턴 인식
  • 기계 학습

중요한 정보 유형은 패턴 기반 분류자입니다. 또한 주민등의 보안, 신용 카드 또는 은행 계좌 번호와 같은 중요한 정보를 검색하여 중요한 항목을 식별합니다. 중요한 정보 유형 엔터티 정의를 참조하세요.

중요한 정보 유형이 사용

중요한 정보 유형의 기본 부분

모든 중요한 정보 유형 엔터티는 다음 필드에 의해 정의됩니다.

  • 이름: 중요한 정보 유형을 참조하는 방법
  • description: 중요한 정보 유형이 찾는 내용 설명
  • 패턴: 패턴은 중요한 정보 유형이 감지하는 것을 정의합니다. 다음 구성 요소로 구성됩니다.
    • Primary 요소 - 중요한 정보 유형이 찾는 주 요소입니다. 체크 um 유효성 검사, 키워드 목록, 키워드 사전 또는 함수가 있는 정규식일 수 있습니다.
    • 지원 요소 – 일치의 신뢰를 높이는 데 도움이 되는 증거 역할을 하는 요소입니다. 예를 들어 SSN 번호와 근접한 키워드 "SSN"입니다. 체크 um 유효성 검사, 키워드 목록, 키워드 사전을 포함하거나 포함하지 않은 정규식일 수 있습니다.
    • 신뢰 수준 - 신뢰 수준(높음, 중간, 낮음)은 기본 요소와 함께 감지된 지원 증거의 수준을 반영합니다. 항목에 포함된 증거가 수록 일치하는 항목에 찾고 있는 중요한 정보가 포함되어 있다는 신뢰도가 높아지기 때문에
    • 근접 - 기본 요소와 지원 요소 사이의 문자 수

증분 증거 및 근접성 창 다이어그램입니다.

이 비디오의 신뢰 수준에 대해 자세히 알아보시다

중요한 정보 유형 예

아르헨티나 국가 ID(DNI) 번호

형식

마침표로 구분된 8자리 숫자

패턴

8자리 숫자:

  • 2자리 숫자
  • 기간
  • 3자리 숫자
  • 기간
  • 3자리 숫자

체크섬

아니요

정의

DLP 정책은 다음의 경우 이러한 유형의 중요한 정보가 300자 이내의 근접성으로 검색될 수 있다는 신뢰를 중간 정도 신뢰합니다.

  • 정규식 Regex_argentina_national_id 일치하는 콘텐츠를 검색합니다.
  • 검색된 Keyword_argentina_national_id 발견됩니다.
<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
      <IdMatch idRef="Regex_argentina_national_id"/>
      <Match idRef="Keyword_argentina_national_id"/>
  </Pattern>
</Entity>

키워드

Keyword_argentina_national_id

  • Argentina National Identity number
  • ID
  • Identification National Identity Card
  • DNI
  • NIC National Registry of Persons
  • Documento Nacional de Identidad
  • Registro Nacional de las Personas
  • Identidad
  • Identificación

신뢰 수준에 대한 추가

중요한 정보 유형 엔터티 정의에서 신뢰 수준은 기본 요소 외에 검색되는 증거의 수를 반영합니다. 항목에 포함된 증거가 수록 일치하는 항목에 찾고 있는 중요한 정보가 포함되어 있다는 신뢰도가 높아지기 때문에 예를 들어 신뢰 수준이 높은 일치는 기본 요소와 근접한 더 많은 증거를 포함하나 신뢰 수준이 낮은 일치는 근접한 증거를 거의 또는 거의 포함하지 않습니다.

신뢰도 수준이 높을수록 가음성은 가장 적지만 가음성은 더 많이 반환될 수 있습니다. 신뢰 수준이 낮거나 보통이면 가음성은 더 많이 반환하지만 가음성 수준은 0에서 0까지입니다.

  • 낮은 신뢰도: 값 65, 일치 항목은 가음성은 가장 적지만 오음성은 가장 적습니다. 낮은 신뢰도는 낮은 신뢰도, 보통 및 높은 신뢰도 일치를 모두 반환합니다.
  • 중간 신뢰도: 값 75, 일치 항목은 평균 가짓 긍정 양과 거짓 부정을 포함하게 됩니다. 보통 신뢰도는 모든 중간 신뢰도 및 높은 신뢰도 일치를 반환합니다.
  • 높은 신뢰도: 값이 85이면 일치하는 항목은 가음성은 가장 적지만 거짓 부정은 가장 적습니다. 높은 신뢰도는 높은 일치만 반환합니다.

신뢰도 패턴은 낮은 수로, 5~10개, 신뢰도가 높은 패턴은 20개 이상을 사용하세요.

참고

숫자 기반 신뢰 수준(정확도로도 아는)을 사용하여 정의된 기존 정책 또는 사용자 지정 중요한 정보 유형(SITS)이 있는 경우 이러한 정책은 자동으로 3개의 불연산 신뢰 수준에 매핑됩니다. 보안 @ 준수 센터 UI 전반에서 신뢰도, 중간 신뢰도 및 높은 신뢰도

  • 신뢰 수준이 76에서 100 사이인 최소 정확도 또는 사용자 지정 SIT 패턴이 있는 모든 정책은 높은 신뢰도로 매핑됩니다.
  • 신뢰 수준이 66에서 75 사이인 최소 정확도 또는 사용자 지정 SIT 패턴이 있는 모든 정책은 중간 신뢰도로 매핑됩니다.
  • 신뢰 수준이 65 이하인 최소 정확도 또는 사용자 지정 SIT 패턴이 있는 모든 정책은 낮은 신뢰도로 매핑됩니다.

사용자 지정 중요한 정보 유형 만들기

보안 및 준수 센터에서 사용자 지정 중요한 정보 유형을 만들려면 몇 가지 옵션 중에서 선택할 수 있습니다.

참고

향상된 신뢰도 수준은 Microsoft 365 서비스에 대한 데이터 손실 방지, Microsoft Information Protection 서비스, 통신 준수Microsoft Information Protection 정보 거버넌스 및 레코드 관리에 Microsoft 365 즉시 사용할 수 있습니다. Microsoft 365 정보 보호는 이제 다음에 대한 더블 문자 집합 언어를 지원합니다.

  • 중국어(간체)
  • 중국어(번체)
  • 한국어
  • 일본어

이 지원은 중요한 정보 유형에 대해 사용할 수 있습니다. 자세한 정보는 더블 바이트 문자 집합 릴리스 정보(미리 보기)에 대한 정보 보호 지원을 참조하세요.

중국어/일본어 문자와 단일 바이트 문자가 포함된 패턴을 검색하거나 중국어/일본어 및 영어가 포함된 패턴을 검색하려면 키워드 또는 regex의 두 가지 변형을 정의합니다.

  • 예를 들어 "机密的document"와 같은 키워드를 검색하려면 해당 키워드의 두 변형을 사용합니다. 일본어와 영어 텍스트 사이에 공백이 있고 일본어 텍스트와 영어 텍스트 사이에 공백이 없는 다른 텍스트가 있습니다. 따라서 SIT에 추가할 키워드는 "机密的 document" 및 "机密的document"여야 합니다. 마찬가지로 "東京オリンピック2020"라는 구를 검색하려면 두 가지 변형("東京オリンピック 2020" 및 "東京オリンピック2020")을 사용해야 합니다.

중국어/일본어/더블 바이트 문자와 함께 키워드/구 목록에 중국어/일본어 이외의 단어도 포함되어 있는 경우(예: 영어만 해당) 두 개의 사전/키워드 목록을 만드는 것이 좋습니다. 하나는 중국어/일본어/더블 바이트 문자가 포함된 키워드용이고 다른 하나는 영어 전용입니다.

  • 예를 들어 "극비", "機密性が高い" 및 "机密的문서"라는 세 개의 구가 포함된 키워드 사전/목록을 만들려는 경우, 두 개의 키워드 목록을 만들어야 합니다.
    1. 극비
    2. 機密性が高い, 机密的문서 및 机密的 문서

더블 바이트 하이픈 또는 더블 바이트 마침표로 regex를 만드는 동안 regex에서 하이픈이나 마침표가 이스케이프되는 것처럼 두 문자를 모두 이스케이프해야 합니다. 다음은 참조용 샘플 regex입니다.

  • (?<!\d)([4][0-9]{3}[-?\-\t]*[0-9]{4}

키워드 목록에서 단어 일치 대신 문자열 일치를 사용하는 것이 좋습니다.

자세한 내용은

중요한 정보 유형을 사용하여 데이터 개인 정보 보호 규정을 준수하는 방법에 대한 자세한 내용은 Deploy information protection for data privacy regulations with Microsoft 365 (aka.ms/m365dataprivacy)를 참조하십시오.