학습 가능한 분류자에 대한 자세한 정보

콘텐츠를 올바르게 보호하고 처리할 수 있도록 콘텐츠를 분류하고 레이블을 지정하는 것은 정보 보호 분야를 위한 시작입니다. Microsoft 365 분류하는 세 가지 방법이 있습니다.

수동으로

이 방법을 사용하려면 사람의 판단과 조치가 필요합니다. 관리자는 기존 레이블 및 중요한 정보 유형을 사용하거나 직접 만든 다음 게시할 수 있습니다. 사용자와 관리자는 콘텐츠를 접할 때 콘텐츠에 적용합니다. 그런 다음 콘텐츠를 보호하고 해당 내용을 관리할 수 있습니다.

자동화된 패턴 일치

이러한 분류 메커니즘 범주에는 다음을 통해 콘텐츠를 찾는 내용이 포함됩니다.

  • 키워드 또는 메타데이터 값(키워드 쿼리 언어)입니다.
  • 주민등의 보안, 신용 카드 또는 은행 계좌 번호(중요한 정보 유형 엔터티 정의)와 같은 이전에 식별된 중요한 정보 패턴을 사용합니다.
  • 서식 파일(문서 손가락 인쇄)의 변형이기 때문에 항목을 인식합니다.
  • 정확한 문자열(정확한 데이터 일치)이 있는 경우.

그런 다음 민감도 및 보존 레이블을 자동으로 적용하여 데이터 손실 방지에 대해 자세히 보기에서콘텐츠를 사용할 수 있도록 설정하고 보존 레이블에 대한 정책을 자동으로 적용할 수 있습니다.

분류자

이 분류 방법은 수동 또는 자동화된 패턴 일치 방법으로 쉽게 식별되지 않는 콘텐츠에 특히 적합합니다. 이 분류 방법은 분류기가 항목에 있는 요소(패턴 일치)가 아니라 항목이 무엇인지에 따라 항목을 식별하는 것을 학습하는 것에 가깝습니다. 분류자에서는 분류에 관심이 있는 콘텐츠의 수백 가지 예를 확인하여 콘텐츠 형식을 식별하는 방법을 학습합니다. 먼저 범주에 있는 예제를 공급합니다. 이러한 예제를 처리한 후 일치하는 예제와 일치하지 않는 예제를 혼합하여 테스트합니다. 그런 다음 분류기는 주어진 항목이 구축하는 범주에 속하는지 여부를 예측합니다. 그런 다음 결과를 확인하여 참 긍정, 참 부정, 가짓 긍정 및 거짓 부정을 정렬하여 예측 정확도를 높일 수 있습니다.

분류기를 게시하면 SharePoint Online, Exchange, OneDrive 같은 위치의 항목을 정렬하고 콘텐츠를 분류합니다. 분류기를 게시한 후 초기 교육 프로세스와 유사한 피드백 프로세스를 사용하여 분류자 교육을 계속할 수 있습니다.

학습 가능한 분류자 사용 가능 위치

기본 제공 분류자 및 학습 가능한 분류자 모두 민감도 레이블을Office 자동 레이블 지정, 조건 및 통신 규정 준수에 따라 보존 레이블 정책 자동 적용에 대한 조건으로 사용할 수 있습니다.

민감도 레이블은 분류기를 조건으로 사용할 수 있습니다. 콘텐츠에 자동으로 민감도 레이블 적용을 참조하세요.

중요

분류기는 암호화되지 않은 항목에서만 작업합니다.

분류자 유형

  • 사전 학습된 분류자 - Microsoft는 교육 없이 사용할 수 있는 여러 분류자들을 생성하고 사전 교육했습니다. 이러한 분류자는 상태와 함께 Ready to use 표시됩니다.
  • 사용자 지정 분류자 - 사전 학습된 분류자에서 다루는 것 이상으로 확장되는 분류 요구가 있는 경우 자체 분류기를 만들고 교육할 수 있습니다.

사전 학습된 분류자

Microsoft 365 5개의 사전 학습된 분류자와 함께 사용할 수 있습니다.

주의

많은 수의 가양성 생성이 터지기 때문에 공격 언어 사전 학습된 분류자 사용이 더는 사용되지 않습니다. 이 기능을 사용하지 말고 현재 사용 중인 경우 비즈니스 프로세스를 벗어날 수 있습니다. 위협, 비언어 및 괴롭히기 사전 학습된 분류자 대신 사용하는 것이 좋습니다.

  • 이력서: 신청자의 개인, 교육, 전문 자격, 작업 환경 및 기타 개인 식별 정보의 텍스트 계정인 항목을 검색합니다.
  • 소스 코드: 25개 도구에서 사용된 컴퓨터 프로그래밍 언어 중 상위 25개 언어로 작성된 명령문 집합이 포함된 GitHub
    • ActionScript
    • C
    • C #
    • C++
    • 클로jure
    • CoffeeScript
    • 이동
    • Haskell
    • Java
    • JavaScript
    • 루아
    • MATLAB
    • Objective-C
    • Perl
    • PHP
    • Python
    • R
    • Ruby
    • 스칼라
    • Swift
    • Tex
    • Vim Script

참고

소스 코드는 텍스트의 대량이 소스 코드인 경우를 감지하기 위해 교육됩니다. 일반 텍스트와 상호 연동되는 소스 코드 텍스트는 검색하지 않습니다.

  • 괴롭기: 경마, 민족, 종교, 국적, 성, 성적 취향, 연령, 장애 등 한 명 또는 여러 개인을 대상으로 하는 공격적인 행동과 관련된 특정 범주의 공격적인 언어 텍스트 항목을 검색합니다.
  • 비언어: 대부분의 사용자에 대해 당황하는 식을 포함하는 특정 범주의 공격적인 언어 텍스트 항목을 검색합니다.
  • 위협: 위협을 가하거나 사람 또는 속성에 물리적인 손해를 입히기 위해 위협과 관련된 공격적인 언어 텍스트 항목의 특정 범주를 검색합니다.
  • 차별: 명시적 차별 언어를 감지하며, 다른 커뮤니티와 비교할 때 아프리카 아메리카/검은색 커뮤니티에 대한 차별 언어에 특히 민감합니다.

이러한 분류는 Microsoft 365 규정 준수 센터 데이터 분류 학습 가능한 > > 분류자 보기에 상태가 Ready to use 표시됩니다.

classifiers-pre-trained-classifiers.

중요

공격적인 언어, 괴롭히는 언어, 희롱, 차별 및 위협 분류기는 검색 가능한 텍스트로만 작동하며 이러한 영역의 전체 또는 전체 용어 또는 언어 목록은 아니며 이에 유의하세요. 또한 언어 및 문화 표준은 지속적으로 변경되고 이러한 현실에 비관하여 Microsoft는 재량에 따라 분류자 업데이트할 수 있는 권리가 있습니다. 분류자 조직에서 이러한 영역을 검색하는 데 도움이 될 수 있는 반면 분류기는 이러한 언어의 사용을 검색하거나 해결할 수 있는 유일한 수단을 조직에 제공하기 위한 것이 아니며, Microsoft 또는 해당 자회사가 아닌 조직은 사전 학습된 분류자에 의해 식별된 콘텐츠의 모니터링, 검사, 차단, 제거 및 보존과 관련된 모든 결정(로컬 개인 정보 및 기타 관련 법률 준수 포함)에 대한 책임을 져야 합니다. Microsoft는 배포 및 사용 전에 법률 자문가와 상의하는 것이 좋습니다.

사전 학습된 분류자들은 다음 언어로 콘텐츠를 검색할 수 있습니다.

• 중국어(간체) • 영어 • 프랑스어 • 독일어 • 이탈리아어 • 일본어 • 포르투갈어 • 스페인어

사용자 지정 분류자

사전 학습된 분류자들이 요구 사항을 충족하지 않는 경우 자체 분류자들을 만들고 교육할 수 있습니다. 자체 만들기와 관련된 작업의 수가 훨씬 많지만 조직 요구에 훨씬 더 잘 맞게 조정됩니다.

예를 들어 다음에 대해 학습 가능한 분류기를 만들 수 있습니다.

  • 법률 문서 - 변호사 클라이언트 권한, 닫는 집합, 작업 설명 등의
  • 전략적 비즈니스 문서 - 보도 자료, 합병 및 인수, 거래, 비즈니스 또는 마케팅 계획, 지적 재산권, 특허, 디자인 문서
  • 가격 정보 - 송장, 가격 견적, 작업 주문, 구매 문서 등
  • 재무 정보 - 조직 투자, 분기별 또는 연간 결과 등

사용자 지정 분류자 만들기 프로세스 흐름

보존 정책 및 통신 감독과 같은 규정 준수 솔루션에서 사용할 분류자 만들기 및 게시는 이 흐름을 따르게 됩니다. 학습 가능한 사용자 지정 분류자 만들기에 대한 자세한 내용은 사용자 지정 분류자 만들기를 참조합니다.

프로세스 흐름 사용자 지정 분류자입니다.

분류자 재시도

수행한 분류의 정확성에 대한 피드백을 제공하여 모든 사용자 지정 분류자 및 사전 학습된 분류자의 정확도를 향상시킬 수 있습니다. 이를 재조정이라고 하여 이 워크플로를 따르는 것입니다.

분류자 재조정 워크플로.

참고 항목