학습 가능한 분류자 시작
Microsoft 365 학습 가능한 분류자는 살펴볼 샘플을 제공하여 다양한 유형의 콘텐츠를 인식하도록 학습할 수 있는 도구입니다. 학습되면 이를 사용하여 Office 민감도 레이블, 통신 규정 준수 정책 및 보존 레이블 정책의 적용 항목을 식별할 수 있습니다.
사용자 지정 학습 가능한 분류자를 만드는 데는 먼저 사람이 선택하고 범주와 긍정적으로 일치하는 샘플을 제공하는 것이 포함됩니다. 그런 다음 이러한 샘플을 처리한 후 양성 및 음수 샘플을 혼합하여 예측하는 분류자 기능을 테스트합니다. 이 문서에서는 사용자 지정 분류자를 만들고 학습시키는 방법과 재학습을 통해 수명 동안 사용자 지정 학습 가능한 분류자 및 미리 학습된 분류자의 성능을 향상시키는 방법을 보여 줍니다.
다양한 분류자 유형에 대한 자세한 내용은 학습 가능한 분류자 알아보기를 참조하세요.
학습 가능한 분류자를 만드는 방법에 대한 간략한 요약은 이 비디오를 시청하세요. 세부 정보를 얻으려면 이 전체 문서를 계속 읽어야 합니다.
필수 구성 요소
라이선스 요구사항
분류자는 Microsoft 365 E5 또는 E5 준수 기능입니다. 이러한 구독을 사용하려면 이러한 구독 중 하나가 있어야 합니다.
사용 권한
UI에서 분류자를 액세스하려면 다음을 수행합니다.
- 전역 관리자는 테넌트가 사용자 지정 분류자를 만들도록 옵트인해야 합니다.
- 분류자를 학습하려면 규정 준수 관리자 역할이 필요합니다.
이러한 시나리오에서 분류자를 사용하려면 이러한 권한이 있는 계정이 필요합니다.
- 보존 레이블 정책 시나리오: 레코드 관리 및 보존 관리 역할
- 민감도 레이블 정책 시나리오: 보안 관리자, 규정 준수 관리자, 규정 준수 데이터 관리자
- 통신 준수 정책 시나리오: 참가자 위험 관리 관리, 감독 검토 관리자
중요
기본적으로 사용자 지정 분류자를 만드는 사용자만 해당 분류자가 수행한 예측을 학습하고 검토할 수 있습니다.
사용자 지정 학습 가능한 분류자 준비
자세히 살펴보기 전에 사용자 지정 학습 가능한 분류자를 만드는 데 무엇이 관련되어 있는지 이해하는 것이 유용합니다.
시간 표시 막대
이 타임라인은 학습 가능한 분류자의 샘플 배포를 반영합니다.

팁
학습 가능한 분류자의 경우 옵트인(opt-in)이 처음 필요합니다. Microsoft 365에서 조직 콘텐츠의 기준 평가를 완료하는 데 12일이 걸립니다. 옵트인 프로세스를 시작하려면 전역 관리자에게 문의하세요.
전체 워크플로
사용자 지정 학습 가능한 분류자를 만드는 전체 워크플로에 대해 자세히 알아보려면 사용자 지정 학습 가능한 분류자를 만들기 위한 프로세스 흐름을 참조하세요.
초기값 콘텐츠
학습 가능한 분류자를 사용하여 특정 콘텐츠 범주에 속하는 항목을 독립적이고 정확하게 식별하려면 먼저 범주에 있는 콘텐츠 형식의 많은 샘플을 제시해야 합니다. 학습 가능한 분류자로 샘플을 공급하는 것을 시드 라고 합니다. 시드 콘텐츠는 사람이 선택하고 콘텐츠 범주를 나타내는 것으로 판단됩니다.
팁
50개 이상의 양의 샘플과 500개 이상의 샘플이 있어야 합니다. 학습 가능한 분류자는 가장 최근에 만든 샘플 500개까지 처리합니다(파일 생성 날짜/타임스탬프 기준). 더 많은 샘플을 제공할수록 분류자의 예측이 더 정확해집니다.
콘텐츠 테스트
학습 가능한 분류자는 예측 모델을 빌드하기에 충분한 양의 샘플을 처리한 후에는 분류자에서 범주와 일치하는 항목과 그렇지 않은 항목을 올바르게 구분할 수 있는지 확인하기 위해 예측을 테스트해야 합니다. 범주에 속해야 하는 샘플과 그렇지 않은 샘플로 구성된 다른 더 큰 사람이 선택한 콘텐츠 집합을 선택하여 이 작업을 수행합니다. 처음 제공한 초기 시드 데이터와 다른 데이터로 테스트해야 합니다. 이러한 예측을 처리한 후에는 수동으로 결과를 살펴보고 각 예측이 올바른지, 올바르지 않은지 또는 확실하지 않은지 확인합니다. 학습 가능한 분류자는 이 피드백을 사용하여 예측 모델을 개선합니다.
팁
최상의 결과를 위해 양수 및 음수 일치의 균등 분포를 사용하여 테스트 샘플 집합에 200개 이상의 항목이 있습니다.
학습 가능한 분류자를 만드는 방법
50~500개 시드 콘텐츠 항목을 수집합니다. 학습 가능한 분류자에서 분류 범주에 속하는 것으로 긍정적으로 식별할 콘텐츠 형식을 강력하게 나타내는 샘플이어야 합니다. 지원되는 파일 형식은 SharePoint Server의 기본 크롤링 파일 이름 확장명 및 구문 분석된 파일 형식을 참조하세요.
중요
시드 집합의 항목이 범주의 강력한 예인지 확인합니다. 학습 가능한 분류자는 처음에 시드한 항목에 따라 모델을 빌드합니다. 분류자는 모든 시드 샘플이 강한 긍정이며 샘플이 범주와 약하거나 음수인지 알 방법이 없다고 가정합니다.
시드 콘텐츠만 보관하는 전용 SharePoint Online 폴더 에 시드 콘텐츠를 배치합니다. 사이트, 라이브러리 및 폴더 URL을 기록해 둡다.
팁
시드 데이터에 대한 새 사이트 및 폴더를 만드는 경우 해당 시드 데이터를 사용할 학습 가능한 분류자를 만들기 전에 해당 위치의 인덱싱을 1시간 이상 허용합니다.
규정 준수 관리자 또는 보안 관리자 역할 액세스를 사용하여 Microsoft Purview 규정 준수 포털 로그인하고 Microsoft Purview 규정 준수 포털 또는 Microsoft 365 Defender 포털 > 데이터 분류 를 엽니다.
학습 가능한 분류자 탭을 선택합니다.
학습 가능한 분류자 만들기 를 선택합니다.
이 학습 가능한 분류자를 식별할 항목 범주의 필드와
Description적절한 값을Name입력합니다.2단계에서 시드 콘텐츠 사이트의 SharePoint Online 사이트, 라이브러리 및 폴더 URL을 선택합니다. 를 선택합니다
Add.설정을 검토하고 선택합니다
Create trainable classifier.학습 가능한 분류자는 24시간 이내에 시드 데이터를 처리하고 예측 모델을 빌드합니다. 분류자 상태는
In progress시드 데이터를 처리하는 동안입니다. 분류자에서 시드 데이터 처리를 마치면 상태가 .로 변경됩니다Need test items.이제 분류자를 선택하여 세부 정보 페이지를 볼 수 있습니다.

최상의 결과를 위해 200개 이상의 테스트 콘텐츠 항목(최대 10,000개)을 수집합니다. 이들은 강한 긍정적 인 항목의 혼합이어야한다, 강한 부정과 자신의 성격에 조금 덜 명백한 일부. 지원되는 파일 형식은 SharePoint Server의 기본 크롤링 파일 이름 확장명 및 구문 분석된 파일 형식을 참조하세요.
테스트 콘텐츠만 보관하는 전용 SharePoint Online 폴더 에 테스트 콘텐츠를 배치합니다. SharePoint Online 사이트, 라이브러리 및 폴더 URL을 기록해 둡다.
팁
테스트 데이터에 대한 새 사이트 및 폴더를 만드는 경우 해당 시드 데이터를 사용할 학습 가능한 분류자를 만들기 전에 해당 위치의 인덱싱을 1시간 이상 허용합니다.
를 선택합니다
Add items to test.12단계에서 테스트 콘텐츠 사이트의 SharePoint Online 사이트, 라이브러리 및 폴더 URL을 선택합니다. 를 선택합니다
Add.를 선택하여 마법사를 완료합니다
Done. 학습 가능한 분류자는 테스트 파일을 처리하는 데 최대 1시간이 걸립니다.학습 가능한 분류자에서 테스트 파일 처리를 완료하면 세부 정보 페이지의 상태가 .로
Ready to review변경됩니다. 테스트 샘플 크기를 늘려야 하는 경우 학습 가능한 분류자가 추가 항목을 처리하도록 선택하고Add items to test허용합니다.
항목을 검토할 탭을 선택합니다
Tested items to review.Microsoft 365는 한 번에 30개 항목을 제공합니다. 검토한 후
We predict this item is "Relevant". Do you agree?상자에서 선택Yes하거나NoNot sure, skip to next item선택합니다. 모델 정확도는 30개 항목마다 자동으로 업데이트됩니다.
200개 이상의 항목을 검토합니다. 정확도 점수가 안정화되면 게시 옵션을 사용할 수 있게 되고 분류자 상태가 표시됩니다
Ready to use.
분류자를 게시합니다.
분류자가 게시되면 민감도 레이블이 있는 Office 자동 레이블 지정의 조건으로 사용할 수 있으며 조건 및 통신 준수에 따라 보존 레이블 정책을 자동으로 적용합니다.