예측 코딩 모델 만들기(미리 보기)
eDiscovery(프리미엄)에서 예측 코딩의 기계 학습 기능을 사용하는 첫 번째 단계는 예측 코딩 모델을 만드는 것입니다. 모델을 만든 후 검토 집합에서 관련 콘텐츠와 관련이 없는 콘텐츠를 식별하도록 학습할 수 있습니다.
예측 코딩 워크플로를 검토하려면 eDiscovery의 예측 코딩에 대한 자세한 정보(프리미엄)를 참조하세요.
모델을 만들기 전에
예측 코딩 모델을 만들려면 검토 집합에 최소 2,000개의 항목이 있어야 합니다.
모델을 만들기 전에 모든 컬렉션을 검토 집합에 커밋해야 합니다. 모델을 만든 후 검토 집합에 추가된 항목은 처리되지 않으며 모델에 의해 생성된 예측 점수가 할당됩니다.
텍스트가 포함되지 않은 검토 집합의 모든 항목은 모델에서 처리되거나 예측 점수가 할당되지 않습니다. 텍스트가 있는 항목은 컨트롤 집합 또는 학습 집합에 포함됩니다.
모델 만들기
Microsoft Purview 규정 준수 포털 eDiscovery(프리미엄) 사례를 열고 [검토 집합] 탭을 선택합니다.
검토 집합을 연 다음 분석 > 예측 코딩 관리(미리 보기) 를 클릭합니다.

예측 코딩 모델(미리 보기) 페이지에서 새 모델을 클릭합니다.
플라이아웃 페이지에서 모델의 이름과 설명(선택 사항)을 입력합니다.
필요에 따라 신뢰도 및 오차 범위와 관련된 고급 설정을 구성할 수 있습니다(플라이아웃 페이지에서 고급 옵션을 클릭하여). 이러한 설정은 컨트롤 집합에 포함된 항목 수에 영향을 미칩니다. 컨트롤 집합 은 학습 프로세스 중에 모델에서 학습 라운드 중에 수행하는 레이블이 지정된 항목에 할당하는 예측 점수를 평가하는 데 사용됩니다. 조직에 문서 검토에 대한 신뢰도 수준 및 오차 범위 관련 지침이 있는 경우 적절한 상자에 지정합니다. 그렇지 않으면 기본 설정을 사용합니다.
저장 을 클릭하여 모델을 만듭니다.
시스템에서 모델을 준비하는 데 몇 분 정도 걸립니다. 준비가 되면 첫 번째 학습을 수행할 수 있습니다.
모델을 만든 후 수행되는 작업
모델을 만든 후 모델을 만들고 준비하는 동안 백그라운드에서 다음과 같은 작업이 수행됩니다.
시스템은 컨트롤 집합의 항목 수를 계산합니다. 이 크기는 검토 집합의 항목 수와 신뢰 수준 및 오차 범위의 설정을 기반으로 합니다. 컨트롤 집합에 대한 항목은 임의로 선택되고 컨트롤 집합 항목으로 지정됩니다. 시스템에는 첫 번째 학습 라운드에 설정된 컨트롤의 10개 항목이 포함됩니다.
시스템은 검토 집합에서 40개의 항목을 임의로 선택하여 첫 번째 학습 라운드에 대한 학습 집합에 포함됩니다. 따라서 첫 번째 학습 라운드에는 레이블 지정을 위한 항목 50개(학습 집합의 항목 40개 및 컨트롤 집합의 항목 10개)가 포함됩니다.
다음 단계
검토 집합에 대한 모델을 만든 후 다음 단계는 조사와 관련된 콘텐츠를 식별하기 위해 모델을 "학습"하는 학습 라운드를 수행하는 것입니다. 자세한 내용은 예측 코딩 모델 학습을 참조하세요.