eDiscovery에서 검색 및 분석 설정 구성(프리미엄)

각 Microsoft Purview eDiscovery(프리미엄) 사례에 대한 설정을 구성하여 다음 기능을 제어할 수 있습니다.

  • 근사 중복 및 전자 메일 스레드

  • 테마

  • 자동 재생 검토 설정 쿼리

  • 텍스트 무시

  • 광학 문자 인식

사례에 대한 검색 및 분석 설정을 구성

  1. eDiscovery(프리미엄) 페이지에서 케이스를 선택합니다.

  2. 검색 및 분석설정 탭에서 선택 을 클릭합니다.

    사례 설정 페이지가 표시됩니다. 이러한 설정은 사례의 모든 검토 집합에 적용됩니다.

    eDiscovery(프리미엄) 사례에 대한 분석 및 검색 설정을 구성합니다.

근사 중복 및 전자 메일 스레드

이 섹션에서는 중복 검색, 거의 중복 검색 및 이메일 스레딩에 대한 매개 변수를 설정할 수 있습니다. 자세한 내용은 거의 중복 검색전자 메일 스레딩을 참조하세요.

  • 거의 중복/전자 메일 스레딩: 이 기능을 켜면 중복 검색, 거의 중복 검색 및 전자 메일 스레딩이 검토 집합의 데이터에 대한 분석을 실행할 때 워크플로의 일부로 포함됩니다.

  • 문서 및 전자 메일 유사성 임계값: 두 문서의 유사성 수준이 임계값을 초과하는 경우 두 문서는 거의 동일한 중복 집합에 배치됩니다.

  • 최소/최대 단어 수: 이러한 설정은 최소 단어 수와 최대 단어 수가 있는 문서에서만 중복 및 전자 메일 스레딩 분석을 수행되도록 지정합니다.

테마

이 섹션에서는 테마에 대한 매개 변수를 설정할 수 있습니다. 자세한 내용은 테마를 참조 하세요.

  • 테마: 켜면 검토 집합의 데이터에 대한 분석을 실행할 때 테마 클러스터링이 워크플로의 일부로 수행됩니다.

  • 최대 테마 수: 검토 집합의 데이터에 대한 분석을 실행할 때 생성할 수 있는 최대 테마 수를 지정합니다.

  • 테마에 숫자를 포함합니다. 켜면 테마를 생성할 때 숫자(테마를 식별하는 숫자)가 포함됩니다.

  • 최대 테마 수를 동적으로 조정합니다 . 특정 상황에서는 검토 집합에 원하는 수의 테마를 생성하기에 충분한 문서가 없을 수 있습니다. 이 설정을 사용하도록 설정하면 eDiscovery(프리미엄)에서 최대 테마 수를 적용하려고 시도하지 않고 최대 테마 수를 동적으로 조정합니다.

쿼리 집합 검토

분석 후 자동으로 For Review 저장된 검색 만들기 확인란을 선택하면 eDiscovery(프리미엄)가 검토용으로 명명된 검토 집합 쿼리를 자동으로 생성합니다 .

For Review 자동 생성된 쿼리입니다.

이 쿼리는 기본적으로 검토 집합에서 중복 항목을 필터링합니다. 이렇게 하면 검토 집합의 고유한 항목을 검토할 수 있습니다. 이 쿼리는 사례에 있는 검토 집합에 대한 분석을 실행할 때만 만들어집니다. 검토 집합 쿼리에 대한 자세한 내용은 검토 집합의 데이터 쿼리를 참조하세요.

텍스트 무시

전자 메일의 내용에 관계없이 전자 메일 메시지에 추가되는 긴 고지 사항과 같이 특정 텍스트의 분석 품질이 저하되는 경우가 있습니다. 무시해야 하는 텍스트에 대해 알고 있는 경우, 텍스트 문자열과 텍스트에서 제외해야 하는 분석 기능(근사 중복, 전자 메일 스레드, 테마 및 관련성)을 지정하여 분석에서 제외할 수 있습니다. 정규식(RegEx)을 무시된 텍스트로 사용하는 것도 지원됩니다.

광학 문자 인식(OCR)

이 설정을 켜면 이미지 파일에서 OCR 처리가 실행됩니다. OCR 처리는 다음과 같은 경우에 실행됩니다.

  • 보유자 및 비보장 데이터 원본이 사례에 추가되는 경우 OCR이 이미지 파일에 적용되면 컬렉션 중에 해당 파일의 텍스트를 검색할 수 있습니다. OCR 처리는 고급 인덱싱 프로세스 중에 수행됩니다. OCR은 고급 인덱싱 중에 처리되는 항목에서만 실행됩니다. 예를 들어 고급 인덱싱 중에 부분적으로 인덱싱되었거나 다른 인덱싱 오류가 있는 대용량 PDF 파일이 처리되면 파일에도 OCR이 적용됩니다. 즉, OCR 처리는 고급 인덱싱 프로세스 중에 다시 인덱싱된 파일에서만 발생합니다. 즉, 관리자가 사례에 추가되지만 고급 인덱싱 중에 해당 파일이 처리되지 않으므로 일부 전자 메일 첨부 파일이 OCR에 대해 처리되지 않는 경우가 있을 수 있습니다.

  • 다른 데이터 원본의 콘텐츠(보유자와 연결되지 않고 비보관 데이터 원본의 사례에 추가됨)가 검토 집합에 추가되는 경우.

데이터가 검토 집합에 추가되면 이미지 텍스트를 검토, 검색, 태그 지정 및 분석할 수 있습니다. 검토 집합에서 선택한 이미지 파일의 텍스트 뷰어에서 추출된 텍스트를 볼 수 있습니다. 자세한 내용은 다음을 참조하세요.