다음을 통해 공유


Microsoft Purview eDiscovery 컬렉션 통계 및 보고서(프리미엄)

컬렉션 추정치를 만든 후 검색 조건과 일치하는 항목이 가장 많은 콘텐츠 위치 및 검색 쿼리에서 반환된 항목 수와 같이 검색된 항목에 대한 통계를 볼 수 있습니다. 결과의 하위 집합을 미리 볼 수도 있습니다.

추가로 검사할 문서 집합을 식별한 경우 검색 결과를 검토 집합에 추가하여 수집하고 처리할 수 있습니다.

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 규정 준수 포털 평가판 허브에서 지금 시작하세요. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

컬렉션 예측에 대한 통계 검색

이 섹션에서는 컬렉션 예측에 사용할 수 있는 통계에 대해 설명합니다. 이러한 통계는 컬렉션 예상의 플라이아웃 페이지에 있는 통계 검색 탭에서 사용할 수 있습니다.

컬렉션 추정치

이 섹션에서는 컬렉션에서 반환된 예상 항목에 대한 그래픽 요약을 표시합니다. 컬렉션의 검색 조건과 일치하는 항목 수를 나타냅니다. 이 정보는 컬렉션에서 반환된 예상 항목 수에 대한 아이디어를 제공합니다.

  • 위치별 예상 항목: 컬렉션에서 반환된 예상 항목의 총 수입니다. 사서함과 사이트에 있는 특정 항목 수도 표시됩니다.
  • 적중이 있는 예상 위치: 컬렉션에서 반환한 항목을 포함하는 콘텐츠 위치의 총 수입니다. 특정 수의 사서함 및 사이트 위치도 표시됩니다.
  • 위치별 데이터 볼륨(MB) : 컬렉션에서 반환된 모든 예상 항목의 총 크기입니다. 사서함 항목 및 사이트 항목의 특정 크기도 표시됩니다.

컬렉션 추정에 대한 컬렉션 추정 섹션입니다.

상태 보고서

이 섹션에서는 컬렉션 검색 쿼리에 대한 통계와 검색 쿼리의 다른 부분과 일치하는 예상 항목 수를 표시합니다. 이러한 통계를 사용하여 검색 쿼리의 각 구성 요소와 일치하는 항목 수를 분석할 수 있습니다. 이렇게 하면 컬렉션에 대한 검색 조건을 구체화하고 필요한 경우 컬렉션의 scope 좁힐 수 있습니다.

  • 위치 유형: 쿼리 통계가 적용할 수 있는 콘텐츠 위치의 형식입니다. Exchange 값은 사서함 위치를 나타냅니다. SharePoint 값은 사이트 위치를 나타냅니다.
  • 파트: 통계를 적용할 수 있는 검색 쿼리의 일부입니다. 기본은 전체 검색 쿼리를 나타냅니다. 키워드는 행의 통계가 특정 키워드에 대한 것임을 나타냅니다. 컬렉션의 검색 쿼리에 대해 키워드(keyword) 목록을 사용하는 경우 쿼리의 각 구성 요소에 대한 통계가 이 테이블에 포함됩니다.
  • 조건: 해당 행에 표시된 통계를 반환한 컬렉션 추정치에 대해 실행된 검색 쿼리의 실제 구성 요소(키워드(keyword) 또는 조건)입니다.
  • 적중 위치: 조건 열에 나열된 기본 또는 키워드(keyword) 쿼리와 일치하는 항목을 포함하는 콘텐츠 위치(위치 유형 열로 지정됨)의 수입니다.
  • 항목: 조건 열에 나열된 쿼리와 일치하는 항목(지정된 콘텐츠 위치의 항목 수)입니다. 앞서 설명한 것처럼 항목에 검색 중인 키워드(keyword) 여러 인스턴스가 포함된 경우 이 열에서 한 번만 계산됩니다.
  • 크기(MB): 조건 열의 검색 쿼리와 일치하는 모든 항목(지정된 콘텐츠 위치)의 총 크기입니다.

컬렉션 예상에 대한 조건 보고서 섹션입니다.

상위 위치

이 섹션에서는 컬렉션에서 반환된 항목이 가장 많은 특정 콘텐츠 위치에 대한 통계를 표시합니다.

  • 위치: 위치의 이름(사서함의 전자 메일 주소 및 사이트의 URL)입니다.
  • 위치 유형: 사서함에는 Exchange 유형이 있고 SharePoint 사이트에는 SharePoint 유형이 있습니다.
  • 항목: 컬렉션에서 반환된 콘텐츠 위치의 예상 항목 수입니다.
  • 크기: 각 콘텐츠 위치에 있는 예상 항목의 총 크기입니다.

컬렉션 예상에 대한 상위 위치 섹션입니다.

커밋된 컬렉션에 대한 통계 및 보고서

이 섹션에서는 검토 집합에 추가된 실제 항목 수를 포함하여 컬렉션을 검토 집합에 커밋한 후 사용할 수 있는 통계에 대해 설명합니다. 이러한 통계(로드 집합 정보 외에도)는 사례에 추가된 콘텐츠에 대한 기록 정보를 제공합니다.

컬렉션을 검토 집합에 커밋하면 커밋된 연결의 플라이아웃 페이지에 다음 탭이 표시됩니다. 이러한 각 탭에는 컬렉션에 대한 다양한 유형의 정보가 포함되어 있습니다.

커밋된 컬렉션의 플라이아웃 페이지에 있는 탭입니다.

컬렉션에 대한 요약 탭

커밋된 컬렉션 에 대한 요약 탭에는 컬렉션 항목, 항목 예측 및 위치, 인덱싱, 파일 형식 등에 대한 정보를 제공하는 여러 섹션이 포함되어 있습니다.

컬렉션 개요(미리 보기)

커밋된 검토 집합의 요약 탭에 있는 컬렉션 개요 섹션에는 항목이 컬렉션의 일부로 발견, 검색 및 처리되는 방법에 대한 정보가 포함되어 있습니다. 이 섹션의 정보는 초기 컬렉션 예상 기간 동안 수집 및 표시되는 정보의 요약이며, 검토 집합에 커밋된 컬렉션 중에 수집 및 처리된 정보를 포함합니다. 이 섹션의 정보를 사용하여 컬렉션 커밋 및 처리 중에 최종 수집 데이터가 예측 데이터에서 어떻게 진화하는지에 대한 이해를 향상시킬 수 있습니다.

이 정보는 분할되어 다음 하위 섹션에 표시됩니다.

  • 적중 위치: 이 섹션에서는 검색된 위치 수와 컬렉션 추정치에 정의된 조건에 따라 적중이 있는 위치 수를 요약합니다. 검색된 위치의 수와 유형도 표시합니다.

    적중이 있는 위치입니다.

  • 사전 컬렉션 추정: 이 섹션에서는 컬렉션이 커밋되기 전에 컬렉션 예상에 대해 계산된 총 항목의 수와 크기를 요약합니다. 부분적으로 인덱싱된 모든 항목의 수도 표시됩니다.

    사전 수집 예상값입니다.

  • 컬렉션 항목: 이 섹션에서는 컬렉션 커밋 중에 적중이 있는 위치에서 검색된 모든 항목의 유형, 개수 및 설명을 검토 집합에 표시합니다. 이 프로세스 중에는 처리 중에 항목이 일부 추가 및 통합될 수 있습니다. 추가 및 통합에는 다음 표에 포함된 형식이 포함될 수 있습니다.

    항목 종류 항목 유형 설명
    적중 항목 검색에서 찾은 예상 항목 수입니다.
    중복 집합 검토 동일한 검토 집합에 이미 있는 항목은 수집되지 않습니다.
    중복 항목 검색 동일한 항목의 중복 인스턴스는 수집되지 않습니다.
    모든 버전 SharePoint의 모든 버전의 항목이 수집됩니다.
    기록 버전 SharePoint에서 유지 관리되는 기록 버전이 수집됩니다.
    클라우드 첨부 파일 클라우드 첨부 파일은 SharePoint 링크에서 식별되고 수집됩니다.
    공유 버전 공유 버전의 항목은 최신 버전 외에도 수집됩니다.
    상황별 Teams 대화 관련될 수 있는 추가 채팅 메시지가 수집됩니다.
    통합 채팅 대화 내용 수집된 채팅 메시지는 더 적은 수의 HTML 대본으로 통합됩니다.
    검색 예외 액세스 시간 제한, 빈 파일 및 기타 예외.
    수집된 총 항목 다양한 위치에서 수집된 총 항목 수입니다.
  • 검토 집합 처리: 이 섹션에서는 컬렉션 예상에서 검토 집합에 추가된 항목의 유형, 개수 및 설명을 표시합니다. 항목은 압축을 풀고, 텍스트를 검색하고, 다시 인덱싱하고, 검토를 준비하기 위해 처리됩니다.

    검토 집합 처리.

컬렉션 콘텐츠

커밋된 검토 집합의 요약 탭에 있는 컬렉션 콘텐츠 섹션에는 컬렉션의 데이터 원본에서 수집되어 검토 집합에 추가된 항목에 대한 통계 및 기타 정보가 포함되어 있습니다.

  • 추출된 총 항목입니다. 검토 집합에 추가된 총 항목 수입니다. 이 숫자는 검토 집합에 추가된 부모 항목 및 자식 항목의 합계를 나타냅니다.

    부모 또는 자식 항목 막대 위로 커서를 가져가서 부모 또는 자식 항목의 총 수를 표시합니다.

  • 부모 항목입니다. 검토 집합에 추가된 항목을 수집하는 데 사용된 컬렉션에서 반환된 항목 수입니다. 이 숫자는 컬렉션 매개 변수 섹션에 표시되는 예상 항목 수에 해당하며 과 같습니다. 검토 집합에 추가된 항목을 수집하는 데 사용된 정보를 수집하는 부모 항목의 수입니다.

    부모 항목에는 여러 자식 항목이 포함될 수 있습니다. 예를 들어 첨부된 파일이 있거나 클라우드 첨부 파일이 있는 경우 전자 메일 메시지는 부모 항목입니다. 이 경우 연결된 파일 또는 클라우드 첨부 파일의 대상 파일은 자식 항목으로 간주됩니다. 컬렉션을 커밋하면 부모 항목 및 해당 자식 항목(예: 첨부된 파일 및 클라우드 첨부 파일)이 검토 집합에 개별 항목 또는 파일로 추가됩니다.

  • 자식 항목입니다. 검토 집합에 추가된 자식 항목 수입니다. 파일 첨부 파일 및 클라우드 첨부 파일인 자식 항목만 검토 집합에 개별 파일로 추가됩니다. 전자 메일 서명 및 이미지와 같은 다른 유형의 자식 항목은 부모 항목에서 추출된 다음 OCR(광학 문자 인식)에 의해 처리되어 자식 항목에서 텍스트를 추출합니다. 이러한 유형의 자식 항목에서 추출된 텍스트는 검토 집합에서 볼 수 있도록 부모 항목에 추가됩니다. 검토 집합에 자식 항목을 별도의 파일로 추가하지 않음으로써 eDiscovery(프리미엄)는 검토 집합에서 잠재적으로 비물질적인 항목 수를 제한하여 검토 프로세스를 간소화하는 데 도움이 됩니다.

  • 고유 항목입니다. 검토 집합에 추가된 고유 항목 수입니다. 고유한 항목은 검토 집합에 고유합니다. 검토 집합에 이전 항목이 없었기 때문에 첫 번째 컬렉션이 새 검토 집합에 추가되면 모든 항목이 고유합니다.

  • 중복 항목이 식별되었습니다. 검토 집합에 동일한 항목이 이미 있으므로 검토 집합에 추가되지 않은 컬렉션의 항목 수입니다. 중복 항목에 대한 통계는 컬렉션 예상 항목의 예상 항목 수와 검토 집합에 추가된 실제 항목 수 간의 차이점을 설명하는 데 도움이 될 수 있습니다.

인덱싱

커밋된 검토 집합의 요약 탭에 있는 인덱싱 섹션에는 검토 집합에 추가된 항목에 대한 인덱싱 정보가 포함되어 있습니다.

  • 새 인덱싱된 항목입니다. 검토 집합에 추가되기 전에 새로 인덱싱된 항목의 수입니다. 새로 인덱싱된 항목의 예로는 부모 항목에서 추출한 다음 검토 집합에 추가되기 전에 인덱싱된 자식 항목이 있습니다. 또한 이 경우 데이터 원본 탭에 나열된 보관 데이터 원본 및 비보관 콘텐츠 위치에 없는 항목은 검토에 추가되기 전에 인덱싱됩니다. 예를 들어 새로 인덱싱된 항목에는 추가 위치에서 수집된 항목이 포함됩니다.

  • 인덱싱된 항목이 업데이트되었습니다. 성공적으로 인덱싱되어 검토 집합에 추가된 부분적으로 인덱싱된 항목의 수입니다. 이 통계는 컬렉션이 검토 집합에 커밋되었을 때 성공적으로 인덱싱된 데이터 원본 탭의 부분적으로 인덱싱된 항목 및 비보관 콘텐츠 위치를 나타냅니다.

  • 인덱싱 오류. 검토 집합에 추가되기 전에 인덱싱할 수 없는 부분적으로 인덱싱된 항목의 수입니다. 이러한 항목에는 오류 수정이 필요할 수 있습니다.

컬렉션 파일 형식

커밋된 검토 집합의 요약 탭에 있는 컬렉션 파일 형식 섹션에는 컬렉션에 포함된 각 파일 형식의 항목 수가 표시됩니다. 파일 형식에는 이메일, 이미지, 문서, 오디오, 비디오 파일 형식 등이 포함됩니다. 지원되는 파일 형식의 전체 목록은 eDiscovery에서 지원되는 파일 형식(프리미엄)을 참조하세요.

오류

커밋된 검토 집합의 요약 탭에 있는 오류 섹션에는 컬렉션 커밋 중에 발생한 오류의 유형과 수가 표시됩니다. 오류에는 크기가 0인 파일, 보호된 파일, 형식이 잘못된 파일, 내부 오류 등이 포함될 수 있습니다. 이 섹션에서 오류 보고서 다운로드를 선택하여 .csv 형식의 오류 보고서를 다운로드할 수 있습니다 .

컬렉션 매개 변수

커밋된 검토 집합의 요약 탭에 있는 컬렉션 매개 변수 섹션에는 검토 집합에 추가된 항목을 수집하는 데 사용된 컬렉션 정보가 표시됩니다. 이 탭에는 통계 검색 탭의 정보와 유사한 정보가 표시됩니다. 이 섹션에서는 컬렉션에서 사용하는 검색 쿼리, 검색된 콘텐츠 위치 및 예상 컬렉션 결과의 빠른 스냅샷을 제공합니다. 앞에서 설명한 것처럼 이 섹션의 예상 항목 수는 컬렉션 내용 섹션에 표시된 부모 항목 수와 같습니다.

컬렉션에 대한 데이터 원본 탭

데이터 원본 탭에는 양육권 및 비보안 데이터 원본에 대한 정보가 포함되어 있습니다. 보관 데이터 원본 섹션에는 컬렉션에 포함된 각 보유자에 대한 모든 양육권 데이터 원본이 표시됩니다. 비보관 데이터 원본 섹션에는 컬렉션에 대한 모든 비보장 데이터 원본이 표시됩니다. 표시되는 데이터 원본 정보는 각 사례에 대한 기본 데이터 원본 탭에서도 사용할 수 있습니다.

컬렉션에 대한 통계 검색 탭

검색 통계 탭에 표시되는 통계는 컬렉션 추정치가 마지막으로 실행된 시점과 동일한 통계입니다. 여기에는 컬렉션 예상, 조건 보고서 및 상위 위치가 포함됩니다. 이 정보는 기록 참조에 대한 컬렉션 추정치에서 유지되며 검토 집합에 커밋된 실제 컬렉션과 비교할 수 있습니다.

컬렉션 예상과 실제 커밋된 컬렉션 간의 차이점

컬렉션 예상을 실행하면 컬렉션 조건을 충족하는 항목 수(및 총 크기)의 추정치가 요약 탭 및 검색 통계 탭의 컬렉션 추정 섹션에 표시됩니다. 컬렉션 예상을 검토 집합에 커밋한 후 검토 집합에 추가된 실제 항목 수(및 총 크기)는 예상과 다른 경우가 많습니다. 대부분의 경우 컬렉션 예상보다 더 많은 항목이 검토 집합에 추가됩니다. 다음 목록에서는 이러한 차이점에 대한 가장 일반적인 이유와 이러한 차이점을 식별하기 위한 팁을 설명합니다.

  • 자식 항목입니다. 부모 항목에서 추출되어 개별 파일로 추가되는 자식 항목(예: 파일 첨부 파일 및 클라우드 첨부 파일)입니다. 자식 항목의 수는 검토 집합에 추가되는 항목 수를 늘릴 수 있습니다. 일반적으로 커밋된 컬렉션의 요약 탭에 있는 컬렉션 내용 섹션에서 식별되는 부모 항목의 수는 컬렉션 예상의 예상 항목 수와 같아야 합니다.

  • 중복 항목입니다. 이전 컬렉션의 검토 집합에 이미 추가된 컬렉션 예상 항목은 추가되지 않습니다. 앞에서 설명한 것처럼 컬렉션의 중복 항목 수는 요약 탭의 컬렉션 내용 섹션에 표시됩니다.

  • 컬렉션 구성 옵션입니다. 컬렉션 추정치를 검토 집합에 커밋하는 경우 대화 스레드, 클라우드 첨부 파일 및 문서 버전을 포함하도록 선택해야 합니다. 검토 집합에 추가된 이러한 항목은 컬렉션 예상치에 포함되지 않습니다. 컬렉션을 커밋할 때만 식별되고 수집됩니다. 이러한 옵션을 선택하면 검토 집합에 추가된 항목 수가 증가할 가능성이 높습니다.

    예를 들어 여러 버전의 SharePoint 문서는 컬렉션 예상값에 포함되지 않습니다. 그러나 컬렉션 예상을 커밋할 때 모든 문서 버전을 포함하는 옵션을 선택하면 검토 집합에 추가된 항목의 실제 수(및 총 크기)가 증가합니다.

    이러한 옵션에 대한 자세한 내용은 검토 집합에 컬렉션 예상 커밋을 참조하세요.

컬렉션 추정의 예상 결과가 실제 커밋된 결과와 다를 수 있는 다른 이유는 다음과 같습니다.

  • 수집 예상 결과에 대한 결과가 예측되는 방식입니다. 컬렉션 추정값에 의해 반환되는 검색 결과의 추정치는 컬렉션 쿼리 조건을 충족하는 항목의 추정값(실제 개수가 아님)입니다. 전자 메일 항목의 예상값을 컴파일하려면 Exchange 데이터베이스에서 검색 조건을 충족하는 메시지 ID 목록을 요청합니다. 그러나 컬렉션을 검토 집합에 커밋하면 컬렉션이 다시 실행되고 실제 메시지가 Exchange 데이터베이스에서 검색됩니다. 따라서 예상된 항목 수와 실제 항목 수를 결정하는 방법 때문에 차이가 발생할 수 있습니다.

  • 컬렉션 예상을 예측하고 커밋하는 시간 사이에 발생하는 변경 내용입니다. 컬렉션 추정치를 검토 집합에 커밋하면 검색 조건을 충족하는 검색 인덱스에서 가장 최근 항목을 수집하기 위해 검색이 다시 실행됩니다. 컬렉션 추정치가 마지막으로 실행된 시점과 컬렉션 예상이 검토 집합에 커밋된 시점 사이의 시간에 검색 조건을 충족하는 추가 항목이 생성, 전송 또는 삭제되었을 수 있습니다. 또한 컬렉션 예상 결과가 예상되었을 때 검색 인덱스의 항목이 더 이상 수집을 커밋하기 전에 데이터 원본에서 제거되었기 때문에 더 이상 없을 수 있습니다. 이 문제를 완화하는 한 가지 방법은 컬렉션의 날짜 범위를 지정하는 것입니다. 또 다른 방법은 항목을 보존하고 제거할 수 없도록 콘텐츠 위치를 보류하는 것입니다.

  • 인덱스되지 않은 항목입니다. 컬렉션 추정치에 모든 Exchange 사서함 또는 모든 SharePoint 사이트 검색이 포함된 경우 컬렉션 조건과 일치하는 항목이 포함된 콘텐츠 위치의 인덱스되지 않은 항목만 검토 집합에 추가됩니다. 즉, 사서함 또는 사이트에 결과가 없는 경우 해당 사서함 또는 사이트의 인덱스되지 않은 항목은 검토 집합에 추가되지 않습니다. 그러나 모든 콘텐츠 위치의 인덱스되지 않은 항목(컬렉션 쿼리와 일치하는 항목이 포함되지 않은 항목도 포함)은 예상 컬렉션 결과에 포함됩니다.

  • 부분적으로 인덱싱된 항목: 이 옵션을 선택하면 추가 데이터 원본의 부분적으로 인덱싱된 항목이 검토 집합에 추가됩니다. 컬렉션이 추가 데이터 원본을 검색한 경우(컬렉션 마법사의 추가 위치 페이지에 지정된 대로) 검토 집합에 추가하려는 이러한 위치에서 부분적으로 인덱싱된 항목이 있을 수 있습니다. 양육권 및 비보관 데이터 원본에는 일반적으로 부분적으로 인덱싱된 항목이 없습니다. 고급 인덱싱 프로세스는 보관 및 비보관 데이터 원본이 사례에 추가되면 항목을 다시 인덱싱하기 때문입니다. 또한 부분적으로 인덱싱된 항목을 추가하면 검토 집합에 추가된 항목 수가 증가합니다.

    부분적으로 인덱싱된 항목이 검토 집합에 추가되면 필터를 적용하여 이러한 항목을 구체적으로 볼 수 있습니다. 자세한 내용은 시나리오 예제: 부분적으로 인덱싱된 항목 필터링을 참조하세요.

    또는 컬렉션 예상에 특정 콘텐츠 위치(즉, 컬렉션 예상 마법사의 추가 위치 페이지에 지정된 특정 사서함 또는 사이트)가 포함된 경우 검색에 지정된 콘텐츠 위치에서 인덱스되지 않은 항목(컬렉션 조건에 의해 제외되지 않음)이 내보내집니다. 이 경우 검토 집합에 추가되는 인덱스되지 않은 항목의 예상 수와 인덱스되지 않은 항목의 수는 동일해야 합니다.