검색 및 분석 설정 구성 Advanced eDiscoveryConfigure search and analytics settings in Advanced eDiscovery

각 사례에 대한 설정을 구성하여 Advanced eDiscovery 기능을 제어할 수 있습니다.You can configure settings for each Advanced eDiscovery case to control the following functionality.

  • 근사 중복 및 전자 메일 스레드Near duplicates and email threading

  • 테마Themes

  • 자동 재생 검토 설정 쿼리Autogenerated review set query

  • 텍스트 무시Ignore text

  • 광학 문자 인식Optical character recognition

사례에 대한 검색 및 분석 설정을 구성To configure search and analytics settings for a case:

  1. 고급 eDiscovery 페이지에서 사례를 선택합니다.On the Advanced eDiscovery page, select the case.

  2. 검색 및 분석설정 탭에서 선택 을 클릭합니다.On the Settings tab, under Search & analytics, click Select.

    사례 설정 페이지가 표시됩니다.The case settings page is displayed. 이러한 설정은 사례의 모든 검토 집합에 적용됩니다.These settings are applied to all review sets in a case.

    사례에 대한 분석 및 Advanced eDiscovery 구성

근사 중복 및 전자 메일 스레드Near duplicates and email threading

이 섹션에서는 중복 검색, 중복에 가까운 검색 및 전자 메일 스레딩에 대한 매개 변수를 설정할 수 있습니다.In this section, you can set parameters for duplicate detection, near duplicate detection, and email threading. 자세한 내용은 중복에 가까운 검색 및 전자 메일 스레딩을 참조하세요.For more information, see Near duplicate detection and Email threading.

  • 가까운 중복/전자 메일 스레딩: 이 기능을 설정하면 검토 집합의 데이터에 대한 분석을 실행할 때 중복 검색, 중복에 가까운 검색 및 전자 메일 스레딩이 워크플로의 일부로 포함됩니다.Near duplicates/email threading: When turned on, duplicate detection, near duplicate detection, and email threading are included as part of the workflow when you run analytics on the data in a review set.

  • 문서 및 전자 메일 유사성 임계값: 두 문서의 유사성 수준이 임계값을 초과하면 두 문서가 동일한 중복 집합에 저장됩니다.Document and email similarity threshold: If the similarity level for two documents is above the threshold, both documents are put in the same near duplicate set.

  • 최소/최대 단어 수: 이러한 설정은 최소한 최소한의 단어와 최대 단어 수가 있는 문서에서만 거의 중복 및 전자 메일 스레딩 분석을 수행하게 지정합니다.Minimum/maximum number of words: These settings specify that near duplicates and email threading analysis are performed only on documents that have at least the minimum number of words and at most the maximum number of words.

테마Themes

이 섹션에서는 테마에 대한 매개 변수를 설정할 수 있습니다.In this section, you can set parameters for themes. 자세한 내용은 테마를 참조하세요.For more information, see Themes.

  • 테마: 이 기능을 설정하면 검토 집합의 데이터에 대한 분석을 실행할 때 테마 클러스터링이 워크플로의 일부로 수행됩니다.Themes: When turned on, themes clustering is performed as part of the workflow when you run analytics on the data in a review set.

  • 최대 테마 수: 검토 집합의 데이터에 대한 분석을 실행할 때 생성될 수 있는 최대 테마 수를 지정합니다.Maximum number of themes: Specifies the maximum number of themes that can be generated when you run analytics on the data in a review set.

  • 테마에 숫자 포함: 켜져 있는 경우 테마를 생성하는 경우 테마를 식별하는 숫자가 포함됩니다.Include numbers in themes: When turned on, numbers (that identify a theme) are included when generating themes.

  • 최대 테마 수를 동적으로 조정합니다. 특정 상황에서는 검토 집합에 원하는 수의 테마를 생성하기에 충분한 문서가 없는 경우도 있습니다.Adjust maximum number of themes dynamically: In certain situations, there may not be enough documents in a review set to produce the desired number of themes. 이 설정을 사용하도록 설정하면 고급 eDiscovery에서 최대 테마 수를 적용하려고 시도하지 않고 최대 테마 수를 동적으로 조정합니다.When this setting is enabled, Advanced eDiscovery adjusts the maximum number of themes dynamically rather than attempting to enforce the maximum number of themes.

쿼리 집합 검토Review set query

분석 후 저장된 검토용 검색 자동 만들기 확인란을 선택하면 Advanced eDiscovery 검토용 집합 쿼리를 자동으로 생성합니다.If you select the Automatically create a For Review saved search after analytics checkbox, Advanced eDiscovery autogenerates review set query named For Review.

For Review autogenerated query

이 쿼리는 기본적으로 검토 집합에서 중복 항목을 검색합니다.This query basically filters out duplicate items from the review set. 이렇게 하면 검토 집합의 고유한 항목을 검토할 수 있습니다.This lets you review the unique items in the review set. 이 쿼리는 사례에 있는 검토 집합에 대한 분석을 실행할 때만 만들어집니다.This query is created only when you run analytics for a review set in the case. 검토 집합 쿼리에 대한 자세한 내용은 검토 집합의 데이터 쿼리를 참조하세요.For more information, about review set queries, see Query the data in a review set.

텍스트 무시Ignore text

전자 메일의 콘텐츠에 관계없이 전자 메일 메시지에 추가되는 긴 고지와 같이 특정 텍스트가 분석 품질을 하할 수 있는 상황이 있습니다.There are situations where certain text will diminish the quality of analytics, such as lengthy disclaimers that get added to email messages regardless of the content of the email. 무시해야 하는 텍스트에 대해 알고 있는 경우, 텍스트 문자열과 텍스트에서 제외해야 하는 분석 기능(근사 중복, 전자 메일 스레드, 테마 및 관련성)을 지정하여 분석에서 제외할 수 있습니다.If you know of text that should be ignored, you can exclude it from analytics by specifying the text string and the analytics functionality (Near-duplicates, Email threading, Themes, and Relevance) that the text should be excluded for. 정규식(RegEx)을 무시된 텍스트로 사용할 수도 있습니다.Using regular expressions (RegEx) as ignored text is also supported.

광학 문자 인식(OCR)Optical character recognition (OCR)

이 설정을 설정하면 이미지 파일에서 OCR 처리가 실행됩니다.When this setting is turned on, OCR processing will be run on image files. OCR 처리는 다음과 같은 상황에서 실행됩니다.OCR processing is run in the following situations:

  • 보호자 및 비보조 데이터 원본이 사례에 추가되는 경우When custodians and non-custodial data sources are added to a case. OCR 처리는 고급 인덱싱 프로세스 중에 수행됩니다.OCR processing is performed during the Advanced indexing process. 즉, 검색 조건과 일치하는 이미지 파일의 텍스트가 컬렉션 검색에 반환됩니다.This means that text in image files that matches the search criteria will be returned in a collection search.

  • 다른 데이터 원본의 콘텐츠(양도인과 연결되지 않은 데이터 원본의 경우 사례에 추가)가 검토 집합에 추가되는 경우.When content from other data sources (that aren't associated with a custodian and added to the case in a non-custodial data source) is added to a review set.

데이터가 검토 집합에 추가된 후 이미지 텍스트를 검토, 검색, 태그 지정 및 분석할 수 있습니다.After data is added to a review set, image text can be reviewed, searched, tagged, and analyzed. 선택된 이미지 파일의 텍스트 뷰어에서 추출된 텍스트를 검토 집합에서 볼 수 있습니다.You can view the extracted text in the Text viewer of the selected image file in the review set. 자세한 내용은 다음을 참조하세요.For more information, see: