Configurar las opciones de búsqueda y análisis en eDiscovery avanzadoConfigure search and analytics settings in Advanced eDiscovery

Puede configurar las opciones de cada caso de eDiscovery avanzado para controlar la siguiente funcionalidad.You can configure settings for each Advanced eDiscovery case to control the following functionality.

  • Casi duplicados y subprocesos de correo electrónicoNear duplicates and email threading

  • TemasThemes

  • Consulta de conjunto de revisión generado automáticamenteAutogenerated review set query

  • Omitir textoIgnore text

  • Reconocimiento óptico de caracteresOptical character recognition

Para configurar las opciones de búsqueda y análisis para un caso:To configure search and analytics settings for a case:

  1. En la página eDiscovery avanzado, seleccione el caso.On the Advanced eDiscovery page, select the case.

  2. En la pestaña Configuración, en Buscar & análisis, haga clic en Seleccionar.On the Settings tab, under Search & analytics, click Select.

    Se muestra la página de configuración de casos.The case settings page is displayed. Esta configuración se aplica a todos los conjuntos de revisión en un caso.These settings are applied to all review sets in a case.

    Configurar las opciones de análisis y búsqueda para un caso de eDiscovery avanzado

Casi duplicados y subprocesos de correo electrónicoNear duplicates and email threading

En esta sección, puede establecer parámetros para la detección de duplicados, la detección de duplicados cercanos y los subprocesos de correo electrónico.In this section, you can set parameters for duplicate detection, near duplicate detection, and email threading. Para obtener más información, vea Detección de duplicados cercanos y subprocesos de correo electrónico.For more information, see Near duplicate detection and Email threading.

  • Casi duplicados/subprocesos de correo electrónico: Cuando se activa, la detección de duplicados, la detección de duplicados cercanos y los subprocesos de correo electrónico se incluyen como parte del flujo de trabajo al ejecutar análisis en los datos de un conjunto de revisión.Near duplicates/email threading: When turned on, duplicate detection, near duplicate detection, and email threading are included as part of the workflow when you run analytics on the data in a review set.

  • Umbral de similitud de documento y correo electrónico: Si el nivel de similitud de dos documentos está por encima del umbral, ambos documentos se colocarán en el mismo conjunto casi duplicado.Document and email similarity threshold: If the similarity level for two documents is above the threshold, both documents are put in the same near duplicate set.

  • Número mínimo/máximo de palabras: Esta configuración especifica que los duplicados cercanos y el análisis de subprocesos de correo electrónico solo se realizan en documentos que tienen al menos el número mínimo de palabras y, como máximo, el número máximo de palabras.Minimum/maximum number of words: These settings specify that near duplicates and email threading analysis are performed only on documents that have at least the minimum number of words and at most the maximum number of words.

TemasThemes

En esta sección, puede establecer parámetros para los temas.In this section, you can set parameters for themes. Para obtener más información, vea Temas.For more information, see Themes.

  • Temas: Cuando está activado, la agrupación en clústeres de temas se realiza como parte del flujo de trabajo al ejecutar análisis en los datos de un conjunto de revisión.Themes: When turned on, themes clustering is performed as part of the workflow when you run analytics on the data in a review set.

  • Número máximo de temas: Especifica el número máximo de temas que se pueden generar al ejecutar análisis en los datos de un conjunto de revisión.Maximum number of themes: Specifies the maximum number of themes that can be generated when you run analytics on the data in a review set.

  • Incluir números en temas: Cuando está activado, se incluyen números (que identifican un tema) al generar temas.Include numbers in themes: When turned on, numbers (that identify a theme) are included when generating themes.

  • Ajustar el número máximo de temas dinámicamente: En determinadas situaciones, es posible que no haya suficientes documentos en un conjunto de revisión para producir el número de temas deseado.Adjust maximum number of themes dynamically: In certain situations, there may not be enough documents in a review set to produce the desired number of themes. Cuando esta configuración está habilitada, eDiscovery avanzado ajusta el número máximo de temas dinámicamente en lugar de intentar aplicar el número máximo de temas.When this setting is enabled, Advanced eDiscovery adjusts the maximum number of themes dynamically rather than attempting to enforce the maximum number of themes.

Consulta de conjunto de revisiónReview set query

Si activa la casilla Crear automáticamente una búsqueda guardada para revisión después del análisis, eDiscovery avanzado genera automáticamente la consulta del conjunto de revisión denominada For Review.If you select the Automatically create a For Review saved search after analytics checkbox, Advanced eDiscovery autogenerates review set query named For Review.

Consulta de generación automática Para revisión

Esta consulta filtra básicamente los elementos duplicados del conjunto de revisión.This query basically filters out duplicate items from the review set. Esto te permite revisar los elementos únicos del conjunto de revisión.This lets you review the unique items in the review set. Esta consulta solo se crea cuando se ejecuta el análisis de un conjunto de revisión en el caso.This query is created only when you run analytics for a review set in the case. Para obtener más información, acerca de las consultas de conjunto de revisión, vea Consultar los datos de un conjunto de revisión.For more information, about review set queries, see Query the data in a review set.

Omitir textoIgnore text

Hay situaciones en las que determinado texto disminuirá la calidad del análisis, como los largos avisos de declinación de responsabilidades que se agregan a los mensajes de correo electrónico independientemente del contenido del correo electrónico.There are situations where certain text will diminish the quality of analytics, such as lengthy disclaimers that get added to email messages regardless of the content of the email. Si conoce el texto que debe omitirse, puede excluirlo del análisis especificando la cadena de texto y la funcionalidad de análisis (Duplicados cercanos, Subprocesos de correo electrónico, Temas y Relevancia) para las que se debe excluir el texto.If you know of text that should be ignored, you can exclude it from analytics by specifying the text string and the analytics functionality (Near-duplicates, Email threading, Themes, and Relevance) that the text should be excluded for. También se admite el uso de expresiones regulares (RegEx) como texto omitido.Using regular expressions (RegEx) as ignored text is also supported.

Reconocimiento óptico de caracteres (OCR)Optical character recognition (OCR)

Cuando esta configuración está activada, el procesamiento ocr se ejecutará en archivos de imagen.When this setting is turned on, OCR processing will be run on image files. El procesamiento de OCR se ejecuta en las siguientes situaciones:OCR processing is run in the following situations:

  • Cuando los administradores y orígenes de datos que no son administradores se agregan a un caso.When custodians and non-custodial data sources are added to a case. El procesamiento de OCR se realiza durante el proceso de indización avanzada.OCR processing is performed during the Advanced indexing process. Esto significa que el texto de los archivos de imagen que coincida con los criterios de búsqueda se devolverá en una búsqueda de colección.This means that text in image files that matches the search criteria will be returned in a collection search.

  • Cuando se agrega contenido de otros orígenes de datos (que no están asociados con un administrador y se agregan al caso en un origen de datos que no es de custodia) a un conjunto de revisión.When content from other data sources (that aren't associated with a custodian and added to the case in a non-custodial data source) is added to a review set.

Después de agregar datos a un conjunto de revisión, el texto de la imagen se puede revisar, buscar, etiquetar y analizar.After data is added to a review set, image text can be reviewed, searched, tagged, and analyzed. Puede ver el texto extraído en el visor de texto del archivo de imagen seleccionado en el conjunto de revisión.You can view the extracted text in the Text viewer of the selected image file in the review set. Para obtener más información, vea:For more information, see: