Configurar configurações de pesquisa e análise em Advanced eDiscoveryConfigure search and analytics settings in Advanced eDiscovery

Você pode configurar configurações para cada Advanced eDiscovery caso para controlar a funcionalidade a seguir.You can configure settings for each Advanced eDiscovery case to control the following functionality.

  • Duplicatas próximas e threading de emailNear duplicates and email threading

  • TemasThemes

  • Consulta de conjunto de revisão autogeradaAutogenerated review set query

  • Ignorar textoIgnore text

  • Reconhecimento óptico de caracteresOptical character recognition

Para definir as configurações de pesquisa e análise de um caso:To configure search and analytics settings for a case:

  1. Na página Descoberta Eletrônica Avançada, selecione o caso.On the Advanced eDiscovery page, select the case.

  2. Na guia Configurações, em Pesquisa e análise, clique em Selecionar.On the Settings tab, under Search & analytics, click Select.

    A página de configurações de caso é exibida.The case settings page is displayed. Essas configurações são aplicadas a todos os conjuntos de revisão em um caso.These settings are applied to all review sets in a case.

    Configurar configurações de análise e pesquisa para um Advanced eDiscovery caso

Duplicatas próximas e threading de emailNear duplicates and email threading

Nesta seção, você pode definir parâmetros para detecção duplicada, detecção quase duplicada e threading de email.In this section, you can set parameters for duplicate detection, near duplicate detection, and email threading. Para obter mais informações, consulte Near duplicate detection and Email threading.For more information, see Near duplicate detection and Email threading.

  • Quase duplicatas/threads de email: Quando ligado, a detecção duplicada, a detecção quase duplicada e o threading de email são incluídos como parte do fluxo de trabalho quando você executar análises nos dados em um conjunto de revisão.Near duplicates/email threading: When turned on, duplicate detection, near duplicate detection, and email threading are included as part of the workflow when you run analytics on the data in a review set.

  • Limite de semelhança de documentos e emails: Se o nível de semelhança de dois documentos estiver acima do limite, ambos os documentos serão colocados no mesmo conjunto quase duplicado.Document and email similarity threshold: If the similarity level for two documents is above the threshold, both documents are put in the same near duplicate set.

  • Número mínimo/máximo de palavras: Essas configurações especificam que quase duplicatas e análise de threading de email são executadas somente em documentos que tenham pelo menos o número mínimo de palavras e, no máximo, o número máximo de palavras.Minimum/maximum number of words: These settings specify that near duplicates and email threading analysis are performed only on documents that have at least the minimum number of words and at most the maximum number of words.

TemasThemes

Nesta seção, você pode definir parâmetros para temas.In this section, you can set parameters for themes. Para obter mais informações, consulte Temas.For more information, see Themes.

  • Temas: Quando ligado, o cluster de temas é executado como parte do fluxo de trabalho quando você executar análises nos dados em um conjunto de revisão.Themes: When turned on, themes clustering is performed as part of the workflow when you run analytics on the data in a review set.

  • Número máximo de temas: Especifica o número máximo de temas que podem ser gerados quando você executar análises nos dados em um conjunto de revisão.Maximum number of themes: Specifies the maximum number of themes that can be generated when you run analytics on the data in a review set.

  • Incluir números em temas: Quando ligado, os números (que identificam um tema) são incluídos ao gerar temas.Include numbers in themes: When turned on, numbers (that identify a theme) are included when generating themes.

  • Ajuste o número máximo de temas dinamicamente: Em determinadas situações, talvez não haja documentos suficientes em um conjunto de revisão para produzir o número desejado de temas.Adjust maximum number of themes dynamically: In certain situations, there may not be enough documents in a review set to produce the desired number of themes. Quando esta configuração está habilitada, a Descoberta Eletrônica Avançada ajusta dinamicamente o número máximo de temas em vez de tentar impor o número máximo de temas. When this setting is enabled, Advanced eDiscovery adjusts the maximum number of themes dynamically rather than attempting to enforce the maximum number of themes.

Consulta de conjunto de revisãoReview set query

Se você selecionar a caixa de seleção Criar automaticamente uma pesquisa salva para Revisão após análise, Advanced eDiscovery automaticamente gera a consulta de conjunto de revisão chamada For Review.If you select the Automatically create a For Review saved search after analytics checkbox, Advanced eDiscovery autogenerates review set query named For Review.

A consulta para revisão automática

Essa consulta basicamente filtra itens duplicados do conjunto de revisão.This query basically filters out duplicate items from the review set. Isso permite que você revise os itens exclusivos no conjunto de revisão.This lets you review the unique items in the review set. Essa consulta é criada apenas quando você executa uma análise de um conjunto de revisão no caso.This query is created only when you run analytics for a review set in the case. Para obter mais informações sobre consultas de conjunto de revisão, consulte Consulta dos dados em um conjunto de revisão.For more information, about review set queries, see Query the data in a review set.

Ignorar textoIgnore text

Há situações em que determinado texto diminuirá a qualidade da análise, como avisos de isenção de responsabilidade longos que são adicionados a mensagens de email, independentemente do conteúdo do email.There are situations where certain text will diminish the quality of analytics, such as lengthy disclaimers that get added to email messages regardless of the content of the email. Se conhece texto que deve ser ignorado, você pode excluí-lo da análise ao especificar a cadeia de texto e a funcionalidade de análise (duplicadas próximas, threading de email, Temas e Relevância) que o texto deve ser excluído.If you know of text that should be ignored, you can exclude it from analytics by specifying the text string and the analytics functionality (Near-duplicates, Email threading, Themes, and Relevance) that the text should be excluded for. O uso de expressões regulares (RegEx) como texto ignorado também é suportado.Using regular expressions (RegEx) as ignored text is also supported.

Reconhecimento óptico de caracteres (OCR)Optical character recognition (OCR)

Quando essa configuração estiver configurada, o processamento OCR será executado em arquivos de imagem.When this setting is turned on, OCR processing will be run on image files. O processamento OCR é executado nas seguintes situações:OCR processing is run in the following situations:

  • Quando os custodiantes e fontes de dados não custodiais são adicionados a um caso.When custodians and non-custodial data sources are added to a case. O processamento do OCR é realizado durante o processo de indexação avançada.OCR processing is performed during the Advanced indexing process. Isso significa que o texto em arquivos de imagem que corresponde aos critérios de pesquisa será retornado em uma pesquisa de coleção.This means that text in image files that matches the search criteria will be returned in a collection search.

  • Quando o conteúdo de outras fontes de dados (que não estão associados a um custodiante e adicionado ao caso em uma fonte de dados não custodiada) é adicionado a um conjunto de revisão.When content from other data sources (that aren't associated with a custodian and added to the case in a non-custodial data source) is added to a review set.

Depois que os dados são adicionados a um conjunto de revisão, o texto da imagem pode ser revisado, pesquisado, marcado e analisado.After data is added to a review set, image text can be reviewed, searched, tagged, and analyzed. Você pode exibir o texto extraído no visualizador de texto do arquivo de imagem selecionado no conjunto de revisão.You can view the extracted text in the Text viewer of the selected image file in the review set. Para saber mais, confira:For more information, see: