Definir configurações de pesquisa e análise na Descoberta Eletrônica (Premium)
Você pode definir configurações para cada Descoberta Eletrônica do Microsoft Purview (Premium) para controlar a funcionalidade a seguir.
Duplicatas próximas e threading de email
Temas
Consulta de conjunto de revisão autogerada
Ignorar texto
Reconhecimento óptico de caracteres
Para definir as configurações de pesquisa e análise de um caso:
Na página Descoberta Eletrônica (Premium), selecione o caso.
Na guia Configurações, em Pesquisa e análise, clique em Selecionar.
A página de configurações de caso é exibida. Essas configurações são aplicadas a todos os conjuntos de revisão em um caso.

Duplicatas próximas e threading de email
Nesta seção, você pode definir parâmetros para detecção de duplicatas, detecção quase duplicada e threading de email. Para obter mais informações, consulte Detecção de duplicatas próximas e threading de email.
Duplicatas próximas/threading de email: Quando ativada, a detecção de duplicatas, a detecção de duplicatas próximas e o threading de email são incluídos como parte do fluxo de trabalho quando você executa a análise nos dados em um conjunto de revisão.
Limite de similaridade de documento e email: Se o nível de similaridade para dois documentos estiver acima do limite, ambos os documentos serão colocados no mesmo conjunto quase duplicado.
Número mínimo/máximo de palavras: Essas configurações especificam que as duplicatas próximas e a análise de threading de email são executadas somente em documentos que tenham pelo menos o número mínimo de palavras e, no máximo, o número máximo de palavras.
Temas
Nesta seção, você pode definir parâmetros para temas. Para obter mais informações, consulte Temas.
Temas: Quando ativado, o clustering de temas é executado como parte do fluxo de trabalho quando você executa a análise nos dados em um conjunto de revisão.
Número máximo de temas: Especifica o número máximo de temas que podem ser gerados quando você executa análises nos dados em um conjunto de revisão.
Inclua números em temas: Quando ativado, os números (que identificam um tema) são incluídos ao gerar temas.
Ajuste o número máximo de temas dinamicamente: Em determinadas situações, pode não haver documentos suficientes em um conjunto de revisão para produzir o número desejado de temas. Quando esta configuração está habilitada, a Descoberta Eletrônica (Premium) ajusta de forma dinâmica o número máximo de temas em vez de tentar impor.
Resumo do conjunto de consulta
Se você selecionar criar automaticamente uma pesquisa salva para Revisão após a caixa de seleção de análise, a Descoberta Eletrônica (Premium) gerará automaticamente a consulta do conjunto de revisão chamada Para Revisão.

Essa consulta basicamente filtra itens duplicados do conjunto de revisão. Isso permite que você examine os itens exclusivos no conjunto de revisão. Essa consulta é criada apenas quando você executa uma análise de um conjunto de revisão no caso. Para obter mais informações sobre consultas de conjunto de revisão, consulte Consultar os dados em um conjunto de revisão.
Ignorar texto
Há situações em que determinado texto diminuirá a qualidade da análise, como avisos de isenção de responsabilidade longos que são adicionados a mensagens de email, independentemente do conteúdo do email. Se conhece texto que deve ser ignorado, você pode excluí-lo da análise ao especificar a cadeia de texto e a funcionalidade de análise (duplicadas próximas, threading de email, Temas e Relevância) que o texto deve ser excluído. Também há suporte para o uso de expressões regulares (RegEx) como texto ignorado.
Reconhecimento óptico de caracteres (OCR)
Quando essa configuração estiver ativada, o processamento de OCR será executado em arquivos de imagem. O processamento de OCR é executado nas seguintes situações:
Quando custodiantes e fontes de dados não custodiantes são adicionadas a um caso. Quando o OCR é aplicado a arquivos de imagem, o texto nesses arquivos será pesquisável durante uma coleção. O processamento de OCR é executado durante o processo de indexação avançada. O OCR só é executado em itens que são processados durante a indexação avançada. Por exemplo, se um arquivo PDF grande que é parcialmente indexado ou teve outros erros de indexação for processado durante a indexação avançada, o arquivo também terá o OCR aplicado. Em outras palavras, o processamento de OCR ocorre apenas em arquivos que são indexados novamente durante o processo de indexação avançada. Isso significa que pode haver situações em que os custodiantes são adicionados a um caso, mas alguns anexos de email não serão processados para OCR porque esses arquivos não são processados durante a indexação avançada.
Quando o conteúdo de outras fontes de dados (que não estão associados a um guardião e adicionados ao caso em uma fonte de dados não custodiante) é adicionado a um conjunto de revisão.
Depois que os dados são adicionados a um conjunto de revisão, o texto da imagem pode ser revisado, pesquisado, marcado e analisado. Você pode exibir o texto extraído no Visualizador de texto do arquivo de imagem selecionado no conjunto de revisão. Para saber mais, veja: