Detecção de duplicatas próximas na Descoberta Eletrônica (Premium)
Considere um conjunto de documentos a ser revisado no qual um subconjunto é baseado no mesmo modelo e tem principalmente a mesma linguagem clichê, com algumas diferenças aqui e ali. Se um revistor pudesse identificar esse subconjunto, examinar um deles completamente e examinar as diferenças para o restante, ele não teria perdido nenhuma informação exclusiva enquanto levaria apenas uma fração de tempo que os levaria para ler todos os documentos que abrangem a cobertura. Detecção de duplicata próxima agrupa documentos textualmente similares para deixar seu processo de avaliação mais eficiente.
Como funciona?
Quando a detecção de duplicatas próximas é executada, o sistema analisa cada documento com texto. Depois, ela compara os documento entre si para determinar se suas semelhanças são maiores que o limite definido. Se forem maiores, os documentos são agrupados. Depois de todos os documentos serem comparados e agrupados, um documento de cada grupo é marcado como o “original”. Ao analisar seus documentos, você pode analisar primeiro o original e analisar os outros documentos no mesmo conjunto de duplicatas próximas, focando na diferença entre o original e o documento que está sendo analisado.