Fast duplizierte Erkennung in eDiscovery (Premium)
Betrachten Sie eine Gruppe von zu überprüfenden Dokumenten, bei denen eine Teilmenge auf derselben Vorlage basiert und meist die gleiche Textbausteinesprache aufweist, mit einigen Unterschieden hier und da. Wenn ein Prüfer diese Teilmenge identifizieren, eine davon gründlich überprüfen und die Unterschiede für den Rest überprüfen könnte, hätte er keine eindeutigen Informationen verpasst, während er nur einen Bruchteil der Zeit in Anspruch genommen hätte, um alle Dokumente zu lesen, die abgedeckt wurden. Bei der Erkennung von Quasiduplikaten werden textuell ähnliche Dokumente gruppiert, um den Überprüfungsvorgang effizienter zu gestalten.
Wie funktioniert das?
Bei Ausführung der Erkennung von Quasiduplikaten analysiert das System jedes Dokument mit Text. Anschließend werden alle Dokumente miteinander verglichen, um zu bestimmen, ob ihre Ähnlichkeit über dem Schwellenwert liegt. Ist dies der Fall, werden die Dokumente gruppiert. Nachdem alle Dokumente verglichen und gruppiert wurden, wird ein Dokument aus jeder Gruppe als „Pivot“ markiert. Wenn Sie Ihre Dokumente überprüfen, können Sie zuerst das Pivot-Dokument und anschließend die restlichen Dokumente im gleichen Quasiduplikat-Satz überprüfen und sich dabei auf den Unterschied zwischen dem Pivot und dem Dokument konzentrieren, das sich in der Überprüfung befindet.