Erkennung nahezuer Duplikate in eDiscovery (Premium)

Stellen Sie sich eine Gruppe von Dokumenten vor, die überprüft werden müssen, in denen eine Teilmenge auf derselben Vorlage basiert und größtenteils die gleiche Textbausteinsprache aufweist, wobei hier und da einige Unterschiede bestehen. Wenn ein Prüfer diese Teilmenge identifizieren, eine von ihnen gründlich überprüfen und die Unterschiede im Übrigen überprüfen könnte, hätte er keine eindeutigen Informationen übersehen, während er nur einen Bruchteil der Zeit in Anspruch genommen hätte, um alle Dokumente zu lesen, die abgedeckt sind. Bei der Erkennung von Quasiduplikaten werden textuell ähnliche Dokumente gruppiert, um den Überprüfungsvorgang effizienter zu gestalten.

Tipp

Wenn Sie kein E5-Kunde sind, verwenden Sie die 90-tägige Testversion von Microsoft Purview-Lösungen, um zu erfahren, wie zusätzliche Purview-Funktionen Ihre organization die Verwaltung von Datensicherheits- und Complianceanforderungen unterstützen können. Beginnen Sie jetzt im Microsoft Purview-Complianceportal Testversionshub. Erfahren Sie mehr über die Anmelde- und Testbedingungen.

Wie funktioniert das?

Bei Ausführung der Erkennung von Quasiduplikaten analysiert das System jedes Dokument mit Text. Anschließend werden alle Dokumente miteinander verglichen, um zu bestimmen, ob ihre Ähnlichkeit über dem Schwellenwert liegt. Ist dies der Fall, werden die Dokumente gruppiert. Nachdem alle Dokumente verglichen und gruppiert wurden, wird ein Dokument aus jeder Gruppe als „Pivot“ markiert. Wenn Sie Ihre Dokumente überprüfen, können Sie zuerst das Pivot-Dokument und anschließend die restlichen Dokumente im gleichen Quasiduplikat-Satz überprüfen und sich dabei auf den Unterschied zwischen dem Pivot und dem Dokument konzentrieren, das sich in der Überprüfung befindet.