Konfigurieren von Such- und Analyseeinstellungen in eDiscovery (Premium)
Sie können Einstellungen für jeden Microsoft Purview-eDiscovery (Premium)-Fall konfigurieren, um die folgenden Funktionen zu steuern.
Erkennung von Quasiduplikaten und E-Mail-Threading
Designs
Automatisch generierte Prüfdateisatz-Abfrage
Ignorieren von Text
Optical Character Recognition (optische Zeichenerkennung)
So konfigurieren Sie die Such-und Analyseeinstellungen für einen Fall:
Wählen Sie auf der Seite eDiscovery (Premium) den Fall aus.
Klicken Sie unter der Registerkarte Einstellungen unter Suche und Analysen auf Auswählen.
Die Seite mit den Falleinstellungen wird angezeigt. Diese Einstellungen werden auf alle Prüfdateisätze in einem Fall angewendet.

Erkennung von Quasiduplikaten und E-Mail-Threading
In diesem Abschnitt können Sie Parameter für die Erkennung von Duplikaten, fast doppelter Erkennung und E-Mail-Threading festlegen. Weitere Informationen finden Sie unter "Fast duplizierte Erkennung" und "E-Mail-Threading".
Fast Duplikate/E-Mail-Threading: Wenn diese Option aktiviert ist, werden die Duplikaterkennung, die Fast-Duplikaterkennung und das E-Mail-Threading als Teil des Workflows einbezogen, wenn Sie Analysen für die Daten in einem Prüfdateisatz ausführen.
Schwellenwert für Dokument- und E-Mail-Ähnlichkeit: Wenn die Ähnlichkeitsstufe für zwei Dokumente oberhalb des Schwellenwerts liegt, werden beide Dokumente in derselben Fast-Duplikatgruppe abgelegt.
Minimale/maximale Anzahl von Wörtern: Diese Einstellungen geben an, dass nahezu Duplikate und E-Mail-Threadinganalysen nur für Dokumente durchgeführt werden, die mindestens die mindeste Anzahl von Wörtern und höchstens die maximale Anzahl von Wörtern aufweisen.
Designs
In diesem Abschnitt können Sie Parameter für Designs festlegen. Weitere Informationen finden Sie unter Designs.
Themes: Wenn sie aktiviert ist, wird das Clustering von Designs als Teil des Workflows ausgeführt, wenn Sie Analysen für die Daten in einem Prüfdateisatz ausführen.
Maximale Anzahl von Designs: Gibt die maximale Anzahl von Designs an, die generiert werden können, wenn Sie Analysen für die Daten in einem Prüfdateisatz ausführen.
Einbeziehen von Zahlen in Designs: Wenn diese Option aktiviert ist, werden beim Generieren von Designs Zahlen (die ein Design identifizieren) einbezogen.
Maximale Anzahl von Designs dynamisch anpassen: In bestimmten Situationen sind möglicherweise nicht genügend Dokumente in einem Prüfdateisatz vorhanden, um die gewünschte Anzahl von Designs zu erzeugen. Wenn diese Einstellung aktiviert ist, passt eDiscovery (Premium) die maximale Anzahl von Designs dynamisch an, anstatt zu versuchen, die maximale Anzahl von Designs zu erzwingen.
Prüfdateisatz-Abfrage
Wenn Sie das Kontrollkästchen " Gespeicherte Suche nach Analyse automatisch für Überprüfung erstellen " aktivieren, generiert eDiscovery (Premium) automatisch eine Prüfdateisatzabfrage namens "For Review".

Diese Abfrage filtert im Wesentlichen doppelte Elemente aus dem Prüfdateisatz heraus. Auf diese Weise können Sie die eindeutigen Elemente im Prüfdateisatz überprüfen. Diese Abfrage wird nur erstellt, wenn Sie einen Prüfdateisatz innerhalb des Falls einer Analyse unterziehen. Weitere Informationen zu Prüfdateisatzabfragen finden Sie unter Abfragen der Daten in einem Prüfdateisatz.
Ignorieren von Text
Es gibt Situationen, in denen bestimmter Text die Qualität der Analysen beeinträchtigt, z. B. langwierige Haftungsausschlüsse, die unabhängig vom Inhalt der E-Mail zu E-Mail-Nachrichten hinzugefügt werden. Wenn Sie wollen, dass bestimmte Textzeichenfolgen ignoriert werden soll, können Sie diese aus der Analyse ausschließen, indem Sie die Textzeichenfolgen und die Analysefunktionen (Erkennung von Quasiduplikaten, E-Mail-Threading, Designs und Relevanz) angeben, für die der Text ausgeschlossen werden soll. Die Verwendung regulärer Ausdrücke (RegEx) als ignorierten Text wird ebenfalls unterstützt.
Optical Character Recognition (OCR; optische Zeichenerkennung)
Wenn diese Einstellung aktiviert ist, wird die OCR-Verarbeitung für Bilddateien ausgeführt. Die OCR-Verarbeitung wird in den folgenden Situationen ausgeführt:
Wenn Verwahrer und nicht verwahrte Datenquellen zu einem Fall hinzugefügt werden. Wenn OCR auf Bilddateien angewendet wird, kann der Text in diesen Dateien während einer Sammlung durchsucht werden. Die OCR-Verarbeitung wird während des Erweiterten Indizierungsprozesses ausgeführt. OCR wird nur für Elemente ausgeführt, die während der erweiterten Indizierung verarbeitet werden. Wenn beispielsweise eine große PDF-Datei, die teilweise indiziert ist oder andere Indizierungsfehler aufweise, während der erweiterten Indizierung verarbeitet wird, wird auch OCR auf die Datei angewendet. Mit anderen Worten, die OCR-Verarbeitung erfolgt nur für Dateien, die während des erweiterten Indizierungsprozesses neu indiziert werden. Dies bedeutet, dass es Situationen geben kann, in denen Verwahrer zu einem Fall hinzugefügt werden, aber einige E-Mail-Anlagen nicht für OCR verarbeitet werden, da diese Dateien während der erweiterten Indizierung nicht verarbeitet werden.
Wenn Inhalte aus anderen Datenquellen (die keinem Verwahrer zugeordnet und dem Fall in einer nicht verwahrten Datenquelle hinzugefügt werden) zu einem Prüfdateisatz hinzugefügt werden.
Nachdem Daten zu einem Prüfdateisatz hinzugefügt wurden, kann Bildtext überprüft, durchsucht, markiert und analysiert werden. Sie können den extrahierten Text in der Textanzeige der ausgewählten Bilddatei im Prüfdateisatz anzeigen. Weitere Informationen finden Sie unter: