Configurare le impostazioni di ricerca e analisi in Advanced eDiscoveryConfigure search and analytics settings in Advanced eDiscovery

È possibile configurare le impostazioni per ogni caso di Advanced eDiscovery per controllare le funzionalità seguenti.You can configure settings for each Advanced eDiscovery case to control the following functionality.

  • Quasi duplicati e threading della posta elettronicaNear duplicates and email threading

  • TemiThemes

  • Query del set di revisione rigenerata automaticamenteAutogenerated review set query

  • Ignora testoIgnore text

  • Riconoscimento ottico dei caratteriOptical character recognition

Per configurare le impostazioni di ricerca e analisi per un caso:To configure search and analytics settings for a case:

  1. Nella pagina Advanced eDiscovery selezionare il caso.On the Advanced eDiscovery page, select the case.

  2. Nella scheda Impostazioni, in Analisi & ricerca, fare clic su Seleziona.On the Settings tab, under Search & analytics, click Select.

    Viene visualizzata la pagina delle impostazioni del caso.The case settings page is displayed. Queste impostazioni vengono applicate a tutti i set di recensioni in un caso.These settings are applied to all review sets in a case.

    Configurare le impostazioni di analisi e ricerca per un caso di Advanced eDiscovery

Quasi duplicati e threading della posta elettronicaNear duplicates and email threading

In questa sezione è possibile impostare i parametri per il rilevamento dei duplicati, il rilevamento quasi duplicato e il threading della posta elettronica.In this section, you can set parameters for duplicate detection, near duplicate detection, and email threading. Per ulteriori informazioni, vedere Rilevamento quasi duplicati e Threading della posta elettronica.For more information, see Near duplicate detection and Email threading.

  • Threading near duplicates/email: Se attivato, il rilevamento dei duplicati, il rilevamento quasi duplicato e il threading della posta elettronica vengono inclusi come parte del flusso di lavoro quando si esegue l'analisi dei dati in un insieme da rivedere.Near duplicates/email threading: When turned on, duplicate detection, near duplicate detection, and email threading are included as part of the workflow when you run analytics on the data in a review set.

  • Soglia di similarità di documenti e messaggi di posta elettronica: Se il livello di similarità per due documenti è superiore alla soglia, entrambi i documenti vengono inseriti nello stesso set di duplicati quasi duplicati.Document and email similarity threshold: If the similarity level for two documents is above the threshold, both documents are put in the same near duplicate set.

  • Numero minimo/massimo di parole: Queste impostazioni specificano che quasi i duplicati e l'analisi del threading della posta elettronica vengono eseguite solo su documenti con almeno il numero minimo di parole e al massimo il numero massimo di parole.Minimum/maximum number of words: These settings specify that near duplicates and email threading analysis are performed only on documents that have at least the minimum number of words and at most the maximum number of words.

TemiThemes

In questa sezione è possibile impostare i parametri per i temi.In this section, you can set parameters for themes. Per ulteriori informazioni, vedere Temi.For more information, see Themes.

  • Temi: Se attivato, il clustering dei temi viene eseguito come parte del flusso di lavoro quando si esegue l'analisi dei dati in un insieme da rivedere.Themes: When turned on, themes clustering is performed as part of the workflow when you run analytics on the data in a review set.

  • Numero massimo di temi: Specifica il numero massimo di temi che possono essere generati quando si esegue l'analisi dei dati in un insieme da rivedere.Maximum number of themes: Specifies the maximum number of themes that can be generated when you run analytics on the data in a review set.

  • Includi numeri nei temi: Quando è attivata, i numeri (che identificano un tema) vengono inclusi durante la generazione dei temi.Include numbers in themes: When turned on, numbers (that identify a theme) are included when generating themes.

  • Regolare il numero massimo di temi in modo dinamico: In alcune situazioni potrebbe non essere disponibile un numero sufficiente di documenti in un insieme da rivedere per produrre il numero desiderato di temi.Adjust maximum number of themes dynamically: In certain situations, there may not be enough documents in a review set to produce the desired number of themes. Quando questa impostazione è abilitata, Advanced eDiscovery regola il numero massimo di temi in modo dinamico anziché tentare di applicare il numero massimo di temi.When this setting is enabled, Advanced eDiscovery adjusts the maximum number of themes dynamically rather than attempting to enforce the maximum number of themes.

Esaminare la query impostataReview set query

Se si seleziona la casella di controllo Crea automaticamente una ricerca salvata per revisione dopo l'analisi, Advanced eDiscovery genera automaticamente la query del set di revisione denominata Per revisione.If you select the Automatically create a For Review saved search after analytics checkbox, Advanced eDiscovery autogenerates review set query named For Review.

Query rigenerata automaticamente per la revisione

Questa query filtra fondamentalmente gli elementi duplicati dal set di recensioni.This query basically filters out duplicate items from the review set. In questo modo è possibile esaminare gli elementi univoci nel set di recensioni.This lets you review the unique items in the review set. Questa query viene creata solo quando si esegue l'analisi per un insieme di recensioni nel caso.This query is created only when you run analytics for a review set in the case. Per ulteriori informazioni sulla revisione delle query impostate, vedere Eseguire query sui dati in un insieme da rivedere.For more information, about review set queries, see Query the data in a review set.

Ignora testoIgnore text

Ci sono situazioni in cui un determinato testo riduce la qualità dell'analisi, ad esempio lunghe dichiarazioni di non responsabilità che vengono aggiunte ai messaggi di posta elettronica indipendentemente dal contenuto del messaggio di posta elettronica.There are situations where certain text will diminish the quality of analytics, such as lengthy disclaimers that get added to email messages regardless of the content of the email. Se si conosce il testo che deve essere ignorato, è possibile escluderlo dall'analisi specificando la stringa di testo e la funzionalità di analisi (near-duplicates, Email threading, Themes e Relevance) per cui deve essere escluso il testo.If you know of text that should be ignored, you can exclude it from analytics by specifying the text string and the analytics functionality (Near-duplicates, Email threading, Themes, and Relevance) that the text should be excluded for. È inoltre supportato l'utilizzo di espressioni regolari (RegEx) come testo ignorato.Using regular expressions (RegEx) as ignored text is also supported.

Riconoscimento ottico dei caratteri (OCR)Optical character recognition (OCR)

Quando questa impostazione è attivata, l'elaborazione OCR verrà eseguita sui file di immagine.When this setting is turned on, OCR processing will be run on image files. L'elaborazione OCR viene eseguita nelle situazioni seguenti:OCR processing is run in the following situations:

  • Quando i responsabile e le origini dati non dei depositario vengono aggiunti a un caso.When custodians and non-custodial data sources are added to a case. L'elaborazione OCR viene eseguita durante il processo di indicizzazione avanzata.OCR processing is performed during the Advanced indexing process. Ciò significa che il testo nei file di immagine che corrisponde ai criteri di ricerca verrà restituito in una ricerca di raccolta.This means that text in image files that matches the search criteria will be returned in a collection search.

  • Quando il contenuto di altre origini dati (che non sono associate a un responsabile e aggiunto al caso in un'origine dati non responsabile) viene aggiunto a un insieme da rivedere.When content from other data sources (that aren't associated with a custodian and added to the case in a non-custodial data source) is added to a review set.

Dopo l'aggiunta dei dati a un insieme di recensioni, il testo dell'immagine può essere esaminato, cercato, contrassegnato e analizzato.After data is added to a review set, image text can be reviewed, searched, tagged, and analyzed. Puoi visualizzare il testo estratto nel visualizzatore di testo del file di immagine selezionato nel set di recensioni.You can view the extracted text in the Text viewer of the selected image file in the review set. Per altre informazioni, vedere:For more information, see: