Statistiche e report di raccolta in Microsoft Purview eDiscovery (Premium)

Dopo aver creato una stima della raccolta, è possibile visualizzare le statistiche sugli elementi recuperati, ad esempio i percorsi di contenuto che contengono la maggior parte degli elementi corrispondenti ai criteri di ricerca e il numero di elementi restituiti dalla query di ricerca. È anche possibile visualizzare in anteprima un subset dei risultati.

Dopo aver identificato il set di documenti da esaminare ulteriormente, è possibile aggiungere i risultati della ricerca a un set di revisione da raccogliere ed elaborare.

Consiglio

Se non si è un cliente E5, usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione Portale di conformità di Microsoft Purview. Informazioni dettagliate sull'iscrizione e le condizioni di valutazione.

Statistiche di ricerca per le stime di raccolta

Questa sezione descrive le statistiche disponibili per le stime di raccolta. Queste statistiche sono disponibili nella scheda Statistiche di ricerca nella pagina a comparsa di una stima della raccolta.

Stime della raccolta

In questa sezione viene visualizzato un riepilogo grafico degli elementi stimati restituiti dalla raccolta. Indica il numero di elementi che corrispondono ai criteri di ricerca della raccolta. Queste informazioni offrono un'idea del numero stimato di elementi restituiti dalla raccolta.

  • Elementi stimati per località: numero totale di elementi stimati restituiti dalla raccolta. Viene visualizzato anche il numero specifico di elementi presenti nelle cassette postali e nei siti.
  • Percorsi stimati con riscontri: numero totale di posizioni di contenuto che contengono elementi restituiti dalla raccolta. Viene visualizzato anche il numero specifico di cassette postali e percorsi del sito.
  • Volume di dati in base alla posizione (in MB): dimensioni totali di tutti gli elementi stimati restituiti dalla raccolta. Vengono visualizzate anche le dimensioni specifiche degli elementi della cassetta postale e degli elementi del sito.

Sezione Delle stime della raccolta per una stima della raccolta.

Rapporto condizioni

In questa sezione vengono visualizzate le statistiche sulla query di ricerca della raccolta e sul numero di elementi stimati corrispondenti a parti diverse della query di ricerca. È possibile usare queste statistiche per analizzare il numero di elementi che corrispondono a ogni componente della query di ricerca. In questo modo è possibile perfezionare i criteri di ricerca per la raccolta e, se necessario, limitare l'ambito della raccolta.

  • Tipo di posizione: tipo di percorso del contenuto a cui sono applicabili le statistiche di query. Il valore di Exchange indica una posizione della cassetta postale; un valore di SharePoint indica una posizione del sito.
  • Parte: la parte della query di ricerca a cui sono applicabili le statistiche. Primaria indica l'intera query di ricerca. La parola chiave indica che le statistiche nella riga riguardano una parola chiave specifica. Se si usa un elenco di parole chiave per la query di ricerca nella raccolta, le statistiche per ogni componente della query vengono incluse in questa tabella.
  • Condizione: componente effettivo (parola chiave o condizione) della query di ricerca eseguita per la stima della raccolta che ha restituito le statistiche visualizzate nella riga corrispondente.
  • Percorsi con riscontri: numero dei percorsi di contenuto (specificati dalla colonna Tipo di posizione ) che contengono elementi che corrispondono alla query primaria o parola chiave elencata nella colonna Condizione .
  • Elementi: numero di elementi (dal percorso del contenuto specificato) che corrispondono alla query elencata nella colonna Condizione . Come spiegato in precedenza, se un elemento contiene più istanze di una parola chiave cercata, viene conteggiato una sola volta in questa colonna.
  • Dimensioni (MB): dimensione totale di tutti gli elementi trovati (nel percorso del contenuto specificato) che corrispondono alla query di ricerca nella colonna Condizione .

Sezione del report sulle condizioni per una stima della raccolta.

Percorsi principali

In questa sezione vengono visualizzate le statistiche sulle posizioni di contenuto specifiche con la maggior parte degli elementi restituiti dalla raccolta.

  • Percorso: il nome della posizione (l'indirizzo di posta elettronica delle cassette postali e l'URL per i siti).
  • Tipo di posizione: una cassetta postale avrà un tipo di Exchange e i siti di SharePoint avranno un tipo di SharePoint .
  • Elementi: numero stimato di elementi nel percorso del contenuto restituito dalla raccolta.
  • Dimensioni: dimensioni totali degli elementi stimati in ogni posizione del contenuto.

Sezione Posizioni principali per una stima della raccolta.

Statistiche e report per le raccolte di cui è stato eseguito il commit

Questa sezione descrive le statistiche disponibili dopo il commit di una raccolta in un set di revisione, incluso il numero effettivo di elementi aggiunti al set di revisione. Queste statistiche (oltre alle informazioni sul set di carico) forniscono informazioni cronologica sul contenuto aggiunto a un caso.

Dopo aver eseguito il commit di una raccolta in un set di revisione, nella pagina a comparsa della connessione di cui è stato eseguito il commit vengono visualizzate le schede seguenti. Ognuna di queste schede contiene diversi tipi di informazioni sulla raccolta.

Schede nella pagina a comparsa della raccolta di cui è stato eseguito il commit.

Scheda Riepilogo per le raccolte

La scheda Riepilogo per le raccolte di cui è stato eseguito il commit contiene diverse sezioni che forniscono informazioni sugli elementi della raccolta, le stime e le posizioni degli elementi, l'indicizzazione, i tipi di file e altro ancora.

Panoramica della raccolta (anteprima)

La sezione Panoramica della raccolta della scheda Riepilogo di un set di revisione di cui è stato eseguito il commit contiene informazioni sul modo in cui gli elementi sono stati trovati, recuperati ed elaborati come parte della raccolta. Le informazioni contenute in questa sezione sono un riepilogo delle informazioni raccolte e visualizzate durante la stima iniziale della raccolta e includono le informazioni raccolte ed elaborate durante il commit della raccolta nel set di revisione. È possibile usare le informazioni in questa sezione per migliorare la comprensione dell'evoluzione dei dati di raccolta finale dai dati di stima durante il commit e l'elaborazione della raccolta.

Queste informazioni vengono segmentate e visualizzate nelle sezioni secondarie seguenti:

  • Località con riscontri: questa sezione riepiloga il numero di posizioni ricercate e il numero di località con riscontri in base alle condizioni definite nella stima della raccolta. Visualizza anche il numero e il tipo di posizioni ricercate.

    Posizioni con riscontri.

  • Stime di pre-raccolta: questa sezione riepiloga il numero di elementi e le dimensioni degli elementi totali calcolati per la stima della raccolta (prima del commit della raccolta). Viene visualizzato anche un conteggio di tutti gli elementi parzialmente indicizzati .

    Stime di pre-raccolta.

  • Elementi della raccolta: in questa sezione vengono visualizzati il tipo, il conteggio e una descrizione di tutti gli elementi recuperati da posizioni con riscontri durante il commit della raccolta nel set di revisione. Durante questo processo, potrebbe essere presente un'aggiunta e un consolidamento degli elementi durante l'elaborazione. Le aggiunte e i consolidamenti possono includere tipi inclusi nella tabella seguente:

    Tipo di elemento Descrizione del tipo di elemento
    Elementi con riscontri Numero stimato di elementi trovati tramite ricerca.
    Esaminare i duplicati dei set Gli elementi già inclusi nello stesso set di revisione non vengono raccolti.
    Cercare i duplicati Le istanze duplicate degli stessi elementi non vengono raccolte.
    Tutte le versioni Vengono raccolte tutte le versioni degli elementi in SharePoint.
    Versioni cronologica Le versioni cronologica gestite da SharePoint vengono raccolte.
    Allegati cloud Gli allegati cloud vengono identificati e raccolti dai collegamenti di SharePoint.
    Versione condivisa Le versioni condivise degli elementi vengono raccolte oltre alle versioni più recenti.
    Conversazioni contestuali di Teams Vengono raccolti altri messaggi di chat che potrebbero essere rilevanti.
    Trascrizioni di chat consolidate I messaggi di chat raccolti vengono consolidati in un minor numero di trascrizioni HTML.
    Eccezioni di recupero Timeout di accesso, file vuoti ed altre eccezioni.
    Totale elementi raccolti Numero totale di elementi raccolti da varie posizioni.
  • Elaborazione per il set di revisione: in questa sezione vengono visualizzati il tipo, il conteggio e la descrizione degli elementi aggiunti al set di revisione dalla stima della raccolta. Gli elementi vengono decompressi, analizzati per il testo, reindicizzati ed elaborati in preparazione per la revisione.

    Elaborazione per la revisione del set.

Contenuto della raccolta

La sezione Contenuto raccolta della scheda Riepilogo di un set di revisione sottoposto a commit contiene statistiche e altre informazioni sugli elementi raccolti dalle origini dati nella raccolta e aggiunti al set di revisione.

  • Totale elementi estratti. Numero totale di elementi aggiunti al set di revisione. Questo numero indica la somma di elementi padre ed elementi figlio aggiunti al set di revisione.

    Consiglio

    Passare il cursore sulle barre degli elementi padre o figlio per visualizzare il numero totale di elementi padre o figlio.

  • Elementi padre. Numero di elementi restituiti dalla raccolta utilizzata per raccogliere gli elementi aggiunti al set di revisione. Questo numero corrisponde (ed è uguale a) al numero stimato di elementi visualizzati nella sezione Parametri raccolta . Numero di elementi padre che raccoglie le informazioni usate per raccogliere gli elementi aggiunti al set di revisione.

    Un elemento padre può contenere più elementi figlio. Ad esempio, un messaggio di posta elettronica è un elemento padre se contiene un file allegato o ha un allegato cloud. In questo caso, il file allegato o il file di destinazione dell'allegato cloud viene considerato un elemento figlio. Quando si esegue il commit di una raccolta, gli elementi padre e tutti gli elementi figlio corrispondenti (ad esempio file allegati e allegati cloud) vengono aggiunti al set di revisione come singoli elementi o file.

  • Elementi figlio. Numero di elementi figlio aggiunti al set di revisione. Solo gli elementi figlio che sono allegati file e allegati cloud vengono aggiunti al set di revisione come singoli file. Altri tipi di elementi figlio, ad esempio firme e immagini di posta elettronica, vengono estratti da un elemento padre e quindi elaborati da Riconoscimento ottico dei caratteri (OCR) per estrarre qualsiasi testo dall'elemento figlio. Il testo estratto da questi tipi di elementi figlio viene quindi aggiunto al relativo elemento padre in modo che sia possibile visualizzarlo nel set di revisioni. Non aggiungendo elementi figlio al set di revisione come file separato, eDiscovery (Premium) consente di semplificare il processo di revisione limitando il numero di elementi potenzialmente irrilevanti nel set di revisione.

  • Elementi univoci. Numero di elementi univoci aggiunti al set di revisione. Gli elementi univoci sono univoci per il set di revisione. Tutti gli elementi sono univoci quando la prima raccolta viene aggiunta a un nuovo set di revisione perché non erano presenti elementi precedenti nel set di revisione.

  • Elementi duplicati identificati. Numero di elementi della raccolta che non sono stati aggiunti al set di revisione perché lo stesso elemento esiste già nel set di revisione. Le statistiche sugli elementi duplicati possono spiegare le differenze tra il numero di elementi stimati da una stima della raccolta e il numero effettivo di elementi aggiunti al set di revisione.

Indicizzazione

La sezione Indicizzazione della scheda Riepilogo di un set di revisione di cui è stato eseguito il commit contiene informazioni di indicizzazione sugli elementi aggiunti al set di revisione.

  • Nuovi elementi indicizzati. Numero di elementi che sono stati indicizzati prima di essere aggiunti al set di revisione. Esempi di un elemento appena indicizzato sono elementi figlio estratti da un elemento padre e quindi indicizzati prima di essere aggiunti al set di revisione. Inoltre, gli elementi che non si trovano nelle origini dati di custodia e nei percorsi del contenuto non responsabili elencati nella scheda Origini dati nel caso vengono indicizzati prima di essere aggiunti alla revisione. Ad esempio, gli elementi appena indicizzati includerebbero gli elementi raccolti da posizioni aggiuntive.

  • Elementi indicizzati aggiornati. Numero di elementi parzialmente indicizzati che sono stati indicizzati e aggiunti correttamente al set di revisione. Questa statistica indica gli elementi parzialmente indicizzati delle posizioni dei contenuti responsabili e non responsabili Della scheda Origini dati che sono state indicizzate correttamente quando è stato eseguito il commit della raccolta nel set di revisione.

  • Errori di indicizzazione. Numero di elementi parzialmente indicizzati che non è stato possibile indicizzare prima di essere aggiunti al set di revisione. Questi elementi potrebbero richiedere la correzione degli errori.

Tipi di file di raccolta

Nella sezione Tipi di file di raccolta della scheda Riepilogo di un set di revisione di cui è stato eseguito il commit viene visualizzato il numero di elementi per ogni tipo di file incluso nella raccolta. I tipi di file includono e-mail, immagini, documenti, audio, tipi di file video e altro ancora. Per un elenco completo dei tipi di file supportati, vedere Tipi di file supportati in eDiscovery (Premium).For a complete list of the supported file types, see Supported file types in eDiscovery (Premium).

Errori

Nella sezione Errori della scheda Riepilogo di un set di revisione di cui è stato eseguito il commit vengono visualizzati il tipo e il numero di errori rilevati durante il commit della raccolta. Gli errori possono includere file con dimensioni zero, file protetti, file non valido, errori interni e altro ancora. È possibile scaricare un report degli errori in .csv formato selezionando Scarica il report errori in questa sezione.

Parametri della raccolta

Nella sezione Parametri raccolta della scheda Riepilogo di un set di revisione di cui è stato eseguito il commit vengono visualizzate le informazioni sulla raccolta usate per raccogliere gli elementi aggiunti al set di revisione. In questa scheda vengono visualizzate informazioni simili alle informazioni nella scheda Statistiche di ricerca . Questa sezione fornisce uno snap-shot rapido della query di ricerca usata dalla raccolta, i percorsi del contenuto in cui è stata eseguita la ricerca e i risultati stimati della raccolta. Come illustrato in precedenza, il numero di elementi stimati in questa sezione sarà uguale al numero di elementi padre visualizzati nella sezione Contenuto raccolta .

Scheda Origini dati per le raccolte

La scheda Origini dati contiene informazioni sulle origini dati responsabili e non responsabili. Nella sezione Origini dati del responsabile vengono visualizzate tutte le origini dati di custodia per ogni responsabile incluso nella raccolta. Nella sezione Origini dati non responsabili vengono visualizzate tutte le origini dati non responsabili per la raccolta. Le informazioni sull'origine dati visualizzate sono disponibili anche nella scheda Origini dati principale per ogni caso.

Scheda Statistiche di ricerca per le raccolte

Le statistiche visualizzate nella scheda Statistiche di ricerca sono le stesse statistiche dell'ultima esecuzione di una stima della raccolta. Sono incluse le stime della raccolta, il report delle condizioni e le posizioni principali. Queste informazioni vengono conservate dalla stima della raccolta per riferimento cronologico e possono essere confrontate con la raccolta effettiva di cui è stato eseguito il commit nel set di revisione.

Differenze tra le stime di raccolta e la raccolta di cui è stato eseguito il commit effettivo

Quando si esegue una stima della raccolta, nella scheda Riepilogo e nella sezione Stime raccolta della scheda Statistiche di ricerca viene visualizzata una stima del numero di elementi (e delle relative dimensioni totali) che soddisfano i criteri di raccolta. Dopo aver eseguito il commit di una stima della raccolta in un set di revisione, il numero effettivo di elementi aggiunti (e le relative dimensioni totali) è spesso diverso dalle stime. Nella maggior parte dei casi, al set di revisione vengono aggiunti più elementi di quelli stimati dalla stima della raccolta. L'elenco seguente descrive i motivi più comuni di queste differenze e suggerimenti per identificarle:

  • Elementi figlio. Elementi figlio (ad esempio allegati di file e allegati cloud) estratti dagli elementi padre e aggiunti come singoli file. Il numero di elementi figlio può aumentare il numero di elementi aggiunti al set di revisione. In generale, il numero di elementi padre identificati nella sezione Contenuto raccolta della scheda Riepilogo di una raccolta di cui è stato eseguito il commit deve essere uguale al numero di elementi stimati della stima della raccolta.

  • Elementi duplicati. Gli elementi della stima della raccolta che sono già stati aggiunti al set di revisione in una raccolta precedente non verranno aggiunti. Come illustrato in precedenza, il numero di elementi duplicati nella raccolta viene visualizzato nella sezione Contenuto raccolta della scheda Riepilogo .

  • Opzioni di configurazione della raccolta. Quando si esegue il commit di una stima della raccolta in un set di revisione, è necessario scegliere di includere thread di conversazione, allegati cloud e versioni dei documenti. Uno di questi elementi aggiunti al set di revisione non è incluso nelle stime della stima della raccolta. Vengono identificati e raccolti solo quando si esegue il commit della raccolta. Se si selezionano queste opzioni, è molto probabile che il numero di elementi aggiunti al set di revisione aumenti.

    Ad esempio, più versioni dei documenti di SharePoint non sono incluse nella stima per la stima della raccolta. Se tuttavia si seleziona l'opzione per includere tutte le versioni dei documenti quando si esegue il commit di una stima della raccolta, il numero effettivo (e le dimensioni totali) degli elementi aggiunti al set di revisione aumenterà.

    Per altre informazioni su queste opzioni, vedere Commit a collection estimate to a review set .for more information about these options, see Commit a collection estimate to a review set.

Ecco altri motivi per cui i risultati stimati di una stima della raccolta possono essere diversi rispetto ai risultati effettivi di cui è stato eseguito il commit.

  • Il modo in cui i risultati vengono stimati per le stime di raccolta. Una stima dei risultati della ricerca restituita da una stima della raccolta è semplicemente una stima (e non un conteggio effettivo) degli elementi che soddisfano i criteri di query della raccolta. Per compilare la stima degli elementi di posta elettronica, viene richiesto un elenco degli ID messaggio che soddisfano i criteri di ricerca dal database di Exchange. Tuttavia, quando si esegue il commit della raccolta in un set di revisione, la raccolta viene rieseguita e i messaggi effettivi vengono recuperati dal database di Exchange. Di conseguenza, le differenze potrebbero verificarsi a causa del modo in cui vengono determinati il numero stimato di elementi e il numero effettivo di elementi.

  • Modifiche che si verificano tra il momento in cui si stimano e si esegue il commit delle stime della raccolta. Quando si esegue il commit di una stima della raccolta in un set di revisione, la ricerca viene rieseguita per raccogliere gli elementi più recenti nell'indice di ricerca che soddisfano i criteri di ricerca. È possibile che siano stati creati, inviati o eliminati elementi aggiuntivi che soddisfano i criteri di ricerca nel periodo compreso tra l'ultima esecuzione della stima della raccolta e il commit della stima della raccolta in un set di revisione. È anche possibile che gli elementi presenti nell'indice di ricerca quando sono stati stimati i risultati della stima della raccolta non siano più presenti perché sono stati eliminati da un'origine dati prima di eseguire il commit della raccolta. Un modo per attenuare questo problema consiste nel specificare un intervallo di date per una raccolta. Un altro modo consiste nell'inserire un blocco nelle posizioni del contenuto in modo che gli elementi vengano conservati e non possano essere eliminati.

  • Elementi non indicizzati. Se la stima della raccolta include la ricerca in tutte le cassette postali di Exchange o in tutti i siti di SharePoint, solo gli elementi non indicizzati provenienti da posizioni di contenuto contenenti elementi che corrispondono ai criteri di raccolta verranno aggiunti al set di revisione. In altre parole, se non vengono trovati risultati in una cassetta postale o in un sito, tutti gli elementi non indicizzati in tale cassetta postale o sito non verranno aggiunti al set di revisione. Tuttavia, gli elementi non indicizzati di tutti i percorsi di contenuto (anche quelli che non contengono elementi che corrispondono alla query di raccolta) verranno inclusi nei risultati della raccolta stimati.

  • Elementi parzialmente indicizzati: la selezione di questa opzione aggiunge elementi parzialmente indicizzati da origini dati aggiuntive al set di revisione. Se la raccolta ha cercato altre origini dati (come specificato nella pagina Percorsi aggiuntivi della procedura guidata raccolte), potrebbero essere presenti elementi parzialmente indicizzati da queste posizioni che si desidera aggiungere al set di revisione. Le origini dati responsabili e non responsabili in genere non hanno elementi parzialmente indicizzati. Questo avviene perché il processo di indicizzazione avanzata reindicizza gli elementi quando le origini dati responsabili e non responsabili vengono aggiunte a un caso. Inoltre, l'aggiunta di elementi parzialmente indicizzati aumenterà il numero di elementi aggiunti al set di revisione.

    Dopo aver aggiunto elementi parzialmente indicizzati al set di revisione, è possibile applicare un filtro per visualizzare in modo specifico questi elementi. Per altre informazioni, vedere Esempio di scenario: Filtrare elementi parzialmente indicizzati

    In alternativa, se la stima della raccolta include posizioni di contenuto specifiche (ovvero cassette postali o siti specifici in cui è specificato nella pagina Percorsi aggiuntivi della stima guidata raccolta), gli elementi non indicizzati (che non sono esclusi dai criteri di raccolta) dai percorsi di contenuto specificati nella ricerca verranno esportati. In questo caso, il numero stimato di elementi non indicizzati e il numero di elementi non indicizzati aggiunti al set di revisione devono essere uguali.