Analisi di elementi parzialmente indicizzati in eDiscovery

Una ricerca di eDiscovery eseguita dal Portale di conformità di Microsoft Purview include automaticamente elementi parzialmente indicizzati nei risultati della ricerca stimati quando si esegue una ricerca. Gli elementi parzialmente indicizzati sono elementi e documenti delle cassette postali di Exchange in SharePoint e OneDrive for Business siti che per qualche motivo non sono stati completamente indicizzati per la ricerca. La maggior parte dei messaggi di posta elettronica e dei documenti del sito vengono indicizzati correttamente perché rientrano nei limiti di indicizzazione per i messaggi di posta elettronica. Tuttavia, alcuni elementi possono superare questi limiti di indicizzazione e verranno parzialmente indicizzati. Ecco altri motivi per cui gli elementi non possono essere indicizzati per la ricerca e vengono restituiti come elementi parzialmente indicizzati quando si esegue una ricerca di eDiscovery:

  • Email messaggi hanno un file allegato che non può essere aperto. Questa è la causa più comune degli elementi di posta elettronica parzialmente indicizzati.
  • Troppi file allegati a un messaggio di posta elettronica.
  • Un file allegato a un messaggio di posta elettronica è troppo grande.
  • Il tipo di file è supportato per l'indicizzazione ma si è verificato un errore di indicizzazione per un file specifico.

Anche se varia, la maggior parte dei clienti delle organizzazioni ha meno dell'1% del contenuto in base al volume e meno del 12% del contenuto in base alle dimensioni parzialmente indicizzate. La differenza tra il volume e le dimensioni è che i file di dimensioni maggiori hanno una maggiore probabilità di contenere contenuto che non può essere indicizzato completamente.

Per altre informazioni sugli elementi parzialmente indicizzati in Ricerca contenuto, vedere Analisi di elementi parzialmente indicizzati in Ricerca contenuto.

Consiglio

Se non si è un cliente E5, usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione Portale di conformità di Microsoft Purview. Informazioni dettagliate sull'iscrizione e le condizioni di valutazione.

Dopo aver eseguito una ricerca di eDiscovery, il numero totale e le dimensioni degli elementi parzialmente indicizzati nelle posizioni in cui è stata eseguita la ricerca vengono elencati nelle statistiche dei risultati della ricerca visualizzate nelle statistiche dettagliate per la ricerca. Si noti che questi sono denominati elementi non indicizzati nelle statistiche di ricerca. Di seguito sono riportati alcuni elementi che influiscono sul numero di elementi parzialmente indicizzati restituiti nei risultati della ricerca:

  • Se un elemento è parzialmente indicizzato e corrisponde alla query di ricerca, viene incluso sia nel conteggio (che nelle dimensioni) degli elementi dei risultati della ricerca e negli elementi parzialmente indicizzati. Tuttavia, quando vengono esportati i risultati della stessa ricerca, l'elemento viene incluso solo con un set di risultati della ricerca; non è incluso come elemento parzialmente indicizzato.
  • Gli elementi parzialmente indicizzati che si trovano nei siti di SharePoint e OneDrive non sono inclusi nella stima degli elementi parzialmente indicizzati visualizzati nelle statistiche dettagliate per la ricerca. Tuttavia, gli elementi parzialmente indicizzati possono essere esportati quando si esportano i risultati di una ricerca di eDiscovery. Ad esempio, se si cerca solo nei siti, il numero stimato di elementi parzialmente indicizzati sarà zero.

Calcolo del rapporto di elementi parzialmente indicizzati nell'organizzazione

Per comprendere l'esposizione dell'organizzazione agli elementi parzialmente indicizzati, è possibile eseguire una ricerca di tutto il contenuto in tutte le cassette postali (usando una query di parole chiave vuota). Nell'esempio seguente sono presenti 1.629.904 (146,46 GB) elementi completamente indicizzati e 10.025 (10,27 GB) elementi parzialmente indicizzati.

Esempio di statistiche di ricerca che mostrano elementi parzialmente indicizzati.

È possibile determinare la percentuale di elementi parzialmente indicizzati usando i calcoli seguenti.

Per calcolare il rapporto tra elementi parzialmente indicizzati nell'organizzazione:

(Total number of partially indexed items/Total number of items) x 100

(10025/1629904) x 100 = 0.62%

Usando i risultati della ricerca dell'esempio precedente, lo 0,62% di tutti gli elementi delle cassette postali viene parzialmente indicizzato.

Per calcolare la percentuale delle dimensioni degli elementi parzialmente indicizzati nell'organizzazione:

(Size of all partially indexed items/Size of all items) x 100

(10.27 GB/146.46 GB) x 100 = 7.0%

Nell'esempio precedente, quindi, il 7% delle dimensioni totali degli elementi della cassetta postale proviene da elementi parzialmente indicizzati. Come indicato in precedenza, la maggior parte dei clienti delle organizzazioni ha meno dell'1% del contenuto in base al volume e meno del 12% del contenuto in base alle dimensioni parzialmente indicizzate.

Uso di elementi parzialmente indicizzati

Nei casi in cui è necessario esaminare gli elementi parzialmente indicizzati per verificare che non contengano informazioni rilevanti, è possibile esportare un report di ricerca contenuto contenente informazioni su elementi parzialmente indicizzati. Quando si esporta un report di ricerca contenuto, assicurarsi di scegliere una delle opzioni di esportazione che include elementi parzialmente indicizzati.

Scegliere la seconda o la terza opzione per esportare elementi parzialmente indicizzati.

Quando si esportano i risultati della ricerca di eDiscovery o un report di ricerca usando una di queste opzioni, l'esportazione include un report denominato Unindexed Items.csv. Questo report include la maggior parte delle stesse informazioni del file ResultsLog.csv; Tuttavia, il file di Items.csv non indicizzato include anche due campi correlati agli elementi parzialmente indicizzati: Tag di errore e Proprietà errore. Questi campi contengono informazioni sull'errore di indicizzazione per ogni elemento parzialmente indicizzato. L'uso delle informazioni in questi due campi consente di determinare se l'errore di indicizzazione per un determinato oggetto influisce sull'analisi.

Nota

Il file di Items.csv non indicizzato contiene anche campi denominati Tipo di errore e Messaggio di errore. Si tratta di campi legacy che contengono informazioni simili alle informazioni nei campi Tag di errore e Proprietà errore , ma con informazioni meno dettagliate. È possibile ignorare questi campi legacy in modo sicuro.

I tag di errore sono costituiti da due informazioni, ovvero l'errore e il tipo di file. Ad esempio, in questa coppia errore/tipo file:

 parseroutputsize_xls

parseroutputsize è l'errore e xls è il tipo di file del file in cui si è verificato l'errore. Nei casi in cui il tipo di file non è stato riconosciuto o il tipo di file non è stato applicato all'errore, verrà visualizzato il valore noformat al posto del tipo di file.

Di seguito è riportato un elenco di errori di indicizzazione e una descrizione della possibile causa dell'errore.

Tag di errore Descrizione
attachmentcount
Un messaggio di posta elettronica contiene troppi allegati e alcuni di questi allegati non sono stati elaborati.
attachmentdepth
Il recuperatore di contenuto e il parser di documenti hanno trovato troppi livelli di allegati annidati all'interno di altri allegati. Alcuni di questi allegati non sono stati elaborati.
attachmentrms
La decodifica di un allegato non è riuscita perché è protetta da RMS.
attachmentsize
Un file allegato a un messaggio di posta elettronica era troppo grande e non poteva essere elaborato.
indexingtruncated
Quando si scrive il messaggio di posta elettronica elaborato nell'indice, una delle proprietà indicizzabili è troppo grande ed è stata troncata. Le proprietà troncate sono elencate nel campo Proprietà errore.
invalidunicode
Un messaggio di posta elettronica contiene testo che non può essere elaborato come Unicode valido. L'indicizzazione per questo elemento potrebbe essere incompleta.
parserencrypted
Il contenuto dell'allegato o del messaggio di posta elettronica viene crittografato e Microsoft 365 non è riuscito a decodificare il contenuto.
parsererror
Errore sconosciuto durante l'analisi. Ciò in genere è il risultato di un bug software o di un arresto anomalo del servizio.
parserinputsize
Un allegato era troppo grande per essere gestito dal parser e l'analisi di tale allegato non si è verificata o non è stata completata.
parsermalformed
Un allegato non è valido e non può essere gestito dal parser. Questo risultato può essere dovuto a formati di file obsoleti, file creati da software incompatibile o virus che fingono di essere qualcosa di diverso da richiesto.
parseroutputsize
L'output dell'analisi di un allegato era troppo grande e doveva essere troncato.
parserunknowntype
Un allegato aveva un tipo di file che Non è stato rilevato da Microsoft 365.
parserunsupportedtype
Un allegato aveva un tipo di file che Office 365 poteva rilevare, ma l'analisi di tale tipo di file non è supportata.
propertytoobig
Il valore di una proprietà di posta elettronica in Exchange Store era troppo grande per essere recuperato e il messaggio non poteva essere elaborato. Questo accade in genere solo alla proprietà body di un messaggio di posta elettronica.
retrieverrms
Il recupero del contenuto non è riuscito a decodificare un messaggio protetto da RMS.
wordbreakertruncated
Troppe parole sono state identificate nel documento durante l'indicizzazione. L'elaborazione della proprietà viene arrestata quando si raggiunge il limite e la proprietà viene troncata.

I campi di errore descrivono i campi interessati dall'errore di elaborazione elencato nel campo Tag di errore. Se si esegue la ricerca in una proprietà, ad subject esempio o participants, gli errori nel corpo del messaggio non influiranno sui risultati della ricerca. Ciò può essere utile quando si determina esattamente quali elementi parzialmente indicizzati potrebbe essere necessario analizzare ulteriormente.