Undersøger delvist indekserede elementer i eDiscovery

Bemærk

Microsoft 365 overholdelse af angivne standarder kaldes nu Microsoft Purview, og løsningerne inden for overholdelsesområdet er blevet omdøbt. Du kan få flere oplysninger om Microsoft Purview i blogmeddelelsen.

En eDiscovery-søgning, som du kører fra Microsoft Purview-compliance-portal inkluderer automatisk delvist indekserede elementer i de anslåede søgeresultater, når du kører en søgning. Delvist indekserede elementer er Exchange postkasseelementer og dokumenter på SharePoint og OneDrive for Business websteder, der af en eller anden grund ikke er fuldt indekseret til søgning. De fleste mails og webstedsdokumenter indekseres, fordi de falder inden for indekseringsgrænserne for mails. Nogle elementer kan dog overskride disse indekseringsgrænser og vil blive delvist indekseret. Her er andre årsager til, at elementer ikke kan indekseres til søgning og returneres som delvist indekserede elementer, når du kører en eDiscovery-søgning:

  • Mails har en vedhæftet fil, der ikke kan åbnes. dette er den mest almindelige årsag til delvist indekserede mailelementer.

  • Der er knyttet for mange filer til en mail.

  • En fil, der er knyttet til en mail, er for stor.

  • Filtypen understøttes til indeksering, men der opstod en indekseringsfejl for en bestemt fil.

Selvom det varierer, har de fleste organisationers kunder mindre end 1 % indhold efter volumen og mindre end 12 % af indholdet efter størrelse, der er delvist indekseret. Årsagen til forskellen mellem diskenheden i forhold til størrelsen er, at større filer har en højere sandsynlighed for at indeholde indhold, der ikke kan indekseres fuldstændigt.

Når du har kørt en eDiscovery-søgning, vises det samlede antal og den samlede størrelse af delvist indekserede elementer på de placeringer, der blev søgt på, i søgeresultatstatistikken, som vises i den detaljerede statistik for søgningen. Bemærk, at disse kaldes ikke-indekserede elementer i søgestatistikken. Her er et par ting, der påvirker antallet af delvist indekserede elementer, der returneres i søgeresultaterne:

  • Hvis et element er delvist indekseret og stemmer overens med søgeforespørgslen, medtages det både i antallet (og størrelsen) af søgeresultatelementer og delvist indekserede elementer. Men når resultaterne af den samme søgning eksporteres, medtages elementet kun sammen med et sæt søgeresultater. det er ikke inkluderet som et delvist indekseret element.

  • Delvist indekserede elementer, der er placeret på SharePoint og OneDrive websteder, medtages ikke i estimatet af delvist indekserede elementer, der vises i den detaljerede statistik for søgningen. Delvist indekserede elementer kan dog eksporteres, når du eksporterer resultaterne af en eDiscovery-søgning. Hvis du f.eks. kun søger på websteder, vil det anslåede antal delvist indekserede elementer være nul.

Beregning af forholdet mellem delvist indekserede elementer i din organisation

Hvis du vil forstå din organisations eksponering for delvist indekserede elementer, kan du køre en søgning efter alt indhold i alle postkasser (ved hjælp af en tom nøgleordsforespørgsel). I følgende eksempel er der 1.629.904 (146,46 GB) fuldt indekserede elementer og 10.025 (10.27 GB) delvist indekserede elementer.

Eksempel på søgestatistik, der viser delvist indekserede elementer.

Du kan bestemme procentdelen af delvist indekserede elementer ved hjælp af følgende beregninger.

Sådan beregner du forholdet mellem delvist indekserede elementer i din organisation:

(Total number of partially indexed items/Total number of items) x 100

(10025/1629904) x 100 = 0.62%

Ved hjælp af søgeresultaterne fra det forrige eksempel indekseres 0,62 % af alle postkasseelementer delvist.

Sådan beregner du procentdelen af størrelsen af delvist indekserede elementer i din organisation:

(Size of all partially indexed items/Size of all items) x 100

(10.27 GB/146.46 GB) x 100 = 7.0%

I det forrige eksempel er 7 % af den samlede størrelse af postkasseelementer fra delvist indekserede elementer. Som tidligere nævnt har de fleste organisationers kunder mindre end 1 % indhold efter volumen og mindre end 12 % af indholdet efter størrelse, der er delvist indekseret.

Arbejde med delvist indekserede elementer

Hvis du har brug for at undersøge delvist indekserede elementer for at bekræfte, at de ikke indeholder relevante oplysninger, kan du eksportere en indholdssøgningsrapport , der indeholder oplysninger om delvist indekserede elementer. Når du eksporterer en indholdssøgningsrapport, skal du sørge for at vælge en af de eksportindstillinger, der indeholder delvist indekserede elementer.

Vælg den anden eller tredje indstilling for at eksportere delvist indekserede elementer.

Når du eksporterer eDiscovery-søgeresultater eller en søgerapport ved hjælp af en af disse indstillinger, inkluderer eksporten en rapport med navnet Unindexed Items.csv. Denne rapport indeholder de fleste af de samme oplysninger som ResultsLog.csv-filen. Unindexed Items.csv-filen indeholder dog også to felter, der er relateret til delvist indekserede elementer: Fejlkoder og fejlegenskaber. Disse felter indeholder oplysninger om indekseringsfejlen for hvert delvist indekserede element. Hvis du bruger oplysningerne i disse to felter, kan det hjælpe dig med at afgøre, om indekseringsfejlen for en bestemt påvirker din undersøgelse eller ej.

Bemærk

Unindexed Items.csv-filen indeholder også felter med navnet Fejltype og Fejlmeddelelse. Disse er ældre felter, der indeholder oplysninger, der ligner oplysningerne i felterne Fejlkoder og Fejlegenskaber , men med mindre detaljerede oplysninger. Du kan trygt ignorere disse ældre felter.

Fejlkoder består af to oplysninger, fejlen og filtypen. I dette fejl-/filtypepar kan du f.eks.:

 parseroutputsize_xls

parseroutputsize er fejlen og xls er filtypen for den fil, som fejlen opstod på. I de tilfælde, hvor filtypen ikke blev genkendt, eller filtypen ikke blev anvendt på fejlen, får du vist værdien noformat i stedet for filtypen.

Følgende er en liste over indekseringsfejl og en beskrivelse af den mulige årsag til fejlen.

Fejlkode Beskrivelse
attachmentcount
En mail indeholdt for mange vedhæftede filer, og nogle af disse vedhæftede filer blev ikke behandlet.
attachmentdepth
Indholdsudskifteren og dokumentparseren fandt for mange niveauer af vedhæftede filer indlejret i andre vedhæftede filer. Nogle af disse vedhæftede filer blev ikke behandlet.
attachmentrms
En vedhæftet fil kunne ikke afkodes, fordi den var RMS-beskyttet.
attachmentsize
En fil, der er knyttet til en mail, var for stor og kunne ikke behandles.
indexingtruncated
Når du skriver den behandlede mail til indekset, var en af de egenskaber, der kan indekseres, for stor og afkortet. De afkortede egenskaber er angivet i feltet Fejlegenskaber.
invalidunicode
En mail indeholdt tekst, der ikke kunne behandles som gyldig Unicode. Indekseringen af dette element er muligvis ufuldstændig.
parserencrypted
Indholdet af den vedhæftede fil eller mail er krypteret, og Microsoft 365 kunne ikke afkode indholdet.
parsererror
Der opstod en ukendt fejl under parsing. Dette skyldes typisk en softwarefejl eller et nedbrud af tjenesten.
parserinputsize
En vedhæftet fil var for stor til, at fortolkeren kunne håndtere den, og fortolkning af den vedhæftede fil blev ikke udført eller blev ikke fuldført.
parsermalformed
En vedhæftet fil er forkert udformet og kunne ikke håndteres af fortolkeren. Dette resultat kan skyldes gamle filformater, filer oprettet af inkompatibel software, eller virus foregiver at være noget andet end hævdede.
parseroutputsize
Outputtet fra fortolkning af en vedhæftet fil var for stort og skulle afkortes.
parserunknowntype
En vedhæftet fil havde en filtype, som Microsoft 365 ikke kunne registrere.
parserunsupportedtype
En vedhæftet fil havde en filtype, som Office 365 kunne registrere, men fortolkning af denne filtype understøttes ikke.
propertytoobig
Værdien af en mailegenskab i Exchange Store var for stor til at blive hentet, og meddelelsen kunne ikke behandles. Dette sker typisk kun for brødtekstegenskaben for en mail.
retrieverrms
Indholdsud hentefunktionen kunne ikke afkode en RMS-beskyttet meddelelse.
wordbreakertruncated
Der blev identificeret for mange ord i dokumentet under indekseringen. Behandlingen af egenskaben stoppede, da grænsen blev nået, og egenskaben afkortes.

Fejlfelter beskriver, hvilke felter der påvirkes af den behandlingsfejl, der er angivet i feltet Fejlkoder. Hvis du søger i en egenskab, f.eks subject . eller participants, påvirker fejl i meddelelsens brødtekst ikke søgeresultaterne. Dette kan være nyttigt, når du skal finde ud af, præcis hvilke delvist indekserede elementer du skal undersøge nærmere.

Se også

Delvist indekserede elementer i eDiscovery