Testa en exakt datatyp som matchar känslig information

När din exakta datamatchning (EDM) typ av känslig information (SIT) har skapats och en timme efter att du har verifierat att tabellen för känslig information har laddats upp och indexerats kan du testa att den identifierar den information du vill identifiera med hjälp av testfunktionen i avsnittet För känslig information i efterlevnadscentret.

[! Obs!] Det kan ta lite tid innan ändringar i en redan skapad EDM SIT sprids i systemet. Om du gör ändringar i en EDM-känslig informationstyp för problem med felsökning ska du vänta i minst en timme efter att du har gjort ändringarna innan du använder testfunktionen för att verifiera deras påverkan.

Testa din EDM SIT i efterlevnadscentret

  1. Öppna klassificeringscenter > för dataklassificering > av känsliga informationstyper.

  2. Välj din EDM SIT i listan och välj sedan Testa i det utfällbara fönstret. Det här alternativet finns endast för SIT under typer av känslig information.

  3. Upload ett objekt som innehåller data som du vill identifiera. Skapa till exempel ett objekt som innehåller en delmängd av raderna i tabellen med känslig information. Om du har använt funktionen för konfigurerbar matchning i schemat för att definiera ignorerade avgränsare kontrollerar du att objektet innehåller exempel med och utan avgränsare.

  4. När filen har laddats upp och sökts igenom kontrollerar du om det finns matchningar för din EDM SIT.

  5. Om funktionen Test i SIT upptäcker en matchning kontrollerar du att den inte trimmar den eller extraherar den felaktigt. Genom att exempelvis bara extrahera en understräng av hela strängen ska den identifiera eller bara hämta det första ordet i en sträng med flera ord, eller inkludera extra symboler eller tecken i extrahering. Se Reguljära uttryck – snabbreferens för referensen till reguljära uttryck.

  6. Du kan också använda följande PowerShell-cmdlet:

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

Anteckning

När du skapar eller redigerar en EDM-känslig informationstyp, eller den primära SIT som en EDM-typ baseras på, crawlas allt nytt innehåll och allt nytt innehåll som ändras efter ändringarna av SIT:erna för text som matchar de nya definitionerna, men det befintliga innehållet crawlas inte förrän det ändras eller indexeras om.

För att tvinga fram om crawlning av befintligt innehåll på en SharePoint-webbplats eller i ett bibliotek eller i OneDrive följer du anvisningarna i Manuellt begära crawlning och omindexering av en webbplats, ett bibliotek eller en lista.

Testa EDM SIT i MIP-principer

Du kan se var din EDM SIT används och hur exakt den är i produktionen genom att använda dem i principer:

  1. Skapa en princip för automatisk märkning och kör den i Simuleringsöversikt.

  2. Lägg till visst innehåll som utlöser EDM SIT och visst innehåll som inte utlöser EDM SIT till en plats där policyn övervakas.

  3. Öppna fliken Objekt som ska granskas för att kontrollera matchningarna.

  4. Justera principerna efter behov.

När du är nöjd med resultatet av din testning och justering är din EDM-baserade anpassade SIT redo att användas i informationsskyddsprinciper, som:

Felsökningstips

Om du inte hittar några matchningar kan du prova följande:

  • Bekräfta att känsliga data har laddats upp på rätt sätt med hjälp av kommandona som beskrivs i vägledning av känsliga data med hjälp av EDM-verktyget.

  • Kontrollera att de exempel som du har angett i objektet finns i tabellen för känslig information och att ignorerade avgränsare är korrekta.

  • Testa den SIT du använde när du konfigurerade det primära elementet i vart och ett av dina mönster. Detta bekräftar att SIT kan matcha exemplen i objektet. Att använda en felaktigt definierad SIT som klassificeringselement för en typ av känslig EDM-information är den vanligaste orsaken till identifieringsfel i EDM.

  • Om den SIT du valde för ett primärt element i EDM-typen inte hittar en matchning i objektet eller hittar färre matchningar än du väntat dig, kontrollerar du att den stöder avgränsare som finns i innehållet. Se till att ta med de ignorerade avgränsare som definierats i schemat.

  • Om funktionen Test inte hittar något innehåll alls kontrollerar du om den SIT du valde innehåller krav för ytterligare nyckelord eller andra valideringar. Information om inbyggda SIT:er finns i Definitioner av typen Typ av känslig information och kontrollera vilka minimikraven är för att matcha varje typ.

  • Om testfunktionen fungerar, men SharePoint eller OneDrive-objekt inte identifieras i DLP- eller autolabelingsregler, kontrollerar du om de dokument som du förväntar dig ska matcha visas i Innehållsutforskaren. Om de inte finns där ska du komma ihåg att endast innehåll som skapats efter ändringarna av typen känslig information visas som matchningar. Du måste crawla webbplatser och bibliotek för att befintliga objekt ska visas. I Manuellt begära crawlning och omindexering av en webbplats, ett bibliotek eller en lista finns information om hur du crawlar om SharePoint och OneDrive.

  • Om DLP- eller autolabelingsregler som kräver flera matchningar inte utlöser kontrollerar du att närhetskraven för både din EDM-typ och basberoende informationstyper uppfylls. Om det maximala avståndet mellan det primära elementet och nyckelordet är 300 tecken, men nyckelorden endast finns på den första raden i en lång tabell, är det sannolikt att endast de första raderna med matchande värden uppfyller närhetskraven. Ändra dina SIT-definitioner för att stödja mer närhetsregler eller använd alternativet var som helst i dokumentet för ytterligare bevisvillkor.

  • Om identifiering av en EDM-typ är inkonsekvent eller oregelbunden ska du kontrollera att den typ av känslig information som du använde som bas för det primära elementet i EDM-typen inte identifierar onödigt innehåll. Om en SIT matchar för mycket orelaterat innehåll, som vilket ord som helst, vilket tal som helst, kan alla e-postadresser göra att tjänsten mättar och ignorerar relevanta matchningar. Kontrollera antalet innehållsdelar som matchar den typ av känsligt innehåll som du använder för dina primära element i Innehållsutforskaren. Så här gör du för att uppskatta om SIT matchar för mycket innehåll:

    1. Dividera antalet innehållsobjekt i Innehållsutforskaren med antalet dagar sedan den känsliga typen skapades.
    2. Om antalet matchningar per dag ligger i intervallet på hundratals tusen eller miljoner, är det möjligt att den primära SIT är för bred. Mer information om exakt datamatchning baserade på typer av känslig information finns rekommendationer och metodtips för att välja rätt typ av känslig information för en EDM-typ.
  • Bekräfta att känsliga data har laddats upp på rätt sätt med kommandona som beskrivs i Hash och ladda upp källtabellen för känslig information för att få en exakt matchning av känsliga informationstyper.

  • Om det SIT du valde för ett primärt element i EDM-typen inte hittar en matchning i objektet eller hittar färre matchningar än du väntat dig, kontrollerar du att det har stöd för avgränsare som finns i innehållet. Se till att ta med de ignorerade avgränsare som definierats i schemat.