Skapa exakta datamatchnings typ av känslig information/regelpaket
Du kan skapa exakt samma datatyp (EDM) för känslig information (SIT) med hjälp av EDM-schemat och SIT-guiden i efterlevnadscentret eller skapa XML-filen för regelpaketet manuellt. Du kan också kombinera båda med en metod för att skapa schemat och senare redigera det med den andra metoden.
Om du inte är bekant med EDM-baserad SITS eller deras implementering bör du bekanta dig med:
- Mer information om typer av känslig information
- Läs om exakta datamatchningsbaserade typer av känslig information
- Kom igång med exakta datamatchningsbaserade typer av känslig information
Använda EDM-schemat och SIT-guiden
Du kan använda den här guiden till att skapa SIT-filer (Sensitive Information Type) för att förenkla processen.
En typ av EDM-känslig information består av ett eller flera mönster. Varje mönster beskriver en kombination av bevis (fält från schemat) som ska användas för att identifiera känsligt innehåll i ett dokument eller e-postmeddelande.
Förutsättningar
Utför stegen i följande artiklar:
- Exportera källdata för exakta datamatchningsbaserad typ av känslig information
- Skapa schemat för exakta datamatchningsbaserade typer av känslig information
- Hash och ladda upp källtabellen för känslig information för exakta datamatchnings typer av känslig information
- Oavsett om du skapar en EDM-känslig informationstyp med hjälp av guiden eller XML-filen för regelpaket via PowerShell måste du ha administratörsbehörigheten Global administratör eller Efterlevnad för att skapa, testa och distribuera en anpassad typ av känslig information via användargränssnittet. Läs mer i Om administratörsroller i Office 365.
- Identifiera en av de inbyggda SITs som ska användas som primärelement känslig informationstyp.
- Om ingen av de inbyggda typerna av känslig information matchar data i kolumnen du valde måste du skapa en anpassad typ av känslig information.
- Om du valde alternativet Ignorerade avgränsare för kolumnen för det primära elementet i schemat ska du kontrollera att den anpassade SIT du skapar matchar data med och utan de markerade avgränsarna.
- Om du använder en inbyggd SIT kontrollerar du att den identifierar exakt de strängar du vill välja och inte inkludera några omgivande tecken eller exkluderar giltiga delar av strängen som de lagras i tabellen med känslig information.
Se Definitioner av typen Känslig information och Komma igång med anpassade typer av känslig information.
Använda Exact Data Match-schemat och mönsterguiden för typ av känslig information
I Microsoft 365 Efterlevnadscenter för klientorganisationen går du till Dataklassificering > Exakta datamatchningar.
Välj EDM-typer av känslig information och Skapa EDM-typ av känslig information för att öppna konfigurationsguiden för känsliga informationstyper.
Välj Välj ett befintligt EDM-schema och välj schemat som du skapade i Skapa schemat för exakt datamatchning baserat på typer av känslig information.
Välj Nästa och Skapa mönster.
Välj Konfidensnivå och Primärt element. Mer information om konfidensnivåer finns i Läs mer om typer av känslig information.
Välj det Primära elementets typ av känslig information som du vill associera det med för att definiera vilken text i dokumentet som ska jämföras med alla värden i det primära elementfältet. Se Entitetsdefinitioner för typ av känslig information för läsa mer om de tillgängliga typerna av känslig information.
Viktigt
Välj en typ av känslig information som matchar formatet på det innehåll du vill söka efter. Om du väljer en typ av känslig information som matchar onödigt innehåll, t.ex. en som matchar alla textsträngar eller alla tal, kan det leda till överflödig belastning i systemet, vilket kan leda till att känslig information missas. Se avsnittet Metodtips i introduktionen till artikeln om exakt datamatchning i den här dokumentationen för rekommendationer om hur du väljer en typ av känslig information som ska användas här.
Välj stödelement och matchningsalternativ.
Välj Klar och Nästa.
Välj önskad Konfidensnivå och teckennärhet. Det här blir standardvärdet för hela EDM-känslig informationstyp.
Välj Skapa mönster om du vill skapa ytterligare mönster för din typ av EDM-känslig information.
Välj Nästa och fyll i ett Namn och en Beskrivning för administratörer.
Granska och välj Skicka.
Redigera eller ta bort mönster för känslig informationstyp
Öppna efterlevnadscenterDataklassificeringExakta > > datamatchning.
Välj EDM-typer av känslig information.
Välj den EDM SIT som du vill redigera.
Välj Redigera EDM-känslig informationstyp eller Ta bort typ av känslig EDM-information från den utfällbara sidan.
Skapa ett regelpaket manuellt
I den här proceduren visas hur du skapar en fil i XML-format som kallas ett regelpaket (med Unicode-kodning) och sedan laddar upp det till Microsoft 365 med PowerShell-cmdlets för efterlevnadscentret.
Anteckning
Om SIT som du mappar till kan identifiera multiords-korroborativa bevis kan de sekundära element som du definierar i ett manuellt skapat regelpaket mappas till SIT. Namnet matchar John Smith till exempel inte som ett sekundärt element John Smith John Smith eftersom vi skulle jämföra och hitta det i innehållet separat med termen som laddats upp i ett av fälten, om det korroativa bevisfältet inte har mappats till en SIT som kan identifiera det mönstret.
Det finns en gräns på 10 regelpaket i en Microsoft 365 klientorganisation. Eftersom ett regelpaket kan innehålla ett godtyckligt antal typer av känslig information kan du undvika att skapa ett nytt regelpaket varje gång du vill definiera en ny typ av känslig information med den här metoden. Exportera i stället ett befintligt regelpaket och lägg till dina typer av känslig information i XML innan du laddar upp det på nytt.
Skapa ett regelpaket i XML-format (med Unicode-kodning), ungefär som i följande exempel. (Du kan kopiera, ändra och använda vårt exempel.)
När du har ställt in regelpaketet ska du se till att referera till din tabellfil .csv, .tsv eller pipe (|) korrekt avgränsad tabellfil för känslig information och edm.xmlschemafil . Du kan kopiera, ändra och använda vårt exempel. I det här exempelfältet måste följande fält anpassas för att skapa den känsliga EDM-typen:
RulePack id och ExactMatch id: Använd New-GUID för att generera ett GUID.
Datastore: Det här fältet anger vilket datalager för EDM-sökning som ska användas. Du anger namnet på datakällan för det konfigurerade EDM-schemat.
idMatch: Det här fältet pekar på det primära elementet för EDM.
Matchningar: Anger vilket fält som ska användas i exakt sökning. Ange ett sökbart fältnamn i EDM-schemat för DataStore.
Klassificering: Det här fältet anger typ av känslig information som utlöser EDM-sökning. Du kan använda namnet eller GUID för en befintlig inbyggd eller anpassad typ av känslig information.
Anteckning
Observera att alla strängar som matchar DEN SIT som angetts kommer att hashtaggas och jämföras med varje post i tabellen för känslig informationskälla. Undvik prestandaproblem om du väljer en anpassad SIT för klassificeringselementet genom att inte använda en som matchar en stor andel av innehållet. Exempel: ett tal som matchar "valt antal" eller "valt fembokstavsord". Du kan särskilja den genom att lägga till kompletterande nyckelord eller inkludera formatering i definitionen av den anpassade klassificerings-SIT.
Matchning: Det här fältet pekar på ytterligare bevis som finns nära idMatchning.
Matchningar: Du anger ett fältnamn i EDM-schema för DataStore.
Resurs-idRef: Det här avsnittet anger namn och beskrivning för känslig typ på flera språk
- Du anger GUID för ExactMatch-ID.
- Namn & beskrivning: anpassa efter behov.
<RulePackage xmlns="http://schemas.microsoft.com/office/2018/edm"> <RulePack id="fd098e03-1796-41a5-8ab6-198c93c62b11"> <Version build="0" major="2" minor="0" revision="0" /> <Publisher id="eb553734-8306-44b4-9ad5-c388ad970528" /> <Details defaultLangCode="en-us"> <LocalizedDetails langcode="en-us"> <PublisherName>IP DLP</PublisherName> <Name>Health Care EDM Rulepack</Name> <Description>This rule package contains the EDM sensitive type for health care sensitive types.</Description> </LocalizedDetails> </Details> </RulePack> <Rules> <ExactMatch id = "E1CC861E-3FE9-4A58-82DF-4BD259EAB371" patternsProximity = "300" dataStore ="PatientRecords" recommendedConfidence = "65" > <Pattern confidenceLevel="65"> <idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" /> </Pattern> <Pattern confidenceLevel="75"> <idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" /> <Any minMatches ="3" maxMatches ="6"> <match matches="PatientID" /> <match matches="MRN"/> <match matches="FirstName"/> <match matches="LastName"/> <match matches="Phone"/> <match matches="DOB"/> </Any> </Pattern> </ExactMatch> <LocalizedStrings> <Resource idRef="E1CC861E-3FE9-4A58-82DF-4BD259EAB371"> <Name default="true" langcode="en-us">Patient SSN Exact Match.</Name> <Description default="true" langcode="en-us">EDM Sensitive type for detecting Patient SSN.</Description> </Resource> </LocalizedStrings> </Rules> </RulePackage>
Upload regelpaketet genom att köra följande PowerShell-kommando:
New-DlpSensitiveInformationTypeRulePackage -FileData ([System.IO.File]::ReadAllBytes('.\\rulepack.xml'))
Anteckning
Syntaxen för regelpaketsfilen är densamma som för andra typer av känslig information. Skapa en anpassad typ av känslig information med PowerShell för fullständig information om syntaxen för regelpaketfilen och för ytterligare konfigurationsalternativ och anvisningar om hur du ändrar och tar bort typer av känslig information med Hjälp av PowerShell.