Filterreferens för anpassad typ av känslig information
I Microsoft kan du definiera filter eller ytterligare kontroller när du skapar anpassade typer av känslig information (SIT).
Lista över filter som stöds och användningsfall
AllDigitsSame Exclude
Beskrivning: Tillåter dig att utesluta matchningar som har alla siffror som dubblettsiffror, t.ex. 111111111 eller 111-111-111
Definiera filter
<Filters id="ssn_filters">
<Filter type="AllDigitsSameFilter"></Filter>
</Filters>
Använda det i regelpaket på entitetsnivån
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85" filters="ssn_filters">
<Pattern confidenceLevel="85">
<IdMatch idRef="Func_ssn" />
</Pattern>
</Entity>
Använda det i regelpaket på mönsternivån
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
<Pattern confidenceLevel="85" filters="ssn_filters">
<IdMatch idRef="Func_ssn" />
</Pattern>
</Entity>
TextMatchFilter StartsWith
Beskrivning: Med den här funktionen kan du definiera starttecken för entiteten. Den har två varianter, inkluderar och exkluderar.
Om du till exempel vill utesluta tal som börjar med 0500, 91, 091, 010 i en lista som den här:
- 0500-4500-027
- 91564721450
- 91-8523697410
- 700-8956-7844
- 1000-3265-9874
- 0100-7892-3012
kan du använda den här xml-koden
<Filters id="phone_number_filters_exc">
<Filter type="TextMatchFilter" direction="StartsWith" logic="Exclude" textProcessorId="Keyword_false_positives_sw">
</Filter>
</Filters>
<Keyword id="Keyword_false_positives_sw">
<Group matchStyle="string">
<Term>0500</Term>
<Term>91</Term>
<Term>091</Term>
<Term>0100</Term>
</Group>
</Keyword>
Om du till exempel vill ta med tal som börjar med 0500, 91, 091, 0100 i en lista så här:
- 0500-4500-027
- 91564721450
- 91-8523697410
- 700-8956-7844
- 1000-3265-9874
- 0100-7892-3012
kan du använda den här xml-koden
<Filters id="phone_filters_inc">
<Filter type="TextMatchFilter" direction="StartsWith" logic="Include" textProcessorId="Keyword_false_positives_sw">
</Filter>
TextMatchFilter EndsWith
Beskrivning: Med den här funktionen kan du definiera sluttecken för entiteten.
Om du till exempel vill utesluta tal som slutar med 0500 91 091, 0100 i en lista som den här:
- 1234567891
- 1234-5678-0091
- 1234.4567.7091
- 1234-8091-4564
kan du använda den här xml-koden
<Filters id="phone_number_filters_exc">
<Filter type="TextMatchFilter" direction="EndsWith" logic="Exclude" textProcessorId="Keyword_false_positives_sw">
</Filter>
<Keyword id="Keyword_false_positives_sw">
<Group matchStyle="string">
<Term>0500</Term>
<Term>91</Term>
<Term>091</Term>
<Term>0100</Term>
</Group>
</Keyword>
Om du till exempel vill ta med tal som slutar med 0500, 91, 091, 0100 i en lista som den här:
- 1234567891
- 1234-5678-0091
- 1234.4567.7091
- 1234-8091-4564
kan du använda den här xml-koden
<Filters id="phone_filters_inc">
<Filter type="TextMatchFilter" direction=" EndsWith" logic="Include" textProcessorId="Keyword_false_positives_sw">
</Filter>
TextMatchFilter Full
Beskrivning: Tillåter att du förhindrar vissa matchningar för att förhindra att de utlöser regeln. Du kan till exempel 4111111111111111 lista över giltiga kreditkortsmatcher.
Om du till exempel vill utesluta kreditkortsnummer som 4111111111111111 och 3241891031113111 en lista så här:
- 4485 3647 3952 7352
- 4111111111111111
- 3241891031113111
kan du använda den här xml-koden
<Filters id="cc_number_filters_exc">
<Filter type="TextMatchFilter" direction="Full" logic="Exclude" textProcessorId="Keyword_false_positives_full">
</Filter>
<Keyword id="Keyword_false_positives_full">
<Group matchStyle="string">
<Term>4111111111111111</Term>
<Term>3241891031113111</Term>
</Group>
</Keyword>
Om du till exempel vill ta med kreditkortsnummer som 4111111111111111 och 3241891031113111 i en lista så här:
- 4485 3647 3952 7352
- 4111111111111111
- 3241891031113111
kan du använda den här xml-koden
<Filters id="cc_filters_inc">
<Filter type="TextMatchFilter" direction="Full" logic="Include" textProcessorId="Keyword_false_positives_full">
</Filter>
TextMatchfilter-prefix
Beskrivning: Med den här funktionen kan du definiera de föregående tecknen som alltid ska tas med eller utelämnas. Om kreditkortsnumret exempelvis föregås av "Order-ID", tar du bort matchningen från de giltiga matchningarna.
Om du till exempel vill utesluta förekomster av telefonnummer som har Telefon och ringer mig på strängar före telefonnumret, i en lista som den här:
- telefonnummer 091-8974-653278
- Telefon 124576532-123
- 45-124576532-123
kan du använda den här xml-koden
<Filters id="cc_number_filters_exc">
<Filter type="TextMatchFilter" direction="Prefix" logic="Exclude" textProcessorId="Keyword_false_positives_prefix">
</Filter>
<Keyword id="Keyword_false_positives_prefix">
<Group matchStyle="string">
<Term>phone number</Term>
<Term>call me at</Term>
</Group>
</Keyword>
Om du till exempel vill ta med förekomster som har kreditkorts- och kortnummersträngar före kreditkortsnumret, i en lista som den här:
- Kreditkort 45-124576532-123
- 45-124576532-123 (vilket kan vara telefonnummer)
kan du använda den här xml-koden
<Filters id="cc_filters_inc">
<Filter type="TextMatchFilter" direction="Full" logic="Include" textProcessorId="Keyword_true_positives_prefix">
</Filter>
<Keyword id="Keyword_true_positives_prefix">
<Group matchStyle="string">
<Term>credit card</Term>
<Term>card #</Term>
</Group>
</Keyword
TextMatchFilter-suffix
Beskrivning: Med den här beskrivningen kan du definiera följande tecken som alltid ska inkluderas eller undantas. Om kreditkortsnummer följs av "/xuid" tar du bort matchningen från de giltiga matchningarna.
Till exempel översta exkludera förekomster om det finns ytterligare 5 förekomster av fyra siffror som suffix i en lista som den här:
- 1234-5678-9321 4500 9870 6321 48925566
- 1234-5678-9321
kan du använda den här xml-koden
<Filters id="cc_number_filters_exc">
<Filter type="TextMatchFilter" direction="Prefix" logic="Exclude" textProcessorId="Regex_false_positives_suffix">
</Filter>
<Regexid="Regex_false_positives_suffix">(\d{4}){5,}</Regex>
Om du till exempel vill utesluta förekomster om de följs av /xuidsuffix, som ett i den här listan:
- 1234-5678-9321 /xuid
- 1234-5678-9321
kan du använda den här xml-koden
''xml
/xuid
For example, to include an occurrence only if it is followed by **cvv** or **expires**, like two in this list:
- 45-124576532-123
- 45-124576532-123 cvv 966
- 45-124576532-123 expires 03/23
you can use this xml
```xml
<Filters id="cc_filters_inc">
<Filter type="TextMatchFilter" direction="Full" logic="Include" textProcessorId="Keyword_true_positives_suffix">
</Filter>
<Keyword id="Keyword_true_positives_suffix">
<Group matchStyle="string">
<Term>cvv</Term>
<Term>expires</Term>
</Group>
</Keyword>
Använda filter i regelpaket
Filter kan definieras på hela SIT eller på ett mönster. Här är några exempel på kodavsnitt.
På nivå med känslig information
Filter hos Entitet – täcker alla underordnade mönster
Filtren används på alla instanser som klassificeras av något av mönster i den entitet/känslig typ
<Entity id="6443b88f-2808-482a-8e1a-3ae5026645e1" patternsProximity="300" recommendedConfidence="85" filters="CompositeFiltersAtEntityLevel">
<Pattern confidenceLevel="85">
<IdMatch idRef="Regex_denmark_id" />
</Pattern>
</Entity>
På det enskilda mönstret i typnivån för känslig information
Filtrerar bara på mönsternivån.
Filtret används för de instanser som matchas av mönstret.
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
<Pattern confidenceLevel="85" filters="CompositeFiltersAtPattern">
<IdMatch idRef="Keyword_cc_verification" />
</Pattern>
</Entity>
På typsnivå för känslig information och ett ytterligare filter på vissa av mönster i den enheten
Filter för Entitet + mönster
Filtren används på alla instanser som klassificeras av något av mönster i den enheten/den känsliga typen. Filtret på mönsternivån filtrerar de instanser som matchas av det mönstret.
<Entity id="6443b88f-2808-482a-8e1a-3ae5026645e1" patternsProximity="300" recommendedConfidence="85" filters="CompositeFiltersAtEntityLevel">
<Pattern confidenceLevel="85" filters="CompositeFiltersAtPattern">
<IdMatch idRef="Regex_denmark_id" />
</Pattern>
</Entity>