Exchange Server中的敏感信息类型

数据丢失预防 (DLP) 包含 80 种现成的可供您在 DLP 策略中使用的敏感信息类型。 本主题列出了所有这些敏感信息类型,并显示 DLP 策略在检测到每种类型时查找的内容。 敏感信息类型通过正则表达式或函数可以识别的模式定义。 此外,关键字和校验和等确凿的证据可用于识别敏感信息类型。 可信度和相似度也会在评估过程中使用。

ABA 银行代号

格式:九位数字,可能采用格式化或未格式化模式。

模式

格式 化:

  • 四个数字,以 0、 1、 2、 3、 6、 7 或 8 开头

  • 一个连字符

  • 四个数字

  • 一个连字符

  • 一个数字

无格式:以 0、1、2、3、6、7 或 8 开头的 9 个连续数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_aba_routing 找到与该模式匹配的内容。

  • 找到 Keyword_ABA_Routing 中的一个关键字。

<!-- ABA Routing Number -->
<Entity id="cb353f78-2b72-4c3c-8827-92ebe4f69fdf" patternsProximity="300" recommendedConfidence="75">
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_aba_routing" />
        <Match idRef="Keyword_ABA_Routing" />
      </Pattern>
 </Entity>

关键字

Keyword_ABA_Routing
阿坝
aba #
aba routing #
aba routing number
阿坝#
abarouting#
aba number
abaroutingnumber
american bank association routing #
american bank association routing number
americanbankassociationrouting#
americanbankassociationroutingnumber
bank routing number
银行路由#
bank routing number
routing transit number
RTN

阿根廷国家身份证 (DNI) 号

格式:以句点分隔的八位数字

模式:八位数字:

  • 两个数字

  • 一个点

  • 三个数字

  • 一个点

  • 三个数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_argentina_national_id 查找与模式匹配的内容。

  • 找到 Keyword_argentina_national_id 中的一个关键字。

<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
      <IdMatch idRef="Regex_argentina_national_id"/>
      <Match idRef="Keyword_argentina_national_id"/>
  </Pattern>
</Entity>

关键字

Keyword_argentina_national_id
Argentina National Identity number
标识
身份证
DNI
NIC 国家人员登记处
Documento Nacional de Identidad
Registro Nacional de las Personas
Identidad
Identificación

澳大利亚银行帐号

格式:带或不带银行州分行编号的 6-10 位数字

模式:帐号为 6-10 位。 澳大利亚银行州级分部编号:

  • 三位数字

  • 连字符

  • 三位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_australia_bank_account_number 查找与模式匹配的内容。

  • 找到 Keyword_australia_bank_account_number 中的一个关键字。

  • 正则表达式 Regex_australia_bank_account_number_bsb 查找与模式匹配的内容。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_australia_bank_account_number 查找与模式匹配的内容。

  • 找到 Keyword_australia_bank_account_number 中的一个关键字。

<!-- Australia Bank Account Number -->
<Entity id="74a54de9-2a30-4aa0-a8aa-3d9327fc07c7" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_australia_bank_account_number" />
        <Match idRef="Keyword_australia_bank_account_number" />
        <Match idRef="Regex_australia_bank_account_number_bsb" />
  </Pattern>
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_australia_bank_account_number" />
        <Match idRef="Keyword_australia_bank_account_number" />
  </Pattern>
 </Entity>

关键字

Keyword_australia_bank_account_number
swift bank code
correspondent bank
base currency
usa account
holder address
bank address
information account
fund transfers
bank charges
bank details
banking information
full names
想法

澳大利亚驾驶证号码

格式:九个字母和数字

模式:九个字母和数字:

  • 两位数字或字母(不区分大小写)

  • 两位数字

  • 五位数字或字母(不区分大小写)

    OR

  • 1-2 个可选字母(不区分大小写)

  • 4-9 位数字

    OR

  • 九个数字或字母(不区分大小写)

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_australia_drivers_license_number 查找与模式匹配的内容。

  • 找到 Keyword_australia_drivers_license_number 中的一个关键字。

  • 找不到关键字 (keyword) Keyword_australia_drivers_license_number_exclusions

<!-- Australia Drivers License Number -->
<Entity id="1cbbc8f5-9216-4392-9eb5-5ac2298d1356" patternsProximity="300" recommendedConfidence="75">
   <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_australia_drivers_license_number" />
        <Match idRef="Keyword_australia_drivers_license_number" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_australia_drivers_license_number_exclusions" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_australia_drivers_license_number Keyword_australia_drivers_license_number_exclusions
international driving permits
australian automobile association
悉尼新南威尔士州
international driving permit
DriverLicence
DriverLicences
Driver Lic
Driver Licence
Driver Licences
DriversLic
DriversLicence
DriversLicences
Drivers Lic
Drivers Lics
Drivers Licence
Drivers Licences
Driver'Lic
Driver'Lics
驾照
驾照
Driver' Lic
Driver' Lics
Driver' Licence
Driver' Licences
Driver'sLic
Driver'sLics
Driver'sLicence
Driver'sLicences
Driver's Lic
Driver's Lics
Driver's Licence
Driver's Licences
DriverLic#
DriverLics#
DriverLicence#
DriverLicences#
Driver Lic#
Driver Lics#
Driver Licence#
Driver Licences#
DriversLic#
DriversLics#
DriversLicence#
DriversLicences#
Drivers Lic#
Drivers Lics#
Drivers Licence#
Drivers Licences#
Driver'Lic#
Driver'Lics#
驾照#
驾照#
Driver' Lic#
Driver' Lics#
Driver' Licence#
Driver' Licences#
Driver'sLic#
Driver'sLics#
Driver'sLicence#
Driver'sLicences#
Driver's Lic#
Driver's Lics#
Driver's Licence#
Driver's Licences#
Aaa
DriverLicense
DriverLicenses
Driver License
Driver Licenses
DriversLicense
DriversLicenses
Drivers License
Drivers Licenses
驾照
驾照
Driver' License
Driver' Licenses
Driver'sLicense
Driver'sLicenses
Driver's License
Driver's Licenses
DriverLicense#
DriverLicenses#
Driver License#
Driver Licenses#
DriversLicense#
DriversLicenses#
Drivers License#
Drivers Licenses#
驾照#
驾照#
Driver' License#
Driver' Licenses#
Driver'sLicense#
Driver'sLicenses#
Driver's License#
Driver's Licenses#

澳大利亚医疗帐号

格式:10-11 位数字

模式:10-11 位数字:

  • 第一个数字范围为 2-6

  • 第九个数字是校验位

  • 第十个数字是问题数字

  • 第十一个数字(可选)是个人号码

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 95% 确信它检测到这种类型的敏感信息:

  • 函数 Func_australian_medical_account_number 找到与该模式匹配的内容。

  • 找到 Keyword_Australia_Medical_Account_Number 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_australian_medical_account_number 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Australia Medical Account Number -->
<Entity id="104a99a0-3d3b-4542-a40d-ab0b9e1efe63" recommendedConfidence="85" patternsProximity="300">
    <Pattern confidenceLevel="95">
     <IdMatch idRef="Func_australian_medical_account_number"/>
     <Any minMatches="1">
     <Match idRef="Keyword_Australia_Medical_Account_Number"/>
     </Any>
  </Pattern>
<Pattern confidenceLevel="85">
     <IdMatch idRef="Func_australian_medical_account_number"/>
     <Any minMatches="0" maxMatches="0">
  <Match idRef="Keyword_Australia_Medical_Account_Number"/>
     </Any>
  </Pattern>
</Entity>

关键字

Keyword_Australia_Medical_Account_Number
bank account details
medicare payments
mortgage account
bank payments
information branch
credit card loan
department of human services
local service
医疗

澳大利亚护照号

格式:字母后跟七位数字

模式:字母 (不区分大小写) 后跟七位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_australia_passport_number 查找与模式匹配的内容。

  • 找到或 的Keyword_passportKeyword_australia_passport_number关键字 (keyword) 。

<!-- Australia Passport Number -->
<Entity id="29869db6-602d-4853-ab93-3484f905df50" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_australia_passport_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_passport" />
          <Match idRef="Keyword_australia_passport_number" />
        </Any>
   </Pattern>
</Entity>

关键字

Keyword_passport Keyword_australia_passport_number
Passport Number
Passport No
Passport #
护照#
PassportID
Passportno
passportnumber
パスポート
パスポート番号
パスポートのNum
パスポート #
Numéro de passeport
Passeport n °
Passeport Non
Passeport #
Passeport#
PasseportNon
Passeportn °
护照
passport details
immigration and citizenship
commonwealth of australia
department of immigration
residential address
department of immigration and citizenship
签证
national identity card
passport number
travel document
issuing authority

澳大利亚税号

格式:8-9 位数字

模式:8-9 位数字通常显示空格,如下所示:

  • 三位数字

  • 可选空格

  • 三位数字

  • 可选空格

  • 2-3 位数字,最后一位数字是校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 95% 确信它检测到这种类型的敏感信息:

  • 函数 Func_australian_tax_file_number 找到与该模式匹配的内容。

  • 找到 Keyword_Australia_Tax_File_Number 中的一个关键字。

  • 找不到关键字 (keyword) Keyword_number_exclusions

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_australian_tax_file_number 找到与该模式匹配的内容。

  • 找不到或 的Keyword_Australia_Tax_File_NumberKeyword_number_exclusions关键字 (keyword) 。

  • 校验和通过。

<!-- Australia Tax File Number -->
<Entity id="e29bc95f-ff70-4a37-aa01-04d17360a4c5" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="95">
        <IdMatch idRef="Func_australian_tax_file_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_Australia_Tax_File_Number" />
        </Any>
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_number_exclusions" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_australian_tax_file_number" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_Australia_Tax_File_Number" />
          <Match idRef="Keyword_number_exclusions" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_Australia_Tax_File_Number Keyword_number_exclusions
australian business number
marginal tax rate
medicare levy
portfolio number
service veterans
withholding tax
individual tax return
tax file number
00000000
11111111
22222222
33333333
44444444
55555555
66666666
77777777
88888888
99999999
000000000
111111111
222222222
333333333
444444444
555555555
666666666
777777777
888888888
999999999
0000000000
1111111111
2222222222
3333333333
4444444444
5555555555
6666666666
7777777777
8888888888
9999999999

比利时国家号码

格式:11 位数字加上分隔符

模式:11 位数字加上分隔符:

  • 六个数字加两个点,采用格式 YY.MM.DD,代表出生日期

  • 一个连字符

  • 三个连续的数字(男性用奇数,女性用偶数)

  • 一个点

  • 两个数字,是校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_belgium_national_number 找到与该模式匹配的内容。

  • 找到 Keyword_belgium_national_number 中的一个关键字。

  • 校验和通过。

<!-- Belgium National Number -->
  <Entity id="fb969c9e-0fd1-4b18-8091-a2123c5e6a54" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_belgium_national_number"/>
     <Match idRef="Keyword_belgium_national_number"/>
  </Pattern>
</Entity>

关键字

Keyword_belgium_national_number
标识
注册
识别
ID
Identiteitskaart
Registratie nummer
Identificatie nummer
Identiteit
Registratie
Identificatie
Carte d'identité
numéro d'immatriculation
numéro d'identification
identité
题词
标识
Identifizierung
Identifikationsnummer
Personalausweis
Registrierung
Registrationsnummer

格式:14 位数字,包括注册号、分支号和检查位以及分隔符

模式:14 位数字,加上分隔符:

  • 两个数字

  • 一个点

  • 三个数字

  • 一个点

  • 三个数字(前 8 位数是注册号)

  • 正斜杠

  • 四位分行号码

  • 一个连字符

  • 检查位的两位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_brazil_cnpj 找到与该模式匹配的内容。

  • 找到 Keyword_brazil_cnpj 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_brazil_cnpj 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Brazil Legal Entity Number (CNPJ) -->
<Entity id="9b58b5cd-5e90-4df6-b34f-1ebcc88ceae4" recommendedConfidence="85" patternsProximity="300">
   <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_brazil_cnpj"/>
     <Match idRef="Keyword_brazil_cnpj"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_brazil_cnpj"/>
  </Pattern>
</Entity>

关键字

Keyword_brazil_cnpj
CNPJ
CNPJ/MF
CNPJ-MF
National Registry of Legal Entities
Taxpayers Registry
Legal entity
Legal entities
Registration Status
商业版
公司
CNPJ
Cadastro Nacional da Pessoa Jurídica
Cadastro Geral de Contribuintes
CGC
Pessoa jurídica
Pessoas jurídicas
Situação cadastral
Inscrição
Empresa

巴西 CPF 号码

格式:包含检查位数的 11 位数字,可以设置格式或无格式

模式

格式 化:

  • 三个数字

  • 一个点

  • 三个数字

  • 一个点

  • 三个数字

  • 一个连字符

  • 两个数字,是校验位

无格式:11 位数字,其中最后两位数字检查位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_brazil_cpf 找到与该模式匹配的内容。

  • 找到 Keyword_brazil_cpf 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_brazil_cpf 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Brazil CPF Number -->
<Entity id="78e09124-f2c3-4656-b32a-c1a132cd2711" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_brazil_cpf"/>
     <Match idRef="Keyword_brazil_cpf"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_brazil_cpf"/>
  </Pattern>
</Entity>

关键字

Keyword_brazil_cpf
公积金
识别
注册
收入
Cadastro de Pessoas Físicas
Imposto
Identificação
Inscrição
Receita

巴西国家身份证 (RG)

格式

  • Registro Geral (旧格式) :9 位数字加上分隔符

  • Registro de Identidade (RIC) (新格式) :11 位数字加上连字符

模式

Registro Geral(旧格式):

  • 两个数字

  • 一个点

  • 三个数字

  • 一个点

  • 三个数字

  • 一个连字符

  • 一个数字,是校验位

Registro de Identidade (RIC)(新格式)

  • 10 个数字

  • 一个连字符

  • 一个数字,是校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_brazil_rg 找到与该模式匹配的内容。

  • 找到 Keyword_brazil_rg 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_brazil_rg 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Brazil National ID Card (RG) -->
<Entity id="486de900-db70-41b3-a886-abdf25af119c" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_brazil_rg"/>
     <Match idRef="Keyword_brazil_rg"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_brazil_rg"/>
  </Pattern>
</Entity>

关键字

Keyword_brazil_rg
National ID
注册
Cédula de identidade
Registro Geral
Rg
Registro de Identidade
RIC
Número de registo
Registro

加拿大银行帐号

格式:七位或十二位数字

模式:加拿大银行帐号为 7 或 12 位数字。 加拿大银行帐户的银行代号是:

  • 五位数字

  • 连字符

  • 三位数字

    OR

  • 一个零“0”

  • 八位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_canada_bank_account_number 查找与模式匹配的内容。

  • 找到 Keyword_canada_bank_account_number 中的一个关键字。

  • 正则表达式 Regex_canada_bank_account_transit_number 查找与模式匹配的内容。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_canada_bank_account_number 查找与模式匹配的内容。

  • 找到 Keyword_canada_bank_account_number 中的一个关键字。

<!-- Canada Bank Account Number -->
<Entity id="552e814c-cb50-4d94-bbaa-bb1d1ffb34de" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_canada_bank_account_number" />
        <Match idRef="Keyword_canada_bank_account_number" />
        <Match idRef="Regex_canada_bank_account_transit_number" />
   </Pattern>
   <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_bank_account_number" />
        <Match idRef="Keyword_canada_bank_account_number" />
   </Pattern>
</Entity>

关键字

Keyword_canada_bank_account_number
canada savings bonds
canada revenue agency
canadian financial institution
direct deposit form
canadian citizen
legal representative
notary public
commissioner for oaths
child care benefit
universal child care
canada child tax benefit
income tax benefit
harmonized sales tax
social insurance number
income tax refund
child tax benefit
territorial payments
institution number
deposit request
banking information
direct deposit

加拿大驾驶证号码

格式:因省而异

模式:各种模式,涵盖艾伯塔省、不列颠哥伦比亚省、马尼托巴省、新不伦瑞克省、纽芬兰/拉布拉多省、新斯科舍省、安大略省、爱德华王子岛、魁北克省和萨斯喀彻温省

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_[province_name]_drivers_license_number 找到与该模式匹配的内容。

  • 找到 Keyword_[province_name]_drivers_license_name 中的一个关键字。

  • 找到 Keyword_canada_drivers_license 中的一个关键字。

<!-- Canada Driver's License Number -->
    <Entity id="37186abb-8e48-4800-ad3c-e3d1610b3db0" patternsProximity="300" recommendedConfidence="75">
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_alberta_drivers_license_number" />
        <Match idRef="Keyword_alberta_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_british_columbia_drivers_license_number" />
        <Match idRef="Keyword_british_columbia_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_manitoba_drivers_license_number" />
        <Match idRef="Keyword_manitoba_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_new_brunswick_drivers_license_number" />
        <Match idRef="Keyword_new_brunswick_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_newfoundland_labrador_drivers_license_number" />
        <Match idRef="Keyword_newfoundland_labrador_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_nova_scotia_drivers_license_number" />
        <Match idRef="Keyword_nova_scotia_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_ontario_drivers_license_number" />
        <Match idRef="Keyword_ontario_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_prince_edward_island_drivers_license_number" />
        <Match idRef="Keyword_prince_edward_island_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_quebec_drivers_license_number" />
        <Match idRef="Keyword_quebec_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_saskatchewan_drivers_license_number" />
        <Match idRef="Keyword_saskatchewan_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
    </Entity>

关键字

Keyword_[province_name]_drivers_license_name Keyword_canada_drivers_license
省/市/自治区的缩写,例如 AB
省名称,例如 Alberta
Dl
Dls
民盟
CDLS
DriverLic
DriverLics
DriverLicense
DriverLicenses
DriverLicence
DriverLicences
Driver Lic
Driver Lics
Driver License
Driver Licenses
Driver Licence
Driver Licences
DriversLic
DriversLics
DriversLicence
DriversLicences
DriversLicense
DriversLicenses
Drivers Lic
Drivers Lics
Drivers License
Drivers Licenses
Drivers Licence
Drivers Licences
Driver'Lic
Driver'Lics
驾照
驾照
驾照
驾照
Driver' Lic
Driver' Lics
Driver' License
Driver' Licenses
Driver' Licence
Driver' Licences
Driver'sLic
Driver'sLics
Driver'sLicense
Driver'sLicenses
Driver'sLicence
Driver'sLicences
Driver's Lic
Driver's Lics
Driver's License
Driver's Licenses
Driver's Licence
Driver's Licences
Permis de Conduire
id
ids
idcard number
idcard numbers
idcard #
idcard #s
idcard card
idcard cards
idcard
identification number
identification numbers
identification #
identification #s
identification card
identification cards
识别
Dl#
Dls#
民盟#
CDLS#
DriverLic#
DriverLics#
DriverLicense#
DriverLicenses#
DriverLicence#
DriverLicences#
Driver Lic#
Driver Lics#
Driver License#
Driver Licenses#
Driver License#
Driver Licences#
DriversLic#
DriversLics#
DriversLicense#
DriversLicenses#
DriversLicence#
DriversLicences#
Drivers Lic#
Drivers Lics#
Drivers License#
Drivers Licenses#
Drivers Licence#
Drivers Licences#
Driver'Lic#
Driver'Lics#
驾照#
驾照#
驾照#
驾照#
Driver' Lic#
Driver' Lics#
Driver' License#
Driver' Licenses#
Driver' Licence#
Driver' Licences#
Driver'sLic#
Driver'sLics#
Driver'sLicense#
Driver'sLicenses#
Driver'sLicence#
Driver'sLicences#
Driver's Lic#
Driver's Lics#
Driver's License#
Driver's Licenses#
Driver's Licence#
Driver's Licences#
Permis de Conduire#
Id#
Id#
idcard card#
idcard cards#
idcard#
identification card#
identification cards#
识别#

加拿大卫生服务号

格式:10 位数字

模式:10 位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_canada_health_service_number 查找与模式匹配的内容。

  • 找到 Keyword_canada_health_service_number 中的一个关键字。

<!-- Canada Health Service Number -->
<Entity id="59c0bf39-7fab-482c-af25-00faa4384c94" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_health_service_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_canada_health_service_number" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_canada_health_service_number
personal health number
patient information
health services
speciality services
automobile accident
patient hospital
心理医生
workers compensation
残疾

加拿大护照号码

格式:两个大写字母后跟六位数字

模式:两个大写字母后跟六位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_canada_passport_number 查找与模式匹配的内容。

  • 找到或 的Keyword_canada_passport_numberKeyword_passport关键字 (keyword) 。

<!-- Canada Passport Number -->
<Entity id="14d0db8b-498a-43ed-9fca-f6097ae687eb" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_passport_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_canada_passport_number" />
          <Match idRef="Keyword_passport" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_canada_passport_number Keyword_passport
canadian citizenship
canadian passport
passport application
passport photos
certified translator
canadian citizens
processing times
renewal application
Passport Number
Passport No
Passport #
护照#
PassportID
Passportno
passportnumber
パスポート
パスポート番号
パスポートのNum
パスポート#
Numéro de passeport
Passeport n °
Passeport Non
Passeport #
Passeport#
PasseportNon
Passeportn °

加拿大个人健康标识号 (PHIN)

格式:九位数字

模式:9 位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_canada_phin 查找与模式匹配的内容。

  • 至少找到或 Keyword_canada_provinces 中的Keyword_canada_phin两个关键字。。

<!-- Canada PHIN -->
<Entity id="722e12ac-c89a-4ec8-a1b7-fea3469f89db" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_phin" />
        <Any minMatches="2">
          <Match idRef="Keyword_canada_phin" />
          <Match idRef="Keyword_canada_provinces" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_canada_phin Keyword_canada_provinces
social insurance number
health information act
income tax information
manitoba health
health registration
prescription purchases
benefit eligibility
personal health
power of attorney
registration number
personal health number
practitioner referral
wellness professional
patient referral
health and wellness
Nunavut
魁北克
Northwest Territories
安大略省
British Columbia
艾伯塔省
萨斯喀彻温省
马尼托巴省
育 空
Newfoundland and Labrador
New Brunswick
Nova Scotia
Prince Edward Island
加拿大

加拿大社会保险号码

格式:带可选连字符或空格的 9 位数字

模式

格式 化:

  • 三位数字

  • 连字符或空格

  • 三位数字

  • 连字符或空格

  • 三位数字

无格式:九位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_canadian_sin 找到与该模式匹配的内容。

  • 至少以下两种任意组合:

    • 找到 Keyword_sin 中的一个关键字。

    • 找到 Keyword_sin_collaborative 中的一个关键字。

    • 函数 Func_eu_date 以正确的日期格式查找日期。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_unformatted_canadian_sin 找到与该模式匹配的内容。

  • 找到 Keyword_sin 中的一个关键字。

  • 校验和通过。

<!-- Canada Social Insurance Number -->
<Entity id="a2f29c85-ecb8-4514-a610-364790c0773e" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_canadian_sin" />
        <Any minMatches="2">
          <Match idRef="Keyword_sin" />
          <Match idRef="Keyword_sin_collaborative" />
          <Match idRef="Func_eu_date" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_canadian_sin" />
        <Match idRef="Keyword_sin" />
  </Pattern>
</Entity>

关键字

Keyword_sin Keyword_sin_collaborative
sin
social insurance
numero d'assurance sociale

Ssn
ssns
social security
numero d'assurance social
national identification number
national id
罪#
soc ins
social ins
driver's license
drivers license
driver's licence
drivers licence
DOB
出生日期
Birthday
Date of Birth

智利身份证号

格式:7-8 位数字加上检查位或字母分隔符

模式:7-8 位数字加上分隔符:

  • 1-2 个数字

  • 一个点

  • 三个数字

  • 一个点

  • 三个数字

  • 一个短划线

  • 一个数字或字母(不区分大小写),是校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_chile_id_card 找到与该模式匹配的内容。

  • 找到 Keyword_chile_id_card 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_chile_id_card 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Chile Identity Card Number -->
<Entity id="4e979794-49a0-407e-a0b9-2c536937b925" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_chile_id_card"/>
     <Match idRef="Keyword_chile_id_card"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_chile_id_card"/>
  </Pattern>
</Entity>

关键字

Keyword_chile_id_card
National Identification Number
Identity card
ID
识别
Rol Único Nacional
运行
Rol Único Tributario
车辙
Cédula de Identidad
Número De Identificación Nacional
Tarjeta de identificación
Identificación

中国居民身份证号

格式:18 位数字

模式:18 位数字:

  • 其中六个数字是地址代码

  • YYYYMMDD 形式的八位数字,即出生日期

  • 三位数字,即订单代码

  • 一个数字,即检查位数

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_china_resident_id 找到与该模式匹配的内容。

  • 找到 Keyword_china_resident_id 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_china_resident_id 找到与该模式匹配的内容。

  • 校验和通过。

<!-- China Resident Identity Card (PRC) Number -->
<Entity id="c92daa86-2d16-4871-901f-816b3f554fc1" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_china_resident_id"/>
     <Match idRef="Keyword_china_resident_id"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_china_resident_id"/>
  </Pattern>
</Entity>

关键字

Keyword_china_resident_id
Resident Identity Card
PRC
National Identification Card
身份证
居民 身份证
居民身份证
鉴定
身分證
居民身份證
鑑定

信用卡号码

格式: (d) 可以格式化或无格式设置格式的 14 位数字,并且必须通过 Luhn 测试。

模式:非常复杂且可靠的模式,可检测来自全球所有主要品牌的卡片,包括 Visa、万事达卡、发现卡、JCB、美国运通、礼品卡和餐卡。

校验和:是,Luhn 校验和

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_credit_card 找到与该模式匹配的内容。

  • 下列其中一项为真:

    • 找到 Keyword_cc_verification 中的一个关键字。

    • 找到 Keyword_cc_name 中的一个关键字。

    • 函数 Func_expiration_date 以正确的日期格式查找日期。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 65% 确信它检测到这种类型的敏感信息:

  • 函数 Func_credit_card 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Credit Card Number -->
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_cc_verification" />
          <Match idRef="Keyword_cc_name" />
          <Match idRef="Func_expiration_date" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_credit_card" />
  </Pattern>
</Entity>

关键字

Keyword_cc_verification Keyword_cc_name
card verification
card identification number
cvn
cid
cvc2
cvv2
pin block
security code
security number
security no
issue number
issue no
cryptogramme
numéro de sécurité
numero de securite
kreditkartenprüfnummer
kreditkartenprufnummer
prüfziffer
prufziffer
sicherheits Kode
sicherheitscode
sicherheitsnummer
verfalldatum
codice di verifica
Cod。 sicurezza
cod sicurezza
n autorizzazione
código
codigo
Cod。 Seg
cod seg
código de segurança
codigo de seguranca
codigo de segurança
código de seguranca
cód. segurança
Cod。 seguranca cod. segurança
cód. seguranca
cód segurança
cod seguranca cod segurança
cód seguranca
número de verificação
numero de verificacao
ablauf
gültig bis
gültigkeitsdatum
gultig bis
gultigkeitsdatum
scadenza
data scad
fecha de expiracion
fecha de venc
vencimiento
válido hasta
valido hasta
vto
data de expiração
data de expiracao
data em que expira
validade
勇气
vencimento
Venc
amex
american express
americanexpress
签证
万事 达
Master Card
Mc
mastercards
master cards
diner's Club
diners club
dinersclub
discover card
discovercard
discover cards
JCB
japanese card bureau
carte blanche
carteblanche
credit card
Cc#
cc#:
expiration date
exp date
expiry date
date d'expiration
date d'exp
date expiration
bank card
二元
card number
card num
cardnumber
cardnumbers
card numbers
信用卡
credit cards
信用卡
ccn
card holder
持 卡 人
card holders
持 卡 人
check card
checkcard
check cards
checkcards
debit card
debitcard
debit cards
借记卡
atm card
atmcard
atm cards
atmcards
enroute
en route
card type
carte bancaire
carte de crédit
carte de credit
numéro de carte
numero de carte
nº de la carte
nº de carte
kreditkarte
karte
karteninhaber
karteninhabers
kreditkarteninhaber
kreditkarteninstitut
kreditkartentyp
eigentümername
kartennr
kartennummer
kreditkartennummer
kreditkarten-nummer
carta di credito
carta credito
n. 宪章
n carta
星期日。 宪章
nr carta
numero carta
numero della carta
numero di carta
tarjeta credito
tarjeta de credito
tarjeta crédito
tarjeta de crédito
tarjeta de atm
tarjeta atm
tarjeta debito
tarjeta de debito
tarjeta débito
tarjeta de débito
nº de tarjeta
不。 de tarjeta
no de tarjeta
numero de tarjeta
número de tarjeta
tarjeta no
tarjetahabiente
cartão de crédito
cartão de credito
cartao de crédito
cartao de credito
cartão de débito
cartao de débito
cartão de debito
cartao de debito
débito automático
debito automatico
número do cartão
numero do cartão
número do cartao
numero do cartao
número de cartão
numero de cartão
número de cartao
numero de cartao
nº do cartão
nº do cartao
n。。 do cartão
no do cartão
no do cartao
不。 do cartão
不。 do cartao

克罗地亚身份证号码

格式:九位数字

模式:九个连续数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_croatia_id_card 找到与该模式匹配的内容。

  • 找到 Keyword_croatia_id_card 中的一个关键字。

<!--Croatia Identity Card Number-->
<Entity id="ff12f884-c20a-4189-b185-34c8e7258d47" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_croatia_id_card"/>
     <Match idRef="Keyword_croatia_id_card"/>
  </Pattern>
</Entity>

关键字

Keyword_croatia_id_card
Croatian identity card
Osobna iskaznica

克罗地亚个人标识 (OIB) 号码

格式:10 位数字

模式:10 位数字:

  • DDMMYY 格式的六位数字,即出生日期

  • 四个数字,最后一位数字是校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_croatia_oib_number 找到与该模式匹配的内容。

  • 找到 Keyword_croatia_oib_number 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_croatia_oib_number 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Croatia Personal Identification (OIB) Number -->
<Entity id="31983b6d-db95-4eb2-a630-b44bd091968d" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_croatia_oib_number"/>
     <Match idRef="Keyword_croatia_oib_number"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_croatia_oib_number"/>
  </Pattern>
</Entity>

关键字

Keyword_croatia_oib_number
Personal Identification Number
Osobni identifikacijski broj
OIB

捷克国民身份证号码

格式:包含正斜杠的 10 位数字

模式:10 位数字:

  • 六位数字,即出生日期

  • 一个正斜杠

  • 四个数字,最后一位数字是校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_czech_id_card 找到与该模式匹配的内容。

  • 找到 Keyword_czech_id_card 中的一个关键字。

  • 校验和通过。

<!-- Czech National Identity Card Number -->
<Entity id="60c0725a-4eb6-455b-9dda-05d8a7396497" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_czech_id_card"/>
     <Match idRef="Keyword_czech_id_card"/>
  </Pattern>
</Entity>

关键字

Keyword_czech_id_card
Czech national identity card
Občanský průka

丹麦个人识别号

格式:包含连字符的 10 位数字

模式:10 位数字:

  • DDMMYY 格式的六位数字,即出生日期

  • 一个连字符

  • 四个数字,最后一位数字是校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_denmark_id 查找与模式匹配的内容。

  • 找到 Keyword_denmark_id 中的一个关键字。

  • 校验和通过。

<!-- Denmark Personal Identification Number -->
<Entity id="6c4f2fef-56e1-4c00-8093-88d7a01cf460" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_denmark_id"/>
     <Match idRef="Keyword_denmark_id"/>
  </Pattern>
</Entity>

关键字

Keyword_denmark_id
Personal Identification Number
Cpr
Det Centrale Personregister
Personnummer

药品管制局 (DEA) 号码

格式:两个字母后跟七位数字

模式:模式必须包含以下所有项:

  • 这一组可能的字母(不区分大小写)中的一个字母:abcdefghjklmnprstux,这是注册人代码

  • 一个字母(不区分大小写),这是注册人姓氏的第一个字母

  • 七位数字,最后一个数字是校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_dea_number 找到与该模式匹配的内容。

  • 校验和通过。

<!-- DEA Number -->
<Entity id="9a5445ad-406e-43eb-8bd7-cac17ab6d0e4" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_dea_number"/>
  </Pattern>
</Entity>

关键字:无

欧盟借记卡号码

格式:16 位数字

模式:非常复杂且可靠的模式

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_eu_debit_card 找到与该模式匹配的内容。

  • 下列至少其中一项为真:

    • 找到 Keyword_eu_debit_card 中的一个关键字。

    • 找到 Keyword_card_terms_dict 中的一个关键字。

    • 找到 Keyword_card_security_terms_dict 中的一个关键字。

    • 找到 Keyword_card_expiration_terms_dict 中的一个关键字。

    • 函数 Func_eu_date1 以正确的日期格式查找日期。

    • 函数 Func_eu_date2 以正确的日期格式查找日期。

  • 校验和通过。

<!-- EU Debit Card Number -->
<Entity id="0e9b3178-9678-47dd-a509-37222ca96b42" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_eu_debit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_eu_debit_card" />
          <Match idRef="Keyword_card_terms_dict" />
          <Match idRef="Keyword_card_security_terms_dict" />
          <Match idRef="Keyword_card_expiration_terms_dict" />
          <Match idRef="Func_expiration_date" />
          <Match idRef="Func_eu_date" />
          <Match idRef="Func_eu_date1" />
          <Match idRef="Func_eu_date2" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_eu_debit_card Keyword_card_terms_dict Keyword_card_security_terms_dict Keyword_card_expiration_terms_dict
account number
card number
card no.
security number
Cc#
acct nbr
acct num
acct no
american express
americanexpress
americano espresso
amex
atm card
atm cards
atm kaart
atmcard
atmcards
atmkaart
atmkaarten
bancontact
bank card
bankkaart
card holder
card holders
card num
card number
card numbers
card type
cardano numerico
持 卡 人
持 卡 人
cardnumber
cardnumbers
carta bianca
carta credito
carta di credito
cartao de credito
cartao de crédito
cartao de debito
cartao de débito
carte bancaire
carte blanche
carte bleue
carte de credit
carte de crédit
carte di credito
carteblanche
cartão de credito
cartão de crédito
cartão de debito
cartão de débito
Cb
ccn
check card
check cards
checkcard
checkcards
chequekaart
卷云
cirrus-edc-maestro
controlekaart
controlekaarten
credit card
credit cards
信用卡
信用卡
debetkaart
debetkaarten
debit card
debit cards
debitcard
借记卡
debito automatico
diners club
dinersclub
发现
discover card
discover cards
discovercard
discovercards
débito automático
edc
eigentümername
european debit card
hoofdkaart
hoofdkaarten
in viaggio
japanese card bureau
japanse kaartdienst
jcb
kaart
kaart num
kaartaantal
kaartaantallen
kaarthouder
kaarthouders
karte
karteninhaber
karteninhabers
kartennr
kartennummer
kreditkarte
kreditkarten-nummer
kreditkarteninhaber
kreditkarteninstitut
kreditkartennummer
kreditkartentyp
大师
Master Card
master cards
万事 达
mastercards
Mc
mister cash
n carta
n. 宪章
no de tarjeta
no do cartao
no do cartão
不。 de tarjeta
不。 do cartao
不。 do cartão
nr carta
星期日。 宪章
numeri di scheda
numero carta
numero de cartao
numero de carte
numero de cartão
numero de tarjeta
numero della carta
numero di carta
numero di scheda
numero do cartao
numero do cartão
numéro de carte
nº carta
nº de carte
nº de la carte
nº de tarjeta
nº do cartao
nº do cartão
n。。 do cartão
número de cartao
número de cartão
número de tarjeta
número do cartao
scheda dell'assegno
scheda dell'atmosfera
scheda dell'atmosfera
scheda della banca
scheda di controllo
scheda di debito
scheda matrice
schede dell'atmosfera
schede di controllo
schede di debito
schede matrici
scoprono la scheda
scoprono le schede
独奏
supporti di scheda
supporto di scheda
开关
tarjeta atm
tarjeta credito
tarjeta de atm
tarjeta de credito
tarjeta de debito
tarjeta debito
tarjeta no
tarjetahabiente
tipo della scheda
ufficio giapponese della
scheda
v pay
v-pay
签证
visa plus
visa electron
visto
visum
vpay
card identification number
card verification
cardi la verifica
cid
cod seg
cod seguranca
cod segurança
cod sicurezza
Cod。 Seg
Cod。 seguranca
Cod。 segurança
Cod。 sicurezza
codice di sicurezza
codice di verifica
codigo
codigo de seguranca
codigo de segurança
crittogramma
密码
cryptogramme
cv2
Cvc
cvc2
cvn
cvv
cvv2
cód seguranca
cód segurança
cód. seguranca
cód. segurança
código
código de seguranca
código de segurança
de kaart controle
geeft nr uit
issue no
issue number
kaartidentificatienummer
kreditkartenprufnummer
kreditkartenprüfnummer
kwestieaantal
不。 dell'edizione
不。 di sicurezza
numero de securite
numero de verificacao
numero dell'edizione
numero di identificazione della
scheda
numero di sicurezza
numero van veiligheid
numéro de sécurité
nº autorizzazione
número de verificação
perno il blocco
pin block
prufziffer
prüfziffer
security code
security no
security number
sicherheits kode
sicherheitscode
sicherheitsnummer
speldblok
veiligheid nr
veiligheidsaantal
veiligheidscode
veiligheidsnummer
verfalldatum
ablauf
data de expiracao
data de expiração
data del exp
data di exp
data di scadenza
data em que expira
data scad
data scadenza
date de validité
datum afloop
datum van exp
de afloop
espira
espira
exp date
exp datum
到期
到期
到期
届满
fecha de expiracion
fecha de venc
gultig bis
gultigkeitsdatum
gültig bis
gültigkeitsdatum
la scadenza
scadenza
valable
validade
valido hasta
勇气
venc
vencimento
vencimiento
verloopt
vervaldag
vervaldatum
vto
válido hasta

芬兰国家/地区身份证号码

格式:六位数字加上一个字符,表示一个世纪加三位数字加一位检查位

模式:模式必须包含以下所有项:

  • DDMMYY 格式的六位数字,即出生日期

  • 世纪标记(“-”、“+”或“a”)

  • 三位个人标识号

  • 一个数字或字母(区分大小写),是校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_finnish_national_id 找到与该模式匹配的内容。

  • 找到 Keyword_finnish_national_id 中的一个关键字。

  • 校验和通过。

<!-- Finnish National ID-->
<Entity id="338FD995-4CB5-4F87-AD35-79BD1DD926C1" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_finnish_national_id" />
          <Match idRef="Keyword_finnish_national_id" />
  </Pattern>
</Entity>

关键字

Keyword_finnish_national_id
Sosiaaliturvatunnus
SOTU Henkilötunnus HETU
Personbeteckning
Personnummer

芬兰护照号码

格式:9 个字母和数字的组合

模式:9 个字母和数字的组合:

  • 两个字母(不区分大小写)

  • 七个数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_finland_passport_number 查找与模式匹配的内容。

  • 找到 Keyword_finland_passport_number 中的一个关键字。

<!-- Finland Passport Number -->
<Entity id="d1685ac3-1d3a-40f8-8198-32ef5669c7a5" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_finland_passport_number"/>
     <Match idRef="Keyword_finland_passport_number"/>
  </Pattern>
</Entity>

关键字

Keyword_finland_passport_number
护照
Passi

法国驾驶证号码

格式:12 位数字

模式:12 位数字,验证折扣类似模式(如法语电话号码)

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_french_drivers_license 找到与该模式匹配的内容。

  • 下列至少其中一项为真:

    • 找到 Keyword_french_drivers_license 中的一个关键字。

    • 函数 Func_eu_date 以正确的日期格式查找日期。

<!-- France Driver's License Number -->
<Entity id="18e55a36-a01b-4b0f-943d-dc10282a1824" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_french_drivers_license" />
        <Any minMatches="1">
          <Match idRef="Keyword_french_drivers_license" />
          <Match idRef="Func_eu_date" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_french_drivers_license
drivers licence
drivers license
driving licence
driving license
permis de conduire
licence number
license number
licence numbers
license numbers

法国国家/地区身份证 (CNI)

格式:12 位数字

模式:12 位数字

校验和:否

定义

DLP 策略在 300 个字符的邻近范围内检测到此类敏感信息的确定性为 65%:正则表达式 Regex_france_cni 查找与模式匹配的内容。

<!-- France CNI -->
<Entity id="f741ac74-1bc0-4665-b69b-f0c7f927c0c4" patternsProximity="300" recommendedConfidence="65">
  <Pattern confidenceLevel="65">
        <IdMatch idRef="Regex_france_cni" />
  </Pattern>
</Entity>

关键字:无

法国护照号码

格式:九位数字和字母

模式:九位数字和字母:

  • 两位数字

  • 两个字母(不区分大小写)

  • 五位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_fr_passport 找到与该模式匹配的内容。

  • 找到的Keyword_passport关键字 (keyword) 。

<!-- France Passport Number -->
<Entity id="3008b884-8c8c-4cd8-a289-99f34fc7ff5d" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_fr_passport" />
        <Match idRef="Keyword_passport" />
  </Pattern>
</Entity>

关键字

Keyword_passport
Passport Number
Passport No
Passport #
护照#
PassportID
Passportno
passport number
パスポート
パスポート番号
パスポートのNum
パスポート #
Numéro de passeport
Passeport n °
Passeport Non
Passeport #
Passeport#
PasseportNon
Passeportn °

法国社会保险号码 (INSEE)

格式:15 位数字

模式

必须匹配两种模式之一:

  • 13 个数字后跟一个空格再跟两个数字,或者

  • 15 个连续的数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 95% 确信它检测到这种类型的敏感信息:

  • 函数 Func_french_inseeFunc_fr_insee 查找与模式匹配的内容。

  • 找到 Keyword_fr_insee 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_french_inseeFunc_fr_insee 查找与模式匹配的内容。

  • 找不到关键字 (keyword) Keyword_fr_insee

  • 校验和通过。

<!-- France INSEE -->
<Entity id="71f62b97-efe0-4aa1-aa49-e14de253619d" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="95">
        <IdMatch idRef="Func_french_insee" />
        <Match idRef="Func_fr_insee" />
        <Any minMatches="1">
          <Match idRef="Keyword_fr_insee" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_french_insee" />
        <Match idRef="Func_fr_insee" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_fr_insee" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_fr_insee
insee
securité sociale
securite sociale
national id
national identification
numéro d identité
no d'identité
不。 d'identité
numero d'identite
no d'identite
不。 d'identite
social security number
social security code
social insurance number
le numéro d'identification nationale
d'identité nationale
numéro de sécurité sociale
le code de la sécurité sociale
numéro d'assurance sociale
numéro de sécu
code sécu

德国驾驶证号码

格式:11 个数字和字母的组合

模式:11 位数字和字母 (不区分大小写) :

  • 一个数字或字母

  • 两位数字

  • 六位数字或字母

  • 一位数字

  • 一个数字或字母

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_german_drivers_license 找到与该模式匹配的内容。

  • 下列至少其中一项为真:

    • 找到 Keyword_german_drivers_license_number 中的一个关键字。

    • 找到 Keyword_german_drivers_license_collaborative 中的一个关键字。

    • 找到 Keyword_german_drivers_license 中的一个关键字。

  • 校验和通过。

<!-- German Driver's License Number -->
<Entity id="91da9335-1edb-45b7-a95f-5fe41a16c63c" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_german_drivers_license" />
        <Any minMatches="1">
          <Match idRef="Keyword_german_drivers_license_number" />
          <Match idRef="Keyword_german_drivers_license_collaborative" />
          <Match idRef="Keyword_german_drivers_license" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_german_drivers_license_number Keyword_german_drivers_license_collaborative Keyword_german_drivers_license
Führerschein
Fuhrerschein
Fuehrerschein
Führerscheinnummer
Fuhrerscheinnummer
Fuehrerscheinnummer
Führerschein-
Fuhrerschein-
Fuehrerschein-
FührerscheinnummerNr
FuhrerscheinnummerNr
FuehrerscheinnummerNr
FührerscheinnummerKlasse
FuhrerscheinnummerKlasse
FuehrerscheinnummerKlasse
Führerschein-Nr
Fuhrerschein- Nr
Fuehrerschein- Nr
Führerschein- Klasse
Fuhrerschein- Klasse
Fuehrerschein- Klasse
FührerscheinnummerNr
FuhrerscheinnummerNr
FuehrerscheinnummerNr
FührerscheinnummerKlasse
FuhrerscheinnummerKlasse
FuehrerscheinnummerKlasse
Führerschein-Nr
Fuhrerschein- Nr
Fuehrerschein- Nr
Führerschein- Klasse
Fuhrerschein- Klasse
Fuehrerschein- Klasse
Dl
Dls
Driv Lic
Driv Licen
Driv License
Driv Licenses
Driv Licence
Driv Licences
Driv Lic
Driver Licen
Driver License
Driver Licenses
Driver Licence
Driver Licences
Drivers Lic
Drivers Licen
Drivers License
Drivers Licenses
Drivers Licence
Drivers Licences
Driver's Lic
Driver's Licen
Driver's License
Driver's Licenses
Driver's Licence
Driver's Licences
Driving Lic
Driving Licen
Driving License
Driving Licenses
Driving Licence
Driving Licences
Nr-Führerschein
Nr-Fuhrerschein
Nr-Fuehrerschein
No-Führerschein
No-Fuhrerschein
No-Fuehrerschein
N-Führerschein
N-Fuhrerschein
N-Fuehrerschein
Nr-Führerschein
Nr-Fuhrerschein
Nr-Fuehrerschein
No-Führerschein
No-Fuhrerschein
No-Fuehrerschein
N-Führerschein
N-Fuhrerschein
N-Fuehrerschein
ausstellungsdatum
ausstellungsort
ausstellende behöde
ausstellende behorde
ausstellende behoerde

德国身份证号

格式

  • 自 2010 年 11 月 1 日起:9 个字母和数字

  • 从 1987 年 4 月 1 日至 2010 年 10 月 31 日:10 位数字

模式

自 2010 年 11 月 1 日起:

  • 一个字母(不区分大小写)

  • 八位数字

从 1987 年 4 月 1 日至 2010 年 10 月 31 日:10 位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 65% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_germany_id_card 查找与模式匹配的内容。

  • 找到 Keyword_germany_id_card 中的一个关键字。

<!-- Germany Identity Card Number -->
<Entity id="e577372f-c42e-47a0-9d85-bebed1c237d4" recommendedConfidence="65" patternsProximity="300">
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Regex_germany_id_card"/>
     <Match idRef="Keyword_germany_id_card"/>
  </Pattern>
</Entity>

关键字

Keyword_germany_id_card
Identity Card
ID
识别
Personalausweis
Identifizierungsnummer
Ausweis
标识

德国护照号码

格式:10 位数字或字母

模式:模式必须包含以下所有项:

  • 第一个字符是这一组(C、F、G、H、J、K)中的数字或字母

  • 三位数字

  • 五位数字或字母都来源于这一组(C、-H、J-N、P、R、T,V-Z)

  • 一位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_german_passport 找到与该模式匹配的内容。

  • 找到以下任意五个关键字列表中的关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_german_passport_data 找到与该模式匹配的内容。

  • 找到以下任意五个关键字列表中的关键字。

  • 校验和通过。

<!-- German Passport Number -->
<Entity id="2e3da144-d42b-47ed-b123-fbf78604e52c" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_german_passport" />
        <Any minMatches="1">
          <Match idRef="Keyword_german_passport" />
          <Match idRef="Keyword_german_passport_collaborative" />
          <Match idRef="Keyword_german_passport_number" />
          <Match idRef="Keyword_german_passport1" />
          <Match idRef="Keyword_german_passport2" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_german_passport_data" />
        <Any minMatches="1">
          <Match idRef="Keyword_german_passport" />
          <Match idRef="Keyword_german_passport_collaborative" />
          <Match idRef="Keyword_german_passport_number" />
          <Match idRef="Keyword_german_passport1" />
          <Match idRef="Keyword_german_passport2" />
        </Any>
  </Pattern>
</Entity>

关键字

Keyword_german_passport Keyword_german_passport_collaborative Keyword_german_passport_number Keyword_german_passport1 Keyword_german_passport2
reisepass
reisepasse
reisepassnummer
护照
护照
geburtsdatum
ausstellungsdatum
ausstellungsort
No-Reisepass
Nr-Reisepass
Reisepass-Nr bnationalit.t

希腊国民身份证

格式:7-8 个字母和数字加上短划线的组合

模式

七个字母和数字(旧格式):

  • 一个字母(希腊字母表中的任一字母)

  • 一个短划线

  • 六个数字

八个字母和数字(新格式):

  • 大写字符同时出现在希腊和拉丁字母表中的两个字母 (ABEZHIKMNOPTYX)

  • 一个短划线

  • 六个数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_greece_id_card 查找与模式匹配的内容。

  • 找到 Keyword_greece_id_card 中的一个关键字。

<!-- Greece National ID Card -->
<Entity id="82568215-1da1-46d3-874a-d2294d81b5ac" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_greece_id_card"/>
     <Match idRef="Keyword_greece_id_card"/>
  </Pattern>
</Entity>

关键字

Keyword_greece_id_card
Greek identity Card
陶托蒂塔
Δελτίο αστυνομικής ταυτότητας
Ταυτότητα

香港身份证 (HKID) 号

格式:8-9 个字母和数字的组合,加上最后一个字符周围的可选括号

模式:8-9 个字母的组合:

  • 1-2 个字母(不区分大小写)

  • 六个数字

  • 最后一个字符(任意数字或字母 A)是校验位,两边可以选择加括号。

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_hong_kong_id_card 找到与该模式匹配的内容。

  • 找到 Keyword_hong_kong_id_card 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 65% 确信它检测到这种类型的敏感信息:

  • 函数 Func_hong_kong_id_card 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Hong Kong Identity Card (HKID) number -->
<Entity id="e63c28a7-ad29-4c17-a41a-3d2a0b70fd9c" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_hong_kong_id_card"/>
     <Match idRef="Keyword_hong_kong_id_card"/>
  </Pattern>
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Func_hong_kong_id_card"/>
  </Pattern>
</Entity>

关键字

Keyword_hong_kong_id_card
Hong Kong Identity Card
HKID
ID card
香港身份證
香港永久性居民身份證

印度永久帐号

格式:10 个字母或数字

模式:10 个字母或数字:

  • 五个字母(不区分大小写)

  • 四个数字

  • 字母,它是字母检查位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_india_permanent_account_number 查找与模式匹配的内容。

  • 找到 Keyword_india_permanent_account_number 中的一个关键字。

  • 校验和通过。

<!-- India Permanent Account Number -->
<Entity id="2602bfee-9bb0-47a5-a7a6-2bf3053e2804" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_india_permanent_account_number"/>
     <Match idRef="Keyword_india_permanent_account_number"/>
  </Pattern>
</Entity>

关键字

Keyword_india_permanent_account_number
Permanent Account Number

India Unique Identification (Aadhaar) Number

格式:包含可选空格或短划线的 12 位数字

模式:12 位数字:

  • 四个数字

  • 一个可选空格或短划线

  • 四个数字

  • 一个可选空格或短划线

  • 最后一位数字,即检查位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_india_aadhaar 找到与该模式匹配的内容。

  • 找到 Keyword_india_aadhar 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_india_aadhaar 找到与该模式匹配的内容。

  • 校验和通过。

<!-- India Unique Identification (Aadhaar) number -->
<Entity id="1ca46b29-76f5-4f46-9383-cfa15e91048f" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_india_aadhaar"/>
     <Match idRef="Keyword_india_aadhar"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_india_aadhaar"/>
  </Pattern>
</Entity>

关键字

Keyword_india_aadhar
Aadhar
Aadhaar
UID
आधार

印度尼西亚身份证 (KTP) 号

格式:包含可选句点的 16 位数字

模式:16 位数字:

  • 两位省代码

  • 一个点(可选)

  • 两位摄政统治区或城市代码

  • 两位住宅小区代码

  • 一个点(可选)

  • DDMMYY 格式的六位数字,即出生日期

  • 一个点(可选)

  • 四个数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_indonesia_id_card 查找与模式匹配的内容。

  • 找到 Keyword_indonesia_id_card 中的一个关键字。

DLP 策略在 300 个字符的邻近范围内检测到此类敏感信息的确定性为 75%:正则表达式 Regex_indonesia_id_card 查找与模式匹配的内容。

<!-- Indonesia Identity Card (KTP) Number -->
<Entity id="da68fdb0-f383-4981-8c86-82689d3b7d55" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_indonesia_id_card"/>
     <Match idRef="Keyword_indonesia_id_card"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_indonesia_id_card"/>
  </Pattern>
</Entity>

关键字

Keyword_indonesia_id_card
Ktp
Kartu Tanda Penduduk
Nomor Induk Kependudukan

国际银行帐号 (IBAN)

格式:国家/地区代码 (两个字母) 加检查位数 (两个数字) 加 bban 数字 (最多 30 个字符)

模式

模式必须包括以下各项:

  • 两个字母的国家/地区代码

  • 两个校验位(后跟一个可选空间)

  • 1-7 个包含 4 个字母或数字的组(可以使用空格进行分隔)

  • 1-3 个字母或数字

每个国家/地区的格式稍有不同。 IBAN 敏感信息类型涵盖以下 60 个国家/地区:广告、 ae, al, at, az, ba, be, bg, bh, ch, cr, cy, cz, de, dk, do, ee, es, fi, fo, fr, gb, ge, gi, gl, gr, hr, hu, ie, il, is, it, kw, kz, lb, li, lt, lu, lv, mc, md, me, mk, mr, mt, mu, nl, no, pl, pt, ro, rs, sa, se, si, sk, sm, tn, tr, vg

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_iban 找到与该模式匹配的内容。

  • 校验和通过。

<Entity id="e7dc4711-11b7-4cb0-b88b-2c394a771f0e" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_iban" />
  </Pattern>
</Entity>

关键字:无

IP 地址

格式:IPv4 或 IPv6 地址

模式

  • IPv4:复杂模式,该模式考虑格式化 (周期) 和无格式 (没有句点) 版本的 IPv4 地址。

  • IPv6:复杂模式,用于说明格式化的 IPv6 数字 (包括冒号) 。

校验和:否

定义

对于 IPv4,在 300 个字符的相似度内,如果出现以下情况,DLP 策略 95% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_ipv4_address 查找与模式匹配的内容。

  • 找到 Keyword_ipaddress 中的一个关键字。

对于 IPv6,在 300 个字符的相似度内,如果出现以下情况,DLP 策略 95% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_ipv6_address 查找与模式匹配的内容。

  • 找不到关键字 (keyword) Keyword_ipaddress

对于 IPv4,在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_ipv4_address 查找与模式匹配的内容。

  • 找不到关键字 (keyword) Keyword_ipaddress

对于 IPv6,在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_ipv6_address 查找与模式匹配的内容。

  • 找不到关键字 (keyword) Keyword_ipaddress

<Entity id="1daa4ad5-e2dd-4ca4-a788-54722c09efb2" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="95">
        <IdMatch idRef="Regex_ipv4_address" />
        <Any minMatches="1">
          <Match idRef="Keyword_ipaddress" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="95">
        <IdMatch idRef="Regex_ipv6_address" />
        <Any minMatches="1">
          <Match idRef="Keyword_ipaddress" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_ipv4_address" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_ipaddress" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_ipv6_address" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_ipaddress" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_ipaddress
ip address
internet protocol
IP-כתובת ה

爱尔兰个人公共服务 (PPS) 号

格式

  • 新格式 (2013 年 1 月 1 日及更高版本) :七位数字后跟两个字母

  • 旧格式 (2012 年 12 月 31 日及更早) :7 位数字后跟 1-2 个字母

模式

新格式 (2013 年 1 月 1 日及更高版本)

  • 七个数字

  • 一个字母(不区分大小写),是字母校验位

  • 字母“A”或“H”(不区分大小写)

旧格式 (2012 年 12 月 31 日及更早)

  • 七个数字

  • 1-2 个字母(不区分大小写)

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_ireland_pps 找到与该模式匹配的内容。

  • 下列其中一项为真:

    • 找到 Keyword_ireland_pps 中的一个关键字。

    • 函数 Func_eu_date 以正确的日期格式查找日期。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 65% 确信它检测到这种类型的敏感信息:

  • 函数 Func_ireland_pps 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Ireland Personal Public Service (PPS) Number -->
<Entity id="1cdb674d-c19a-4fcf-9f4b-7f56cc87345a" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_ireland_pps"/>
     <Any minMatches="1">
  <Match idRef="Keyword_ireland_pps"/>
  <Match idRef="Func_eu_date"/>
     </Any>
  </Pattern>
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Func_ireland_pps"/>
  </Pattern>
</Entity>

关键字

Keyword_ireland_pps
Personal Public Service Number
PPS Number
PPS Num
PPS No.
PPS #
Pps#
PPSN
Public Services Card
Uimhir Phearsanta Seirbhíse Poiblí
Uimh。 Psp
Psp

以色列银行帐号

格式:13 位数字

模式

格式 化:

  • 两位数字

  • 破折号

  • 三位数字

  • 破折号

  • 八位数字

无格式:13 个连续数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_israel_bank_account_number 查找与模式匹配的内容。

  • 找到 Keyword_israel_bank_account_number 中的一个关键字。

<!-- Israel Bank Account Number -->
<Entity id="7d08b2ff-a0b9-437f-957c-aeddbf9b2b25" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_israel_bank_account_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_israel_bank_account_number" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_israel_bank_account_number
Bank Account Number
Bank Account
Account Number
מספר חשבון בנק

以色列国家/地区 ID

格式:九位数字

模式:九个连续数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_israeli_national_id_number 找到与该模式匹配的内容。

  • 找到 Keyword_Israel_National_ID 中的一个关键字。

  • 校验和通过。

<!-- Israel National ID Number -->
<Entity id="e05881f5-1db1-418c-89aa-a3ac5c5277ee" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_israeli_national_id_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_Israel_National_ID" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_Israel_National_ID
מספר זהות
National ID Number

意大利驾驶证号码

格式:10 个字母和数字的组合

模式:10 个字母和数字的组合:

  • 一个字母(不区分大小写)

  • 字母“A”或者“V”(不区分大小写)

  • 七个字母(不区分大小写)、数字或下划线字符

  • 一个字母(不区分大小写)

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_italy_drivers_license_number 查找与模式匹配的内容。

  • 找到 Keyword_italy_drivers_license_number 中的一个关键字。

<!-- Italy Driver's license Number -->
<Entity id="97d6244f-9157-41bd-8e0c-9d669a5c4d71" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_italy_drivers_license_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_italy_drivers_license_number" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_italy_drivers_license_number
numero di patente di guida
patente di guida

日本银行帐号

格式:七位或八位数字

模式

银行帐号:七位或八位数字

银行帐户分支代码:

  • 四位数字

  • 空格或破折号(可选)

  • 三位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_jp_bank_account 找到与该模式匹配的内容。

  • 找到 Keyword_jp_bank_account 中的一个关键字。

  • 下列其中一项为真:

    • 函数 Func_jp_bank_account_branch_code 找到与该模式匹配的内容。

    • 找到 Keyword_jp_bank_branch_code 中的一个关键字。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_jp_bank_account 找到与该模式匹配的内容。

  • 找到 Keyword_jp_bank_account 中的一个关键字。

<!-- Japan Bank Account Number -->
<Entity id="d354f95b-96ee-4b80-80bc-4377312b55bc" patternsProximity="300" recommendedConfidence="75">
  <Version minEngineVersion="15.01.0131.000">
    <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_jp_bank_account" />
          <Match idRef="Keyword_jp_bank_account" />
          <Any minMatches="1">
            <Match idRef="Func_jp_bank_account_branch_code" />
            <Match idRef="Keyword_jp_bank_branch_code" />
          </Any>
      </Pattern>
  </Version>
     <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_bank_account" />
        <Match idRef="Keyword_jp_bank_account" />
    </Pattern>
</Entity>

关键字

Keyword_jp_bank_account Keyword_jp_bank_branch_code
Checking Account Number
Checking Account
Checking Account #
Checking Acct Number
Checking Acct #
Checking Acct No.
Checking Account No.
Bank Account Number
Bank Account
Bank Account #
Bank Acct Number
Bank Acct #
Bank Acct No.
Bank Account No.
Savings Account Number
Savings Account
Savings Account #
Savings Acct Number
Savings Acct #
Savings Acct No.
Savings Account No.
Debit Account Number
Debit Account
Debit Account #
Debit Acct Number
Debit Acct #
Debit Acct No.
Debit Account No.
口座番号を当座預金口座の確認
#アカウントの確認、勘定番号の確認
#勘定の確認
勘定番号の確認
口座番号の確認
銀行口座番号
銀行口座
銀行口座#
銀行の勘定番号
所のacct#
銀行の勘定いいえ
銀行口座番号
普通預金口座番号
預金口座
貯蓄口座#
貯蓄勘定の数
貯蓄勘定#
貯蓄勘定番号
普通預金口座番号
引き落とし口座番号
口座番号
口座番号#
デビットのacct番号
デビット勘定#
デビットACCT の番号
デビット口座番号
Otemachi

日本驾驶证号码

格式:12 位数字

模式:12 个连续数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_jp_drivers_license_number 找到与该模式匹配的内容。

  • 找到 Keyword_jp_drivers_license_number 中的一个关键字。

<!-- Japan Driver's License Number -->
<Entity id="c6011143-d087-451c-8313-7f6d4aed2270" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_drivers_license_number" />
        <Match idRef ="Keyword_jp_drivers_license_number" />
    </Pattern>
</Entity>

关键字

Keyword_jp_drivers_license_number
driver license
drivers license
driver's license
drivers licenses
driver's licenses
driver licenses
Dl#
Dls#
lic#
lics#
運転免許証
運転免許
免許証
免許
運転免許証番号
運転免許番号
免許証番号
免許番号
運転免許証ナンバー
運転免許ナンバー
免許証ナンバー
地転免許証No.
地転免許No.
免許証否.
免許否。
運転免許証#
運転免許#
免許証#
免許#

日本护照号码

格式:两个字母后跟七位数字

模式:两个字母 (不区分大小写) 后跟七位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_jp_passport 找到与该模式匹配的内容。

  • 找到 Keyword_jp_passport 中的一个关键字。

<!-- Japan Passport Number -->
<Entity id="75177310-1a09-4613-bf6d-833aae3743f8" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_passport" />
        <Match idRef="Keyword_jp_passport" />
    </Pattern>
</Entity>

关键字

Keyword_jp_passport
パスポート
パスポート番号
パスポートのNum
パスポート#

日本居民登记号码

格式:11 位数字

模式:11 个连续数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_jp_resident_registration_number 找到与该模式匹配的内容。

  • 找到 Keyword_jp_resident_registration_number 中的一个关键字。

<!-- Japan Resident Registration Number -->
<Entity id="01c1209b-6389-4faf-a5f8-3f7e13899652" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_resident_registration_number" />
        <Match idRef ="Keyword_jp_resident_registration_number" />
    </Pattern>
</Entity>

关键字

Keyword_jp_resident_registration_number
Resident Registration Number
Resident Register Number
Residents Basic Registry Number
Resident Registration No.
Resident Register No.
Residents Basic Registry No.
Basic Resident Register No.
住民登録番号、登録番号をレジデント
住民基本登録番号、登録番号
住民基本レジストリ番号を常駐
登録番号を常駐住民基本台帳登録番号

日本社会保险号码 (SIN)

格式:7-12 位数字

模式:7-12 位数字:

  • 四位数字

  • 一个连字符(可选)

  • 六位数字

    OR

  • 7-12 个连续的数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_jp_sin 找到与该模式匹配的内容。

  • 找到 Keyword_jp_sin 中的一个关键字。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_jp_sin_pre_1997 找到与该模式匹配的内容。

  • 找到 Keyword_jp_sin 中的一个关键字。

<!-- Japan Social Insurance Number -->
<Entity id="c840e719-0896-45bb-84fd-1ed5c95e45ff" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_jp_sin" />
        <Match idRef="Keyword_jp_sin" />
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_sin_pre_1997" />
        <Match idRef="Keyword_jp_sin" />
    </Pattern>
</Entity>

关键字

Keyword_jp_sin
Social Insurance No.
Social Insurance Num
Social Insurance Number
社会保険のテンキー
社会保険番号

马拉西亚身份证号码

格式:包含可选连字符的 12 位数字

模式:12 位数字:

  • 格式为 YYMMDD 的六位数字,即出生日期

  • 一个短划线(可选)

  • 两个字母的出生地代码

  • 一个短划线(可选)

  • 三个随机数字

  • 一位性别代码

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_malaysia_id_card_number 查找与模式匹配的内容。

  • 找到 Keyword_malaysia_id_card_number 中的一个关键字。

<!-- Malaysia ID Card Number -->
</Entity>
      <Entity id="7f0e921c-9677-435b-aba2-bb8f1013c749" patternsProximity="300" recommendedConfidence="85">
        <Pattern confidenceLevel="85">
            <IdMatch idRef="Regex_malaysia_id_card_number" />
            <Match idRef="Keyword_malaysia_id_card_number" />
        </Pattern>
</Entity>

关键字

Keyword_malaysia_id_card_number
MyKad
Identity Card
ID Card
Identification Card
Digital Application Card
Kad Akuan Diri
Kad Aplikasi Digital

荷兰公民服务 (BSN) 号码

格式:包含可选空格的 8-9 位数字

模式:8-9 位数字:

  • 三个数字

  • 一个空格(可选)

  • 三个数字

  • 一个空格(可选)

  • 2-3 个数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_netherlands_bsn 找到与该模式匹配的内容。

  • 找到 Keyword_netherlands_bsn 中的一个关键字。

  • 函数 Func_eu_date 以正确的日期格式查找日期。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 65% 确信它检测到这种类型的敏感信息:

  • 函数 Func_netherlands_bsn 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Netherlands Citizen's Service (BSN) Number -->
<Entity id="c5f54253-ef7e-44f6-a578-440ed67e946d" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_netherlands_bsn"/>
     <Match idRef="Keyword_netherlands_bsn"/>
     <Match idRef="Func_eu_date"/>
  </Pattern>
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Func_netherlands_bsn"/>
  </Pattern>
</Entity>

关键字

Keyword_netherlands_bsn
Citizen service number
BSN
Burgerservicenummer
Sofinummer
Persoonsgebonden nummer
Persoonsnummer

新西兰卫生部号码

格式:三个字母、一个空格 (可选) 和四位数字

模式:三个字母 (不区分大小写,) 一个空格 (可选) 四位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_new_zealand_ministry_of_health_number 找到与该模式匹配的内容。

  • 找到 Keyword_nz_terms 中的一个关键字。

  • 校验和通过。

<!-- New Zealand Health Number -->
<Entity id="2b71c1c8-d14e-4430-82dc-fd1ed6bf05c7" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_new_zealand_ministry_of_health_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_nz_terms" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_nz_terms
NHI
New Zealand
运行状况
治疗

挪威身份证号

格式:11 位数字

模式:11 位数字:

  • DDMMYY 格式的六位数字是出生日期

  • 三位个人号码

  • 两个校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_norway_id_number 找到与该模式匹配的内容。

  • 找到 Keyword_norway_id_number 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_norway_id_numbe 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Norway Identification Number -->
<Entity id="d4c8a798-e9f2-4bd3-9652-500d24080fc3" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_norway_id_number"/>
     <Match idRef="Keyword_norway_id_number"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_norway_id_number"/>
  </Pattern>
</Entity>

关键字

Keyword_norway_id_number
Personal identification number
Norwegian ID Number
ID Number
识别
Personnummer
Fødselsnummer

菲律宾统一多用途身份证号码

格式:12 位数字,用连字符分隔

模式:12 位数字:

  • 四个数字

  • 一个连字符

  • 七个数字

  • 一个连字符

  • 一个数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_philippines_unified_id 查找与模式匹配的内容。

  • 找到 Keyword_philippines_id 中的一个关键字。

<!-- Philippines Unified Multi-Purpose ID number -->
<Entity id="019b39dd-8c25-4765-91a3-d9c6baf3c3b3" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_philippines_unified_id"/>
     <Match idRef="Keyword_philippines_id"/>
  </Pattern>
</Entity>

关键字

Keyword_philippines_id
Unified Multi-Purpose ID
UMID
Identity Card
Pinag-isang Multi-Layunin ID

波兰身份证

格式:三个字母和六位数字

模式:三个字母 (不区分大小写) 后跟六位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_polish_national_id 找到与该模式匹配的内容。

  • 找到 Keyword_polish_national_id_passport_number 中的一个关键字。

  • 校验和通过。

<!-- Poland Identity Card-->
<Entity id="25E64989-ED5D-40CA-A939-6C14183BB7BF" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_polish_national_id" />
          <Match idRef="Keyword_polish_national_id_passport_number" />
      </Pattern>
</Entity>

关键字

Keyword_polish_national_id_passport_number
Nazwa i nr dowodu tożsamości
Dowód Tożsamości
道琼斯指数。 操作系统。

波兰国家/地区身份证号码 (PESEL)

格式:11 位数字

模式:11 个连续数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_pesel_identification_number 找到与该模式匹配的内容。

  • 找到 Keyword_pesel_identification_number 中的一个关键字。

  • 校验和通过。

<!-- Poland National ID (PESEL) -->
<Entity id="E3AAF206-4297-412F-9E06-BA8487E22456" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_pesel_identification_number" />
          <Match idRef="Keyword_pesel_identification_number" />
      </Pattern>
</Entity>

关键字

Keyword_pesel_identification_number
Nr PESEL
PESEL

波兰护照

格式:两个字母和七位数字

模式:两个字母 (不区分大小写) 后跟七位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_polish_passport_number 找到与该模式匹配的内容。

  • 找到 Keyword_polish_national_id_passport_number 中的一个关键字。

  • 校验和通过。

<!-- Poland Passport Number -->
<Entity id="03937FB5-D2B6-4487-B61F-0F8BFF7C3517" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_polish_passport_number" />
          <Match idRef="Keyword_polish_national_id_passport_number" />
      </Pattern>
</Entity>
</Version>

关键字

Keyword_polish_national_id_passport_number
Nazwa i nr dowodu tożsamości
Dowód Tożsamości
道琼斯指数。 操作系统。

葡萄牙公民卡号

格式:八位数字

模式:八位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_portugal_citizen_card 查找与模式匹配的内容。

  • 找到 Keyword_portugal_citizen_card 中的一个关键字。

<!-- Portugal Citizen Card Number -->
<Entity id="91a7ece2-add4-4986-9a15-c84544d81ecd" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_portugal_citizen_card"/>
     <Match idRef="Keyword_portugal_citizen_card"/>
  </Pattern>
</Entity>

关键字

Keyword_portugal_citizen_card
Citizen Card
National ID Card
CC
Cartão de Cidadão
Bilhete de Identidade

沙特阿拉伯国民 ID

格式:10 位数字

模式:10 个连续数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_saudi_arabia_national_id 查找与模式匹配的内容。

  • 找到 Keyword_saudi_arabia_national_id 中的一个关键字。

<!-- Saudi Arabia National ID -->
<Entity id="8c5a0ba8-404a-41a3-8871-746aa21ee6c0" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_saudi_arabia_national_id" />
        <Any minMatches="1">
          <Match idRef="Keyword_saudi_arabia_national_id" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_saudi_arabia_national_id
Identification Card
I card number
ID number
الوطنية الهوية بطاقة رقم

新加坡国家登记身份证 (NRIC) 号

格式:九个字母和数字

模式:九个字母和数字:

  • 字母“F”、“G”、“S”或“T”(不区分大小写)

  • 七个数字

  • 一个字母校验位

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_singapore_nric 查找与模式匹配的内容。

  • 找到 Keyword_singapore_nric 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_singapore_nric 查找与模式匹配的内容。

  • 校验和通过。

<!-- Singapore National Registration Identity Card (NRIC) Number -->
<Entity id="cead390a-dd83-4856-9751-fb6dc98c34da" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_singapore_nric"/>
     <Match idRef="Keyword_singapore_nric"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_singapore_nric"/>
  </Pattern>
</Entity>

关键字

Keyword_singapore_nric
National Registration Identity Card
Identity Card Number
NRIC
Ic
Foreign Identification Number

身份证
身份證

南非身份证号

格式:13 位数字,可能包含空格

模式:13 位数字:

  • 格式为 YYMMDD 的六位数字,即出生日期

  • 四个数字

  • 一位公民指示码

  • 数字“8”或“9”

  • 一个数字,即校验和数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_south_africa_identification_number 找到与该模式匹配的内容。

  • 找到 Keyword_south_africa_identification_number 中的一个关键字。

  • 校验和通过。

<!-- South Africa Identification Number -->
<Entity id="e2adf7cb-8ea6-4048-a2ed-d89eb65f2780" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_south_africa_identification_number"/>
     <Match idRef="Keyword_south_africa_identification_number"/>
  </Pattern>
</Entity>

关键字

Keyword_south_africa_identification_number
Identity card
ID
识别

韩国居民注册号码

格式:包含连字符的 13 位数字

模式:13 位数字:

  • 以 YYMMDD 格式表示出生日期的六位数字

  • 一个连字符

  • 一个数字,由世纪和性别

  • 四位数字的出生地区代码

  • 一个数字,用于区分前面数字均相同的人

  • 一个校验位。

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_south_korea_resident_number 找到与该模式匹配的内容。

  • 找到 Keyword_south_korea_resident_number 中的一个关键字。

  • 校验和通过。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_south_korea_resident_number 找到与该模式匹配的内容。

  • 校验和通过。

<!-- South Korea Resident Registration Number -->
<Entity id="5b802e18-ba80-44c4-bc83-bf2ad36ae36a" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_south_korea_resident_number"/>
     <Match idRef="Keyword_south_korea_resident_number"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_south_korea_resident_number"/>
  </Pattern>
</Entity>

关键字

Keyword_south_korea_resident_number
National ID card
Citizen's Registration Number
Jumin deungnok beonho
RRN
주민등록번호

西班牙社会保险号码 (SSN)

格式:11-12 位数字

模式:11-12 位数字:

  • 两位数字

  • 正斜杠(可选)

  • 7-8 位数字

  • 正斜杠(可选)

  • 两位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_spanish_social_security_number 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Spain SSN -->
<Entity id="5df987c0-8eae-4bce-ace7-b316347f3070" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_spanish_social_security_number" />
    </Pattern>
</Entity>

关键字:无

瑞典国家/地区身份证号码

格式:10 或 12 位数字和可选的分隔符

模式:10 或 12 位数字,可选分隔符:

  • 2-4 位数字(可选)

  • 采用日期格式 YYMMDD 的六位数字

  • “-”或“+”(可选)的分隔符,加

  • 四个数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_swedish_national_identifier 找到与该模式匹配的内容。

  • 校验和通过。

<!-- Sweden National ID -->
<Entity id="f69aaf40-79be-4fac-8f05-fd1910d272c8" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_swedish_national_identifier" />
    </Pattern>
</Entity>

关键字:无

瑞典护照号码

格式:八位数字

模式:八位连续数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_sweden_passport_number 查找与模式匹配的内容。

  • 下列其中一项为真:

    • 找到 Keyword_passport 中的一个关键字。

    • 找到 Keyword_sweden_passport 中的一个关键字。

<!-- Sweden Passport Number -->
<Entity id="ba4e7456-55a9-4d89-9140-c33673553526" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_sweden_passport_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_passport" />
          <Match idRef="Keyword_sweden_passport" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_sweden_passport Keyword_passport
visa requirements
Alien Registration Card
Schengen visas
Schengen visa
Visa Processing
Visa Type
Single Entry
Multiple Entry
G3 Processing Fees
Passport Number
Passport No
Passport #
护照#
PassportID
Passportno
passport number
パスポート
パスポート番号
パスポートのNum
パスポート#
Numéro de passeport
Passeport n °
Passeport Non
Passeport #
Passeport#
PasseportNon
Passeportn °

SWIFT 代码

格式:四个字母,后跟 5-31 个字母或数字

模式:四个字母后跟 5-31 个字母或数字:

  • 四个字母的银行代码(不区分大小写)

  • 可选空格

  • 4-28 个字母或数字(基本银行账号 (BBAN))

  • 可选空格

  • 1-3 个字母或数字(BBAN 的剩余内容)

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_swift 查找与模式匹配的内容。

  • 找到 Keyword_swift 中的一个关键字。

<Entity id="cb2ab58c-9cb8-4c81-baf8-a4e106791df4" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_swift" />
        <Match idRef="Keyword_swift" />
    </Pattern>
</Entity>

关键字

Keyword_swift
international organization for standardization 9362
iso 9362
iso9362
迅速#
swift code
swift number
swiftroutingnumber
swift code
swift number #
swift routing number
bic number
bic code
bic #
bic#
bank identifier code
標準化9362
迅速#
SWIFT コード
SWIFT 番号
迅速なルーティング番号
BIC 番号
BIC コード
銀行識別コードのための国際組織
Organisation internationale de normalisation 9362
rapide #
code SWIFT
le numéro de swift
swift numéro d'acheminement
le numéro BIC
# BIC
code identificateur de banque

台湾 ID

格式:一个英文字母 () 后跟九位数字

模式:一个英文字母 () 后跟九位数字:

  • 一个字母(英文,不区分大小写)

  • 数字“1”或“2”

  • 八位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_taiwanese_national_id 找到与该模式匹配的内容。

  • 找到 Keyword_taiwanese_national_id 中的一个关键字。

  • 校验和通过。

<!-- Taiwanese National ID -->
<Entity id="4C7BFC34-8DD1-421D-8FB7-6C6182C2AF03" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_taiwanese_national_id" />
          <Match idRef="Keyword_taiwanese_national_id" />
      </Pattern>
</Entity>

关键字

Keyword_taiwanese_national_id
身份證字號
身份證
身份證號碼
身份證號
身分證字號
身分證
身分證號碼
身份證號
身分證統一編號
國民身分證統一編號
簽名
蓋章
簽名或蓋章
簽章

台湾护照号码

格式

  • 生物识别护照号码:9位数字

  • 非生物识别护照号码:9位数字

模式

  • 生物护照号码

    • 数字“3”

    • 八位数字

  • 非生物识别护照号码:9位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_taiwan_passport 查找与模式匹配的内容。

  • 找到 Keyword_taiwan_passport 中的一个关键字。

<!-- Taiwan Passport Number -->
<Entity id="e7251cb4-4c2c-41df-963e-924eb3dae04a" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_taiwan_passport"/>
     <Match idRef="Keyword_taiwan_passport"/>
  </Pattern>
</Entity>

关键字

Keyword_taiwan_passport
ROC passport number
Passport number
Passport no
Passport Num
Passport #
护照
中華民國護照
Zhōnghuá Mínguó hùzhào

台湾居民证 (ARC/TARC) 号码

格式:10 个字母和数字

模式:10 个字母和数字:

  • 两个字母(不区分大小写)

  • 八位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_taiwan_resident_certificate 查找与模式匹配的内容。

  • 找到 Keyword_taiwan_resident_certificate 中的一个关键字。

<!-- Taiwan Resident Certificate (ARC/TARC) -->
<Entity id="48269fec-05ea-46ea-b326-f5623a58c6e9" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_taiwan_resident_certificate"/>
     <Match idRef="Keyword_taiwan_resident_certificate"/>
  </Pattern>
</Entity>

关键字

Keyword_taiwan_resident_certificate
Resident Certificate
Resident Cert
Resident Cert.
Identification card
Alien Resident Certificate
ARC
Taiwan Area Resident Certificate
TARC
居留證
外僑居留證
台灣地區居留證

英国驾驶证号码

格式:指定格式的 18 个字母和数字的组合

模式:18 个字母和数字:

  • 用五个字母(不区分大小写)或数字“9”来代替一个字母

  • 一位数字

  • 采用日期格式 DDMMY 的五位数字,表示出生日期

  • 用两个字母(不区分大小写)或数字“9”来代替一个字母

  • 五位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_uk_drivers_license 找到与该模式匹配的内容。

  • 找到 Keyword_uk_drivers_license 中的一个关键字。

  • 校验和通过。

<!-- U.K. Driver's License Number -->
<Entity id="f93de4be-d94c-40df-a8be-461738047551" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_uk_drivers_license" />
        <Match idRef="Keyword_uk_drivers_license" />
    </Pattern>
</Entity>

关键字

Keyword_uk_drivers_license
DVLA
light vans
四轮摩托车
motor cars
125cc
sidecar
三轮车
摩托车
照片卡许可证
learner drivers
licence holder
licence holders
driving licences
driving licence
dual control car

英国选民名册号码

格式:两个字母后跟 1-4 位数字

模式:两个字母 (不区分大小写) 后跟 1-4 个数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_uk_electoral 查找与模式匹配的内容。

  • 找到 Keyword_uk_electoral 中的一个关键字。

<!-- U.K. Electoral Number -->
<Entity id="a3eea206-dc0c-4f06-9e22-aa1be3059963" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_uk_electoral" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_electoral" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_uk_electoral
council nomination
nomination form
electoral register
electoral roll

英国国家卫生服务号码

格式:10-17 位数字,用空格分隔

模式:10-17 位数字:

  • 3 或 10 位数字

  • 一个空格

  • 三位数字

  • 一个空格

  • 四位数字

校验和:是

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_uk_nhs_number 找到与该模式匹配的内容。

  • 下列其中一项为真:

    • 找到 Keyword_uk_nhs_number 中的一个关键字。

    • 找到 Keyword_uk_nhs_number1 中的一个关键字。

    • 找到 Keyword_uk_nhs_number_dob 中的一个关键字。

  • 校验和通过。

<!-- U.K. NHS Number -->
<Entity id="3192014e-2a16-44e9-aa69-4b20375c9a78" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_uk_nhs_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_nhs_number" />
          <Match idRef="Keyword_uk_nhs_number1" />
          <Match idRef="Keyword_uk_nhs_number_dob" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_uk_nhs_number Keyword_uk_nhs_number1 Keyword_uk_nhs_number_dob
national health service
Nhs
health services authority
health authority
患者 ID
patient identification
patient no
patient number
Gp
DOB
D.O.B
Date of Birth
Birth Date

英国国家保险号码 (NINO)

格式:九个字母和数字,每对字母和数字可选用空格或短划线分隔

模式:九个字母和数字,每对字母和数字可选用空格或短划线分隔:

  • 两个字母(不区分大小写),均不可以是 D、F、I、Q、U 或 V。此外,第二个字母不能是 O。也不允许使用以下组合:BG、GB、KN、NK、NT、TN 和 ZZ。

  • 六位数字

  • 空格或破折号(可选)

  • 两位数字

  • 空格或破折号(可选)

  • 两位数字

  • 空格或破折号(可选)

  • 两位数字

  • 一个可以是 A、B、C、D 的字母;或一个空格。

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_uk_nino 找到与该模式匹配的内容。

  • 找到 Keyword_uk_nino 中的一个关键字。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_uk_nino 找到与该模式匹配的内容。

  • 找不到关键字 (keyword) Keyword_uk_nino

<!-- U.K. NINO -->
<Entity id="16c07343-c26f-49d2-a987-3daf717e94cc" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_uk_nino" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_nino" />
        </Any>
    </Pattern>
     <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_uk_nino" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_uk_nino" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_uk_nino
national insurance number
national insurance contributions
protection act
保险
social security number
insurance application
medical application
social insurance
medical attention
social security
great britain
保险

美国/英国护照号码

格式:九位数字

模式:九个连续数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_usa_uk_passport 找到与该模式匹配的内容。

  • 找到 Keyword_passport 中的一个关键字。

<Entity id="178ec42a-18b4-47cc-85c7-d62c92fd67f8" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_usa_uk_passport" />
        <Match idRef="Keyword_passport" />
    </Pattern>
</Entity>

关键字

Keyword_passport
Passport Number
Passport No
Passport #
护照#
PassportID
Passportno
passport number
パスポート
パスポート番号
パスポートのNum
パスポート#
Numéro de passeport
Passeport n °
Passeport Non
Passeport #
Passeport#
PasseportNon
Passeportn °

美国银行帐号

格式:4-17 位数字

模式:4-17 个连续数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 正则表达式 Regex_usa_bank_account_number 查找与模式匹配的内容。

  • 找到 Keyword_usa_Bank_Account 中的一个关键字。

<!-- U.S. Bank Account Number -->
<Entity id="a2ce32a8-f935-4bb6-8e96-2a5157672e2c" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_usa_bank_account_number" />
        <Match idRef="Keyword_usa_Bank_Account" />
    </Pattern>
</Entity>

关键字

Keyword_usa_Bank_Account
Checking Account Number
Checking Account
Checking Account #
Checking Acct Number
Checking Acct #
Checking Acct No.
Checking Account No.
Bank Account Number
Bank Account #
Bank Acct Number
Bank Acct #
Bank Acct No.
Bank Account No.
Savings Account Number
Savings Account.
Savings Account #
Savings Acct Number
Savings Acct #
Savings Acct No.
Savings Account No.
Debit Account Number
Debit Account
Debit Account #
Debit Acct Number
Debit Acct #
Debit Acct No.
Debit Account No.

美国驾驶证号码

格式:取决于状态

模式:取决于州 -- 例如,纽约:

  • 诸如 ddd ddd ddd 的 9 个数字的格式将匹配

  • 诸如 dddddddd 的 9 个数字将不匹配。

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_new_york_drivers_license_number 找到与该模式匹配的内容。

  • 找到 Keyword_[state_name]_drivers_license_name 中的一个关键字。

  • 找到 Keyword_us_drivers_license 中的一个关键字。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 65% 确信它检测到这种类型的敏感信息:

  • 函数 Func_new_york_drivers_license_number 找到与该模式匹配的内容。

  • 找到 Keyword_[state_name]_drivers_license_name 中的一个关键字。

  • 找到 Keyword_us_drivers_license_abbreviations 中的一个关键字。

  • 找不到关键字 (keyword) Keyword_us_drivers_license

<Pattern confidenceLevel="75">
        <IdMatch idRef="Func_new_york_drivers_license_number" />
        <Match idRef="Keyword_new_york_drivers_license_name" />
        <Match idRef="Keyword_us_drivers_license" />
    </Pattern>
    <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_new_york_drivers_license_number" />
        <Match idRef="Keyword_new_york_drivers_license_name" />
        <Match idRef="Keyword_us_drivers_license_abbreviations" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_us_drivers_license" />
        </Any>
    </Pattern>

关键字

Keyword_us_drivers_license_abbreviations Keyword_us_drivers_license Keyword_[state_name]_drivers_license_name
Dl
Dls
民盟
CDLS
ID
ID
Dl#
Dls#
民盟#
CDLS#
Id#
Id#
ID number
ID numbers
LIC
LIC#
DriverLic
DriverLics
DriverLicense
DriverLicenses
Driver Lic
Driver Lics
Driver License
Driver Licenses
DriversLic
DriversLics
DriversLicense
DriversLicenses
Drivers Lic
Drivers Lics
Drivers License
Drivers Licenses
Driver'Lic
Driver'Lics
驾照
驾照
Driver' Lic
Driver' Lics
Driver' License
Driver' Licenses
Driver'sLic
Driver'sLics
Driver'sLicense
Driver'sLicenses
Driver's Lic
Driver's Lics
Driver's License
Driver's Licenses
identification number
identification numbers
identification #
ID card
身份证
identification card
identification cards
DriverLic#
DriverLics#
DriverLicense#
DriverLicenses#
Driver Lic#
Driver Lics#
Driver License#
Driver Licenses#
DriversLic#
DriversLics#
DriversLicense#
DriversLicenses#
Drivers Lic#
Drivers Lics#
Drivers License#
Drivers Licenses#
Driver'Lic#
Driver'Lics#
驾照#
驾照#
Driver' Lic#
Driver' Lics#
Driver' License#
Driver' Licenses#
Driver'sLic#
Driver'sLics#
Driver'sLicense#
Driver'sLicenses#
Driver's Lic#
Driver's Lics#
Driver's License#
Driver's Licenses#
ID 卡#
身份证#
identification card#
identification cards#
州缩写(例如,“NY”)
州名称(例如,“New York”)

美国单独的纳税人标识号 (ITIN)

格式:九位数字,以“9”开头,包含“7”或“8”作为第四位数字,可以选择用空格或短划线设置格式

模式

格式 化:

  • 数字“9”

  • 两位数字

  • 一个空格或破折号

  • “7”或“8”

  • 一位数字

  • 一个空格或破折号

  • 四位数字

无格式:

  • 数字“9”

  • 两位数字

  • “7”或“8”

  • 五位数字

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_formatted_itin 找到与该模式匹配的内容。

  • 下列至少其中一项为真:

    • 找到 Keyword_itin 中的一个关键字。

    • 函数 Func_us_address 以正确的日期格式查找地址。

    • 函数 Func_us_date 以正确的日期格式查找日期。

    • 找到 Keyword_itin_collaborative 中的一个关键字。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_unformatted_itin 找到与该模式匹配的内容。

  • 下列至少其中一项为真:

    • 找到 Keyword_itin_collaborative 中的一个关键字。

    • 函数 Func_us_address 以正确的日期格式查找地址。

    • 函数 Func_us_date 以正确的日期格式查找日期。

<!-- U.S. Individual Taxpayer Identification Number (ITIN) -->
<Entity id="e55e2a32-f92d-4985-a35d-a0b269eb687b" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_formatted_itin" />
        <Any minMatches="1">
          <Match idRef="Keyword_itin" />
          <Match idRef="Func_us_address" />
          <Match idRef="Func_us_date" />
          <Match idRef="Keyword_itin_collaborative" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_itin" />
        <Match idRef="Keyword_itin" />
        <Any minMatches="1">
          <Match idRef="Keyword_itin_collaborative" />
          <Match idRef="Func_us_address" />
          <Match idRef="Func_us_date" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_itin Keyword_itin_collaborative
纳税人
税务 ID
tax identification
itin
Ssn

social security
tax payer
itins
taxid
individual taxpayer
许可证
Dl
DOB
出生日期
Birthday
Date of Birth

美国社会保险号 (SSN)

格式:九位数字,可能采用格式化或未格式化模式

注意

如果在 2011 年中旬前发布,则 SSN 具有强格式,即数字的某部分必须介于某个有效的范围中(但是没有校验和)。

模式:四个函数以四种不同模式查找 SSN:

  • Func_ssn 查找具有 2011 年之前的强格式的 SSN,这些 SSN 格式化为短划线或空格 (ddd-dd 或 ddd dd)

  • Func_unformatted_ssn 查找具有 2011 年之前的强格式的 SSN,这些 SSN 未格式化为 9 个连续数字 (ddd)

  • Func_randomized_formatted_ssn 查找 2011 年后的 SSN,这些 SSN 格式为短划线或空格 (ddd-dd 或 dd)

  • Func_randomized_unformatted_ssn 查找 2011 年后未格式化为 9 位连续数字的 SSN (ddddd)

校验和:否

定义

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 85% 确信它检测到这种类型的敏感信息:

  • 函数 Func_ssn 找到与该模式匹配的内容。

  • 下列至少其中一项为真:

    • 找到 Keyword_ssn 中的一个关键字。

    • 函数 Func_us_date 以正确的日期格式查找日期。

    • 函数 Func_us_address 以正确的日期格式查找地址。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 75% 确信它检测到这种类型的敏感信息:

  • 函数 Func_unformatted_ssn 找到与该模式匹配的内容。

  • 找到 Keyword_ssn 中的一个关键字。

  • 下列至少其中一项为真:

    • 函数 Func_us_date 以正确的日期格式查找日期。

    • 函数 Func_us_address 以正确的日期格式查找地址。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 65% 确信它检测到这种类型的敏感信息:

  • 函数 Func_randomized_formatted_ssn 找到与该模式匹配的内容。

  • 函数 Func_ssn 找不到与模式匹配的内容。

  • 下列至少其中一项为真:

    • 找到 Keyword_ssn 中的一个关键字。

    • 函数 Func_us_date 以正确的日期格式查找日期。

    • 函数 Func_us_address 以正确的日期格式查找地址。

在 300 个字符的相似度内,如果出现以下情况,DLP 策略 55% 确信它检测到这种类型的敏感信息:

  • 函数 Func_randomized_unformatted_ssn 找到与该模式匹配的内容。

  • 找到 Keyword_ssn 中的一个关键字。

  • 函数 Func_unformatted_ssn 找不到与模式匹配的内容。

  • 下列至少其中一项为真:

    • 函数 Func_us_date 以正确的日期格式查找日期。

    • 函数 Func_us_address 以正确的日期格式查找地址。

<!-- U.S. Social Security Number (SSN) -->
<Entity id="a44669fe-0d48-453d-a9b1-2cc83f2cba77" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_ssn" />
        <Any minMatches="1">
          <Match idRef="Keyword_ssn" />
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_ssn" />
        <Match idRef="Keyword_ssn" />
        <Any minMatches="1">
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_randomized_formatted_ssn" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Func_ssn" />
        </Any>
        <Any minMatches="1">
          <Match idRef="Keyword_ssn" />
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="55">
        <IdMatch idRef="Func_randomized_unformatted_ssn" />
        <Match idRef="Keyword_ssn" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Func_unformatted_ssn" />
        </Any>
        <Any minMatches="1">
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
</Entity>

关键字

Keyword_ssn
Social Security
Social Security#
Soc Sec
Ssn
SSNS
Ssn#
SS#
Ssid