Типы конфиденциальной информации в Exchange Server

Защита от потери данных включает 80 типов конфиденциальной информации, готовых к использованию в соответствующих политиках. В этой статье перечислены все эти типы конфиденциальной информации и показано, каким именно образом политика защиты от потери данных выявляет каждый тип. Тип конфиденциальной информации определяется шаблоном, который можно идентифицировать регулярным выражением или функцией. Кроме того, для идентификации типа конфиденциальной информации могут использоваться подкрепляющие доказательства, такие как ключевые слова и контрольные суммы. Уровень вероятности и расположение слов и знаков также используются в процессе оценки.

Код банка ABA

Формат: девять цифр, которые могут иметь форматированный или неформатированный шаблон.

Шаблон:

Форматированные:

  • четыре цифры, начиная с 0, 1, 2, 3, 6, 7 или 8;

  • дефис;

  • четыре цифры;

  • дефис;

  • цифра.

Неформатировано: девять последовательных цифр, начиная с 0, 1, 2, 3, 6, 7 или 8

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_aba_routing находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_ABA_Routing.

<!-- ABA Routing Number -->
<Entity id="cb353f78-2b72-4c3c-8827-92ebe4f69fdf" patternsProximity="300" recommendedConfidence="75">
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_aba_routing" />
        <Match idRef="Keyword_ABA_Routing" />
      </Pattern>
 </Entity>

Ключевые слова:

Keyword_ABA_Routing
Aba
aba#
aba routing #
aba routing number
Aba#
abarouting#
aba number
abaroutingnumber
american bank association routing #
american bank association routing number
americanbankassociationrouting#
americanbankassociationroutingnumber
bank routing number
маршрутизация банка#
bank routing number
routing transit number
RTN

Номер внутреннего удостоверения личности для Аргентины (DNI)

Формат: восемь цифр, разделенных точками

Шаблон: восемь цифр:

  • две цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры;

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_argentina_national_id находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_argentina_national_id.

<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
      <IdMatch idRef="Regex_argentina_national_id"/>
      <Match idRef="Keyword_argentina_national_id"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_argentina_national_id
Argentina National Identity number
Удостоверение
Удостоверение личности
DNI
Национальный реестр лиц NIC
Documento Nacional de Identidad
Registro Nacional de las Personas
Identidad
Identificación

Номер банковского счета для Австралии

Формат: 6–10 цифр с номером банковского государственного филиала или без нее

Шаблон: номер счета — 6–10 цифр. Номер филиала государственного банка Австралии

  • Три цифры

  • дефис;

  • Три цифры

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_australia_bank_account_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_australia_bank_account_number.

  • Регулярное выражение Regex_australia_bank_account_number_bsb находит содержимое, соответствующее шаблону.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_australia_bank_account_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_australia_bank_account_number.

<!-- Australia Bank Account Number -->
<Entity id="74a54de9-2a30-4aa0-a8aa-3d9327fc07c7" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_australia_bank_account_number" />
        <Match idRef="Keyword_australia_bank_account_number" />
        <Match idRef="Regex_australia_bank_account_number_bsb" />
  </Pattern>
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_australia_bank_account_number" />
        <Match idRef="Keyword_australia_bank_account_number" />
  </Pattern>
 </Entity>

Ключевые слова:

Keyword_australia_bank_account_number
swift bank code
correspondent bank
base currency
usa account
holder address
bank address
information account
fund transfers
bank charges
bank details
banking information
full names
Идея

Номер водительского удостоверения для Австралии

Формат: девять букв и цифр

Шаблон: девять букв и цифр:

  • две цифры или буквы (без учета регистра);

  • две цифры;

  • пять цифр или букв (без учета регистра).

    ИЛИ

  • 1–2 дополнительные буквы (без учета регистра);

  • 4–9 цифр.

    ИЛИ

  • девять цифр или букв (без учета регистра).

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_australia_drivers_license_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_australia_drivers_license_number.

  • Ключевое слово из Keyword_australia_drivers_license_number_exclusions не найден.

<!-- Australia Drivers License Number -->
<Entity id="1cbbc8f5-9216-4392-9eb5-5ac2298d1356" patternsProximity="300" recommendedConfidence="75">
   <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_australia_drivers_license_number" />
        <Match idRef="Keyword_australia_drivers_license_number" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_australia_drivers_license_number_exclusions" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_australia_drivers_license_number Keyword_australia_drivers_license_number_exclusions
international driving permits
australian automobile association
Сидней nsw
international driving permit
DriverLicence
DriverLicences
Driver Lic
Driver Licence
Driver Licences
DriversLic
ДрайверыЛицензация
ДрайверыЛицензии
Drivers Lic
Drivers Lics
Drivers Licence
Drivers Licences
Driver'Lic
Driver'Lics
Водительские права
Водительские права
Driver' Lic
Driver' Lics
Driver' Licence
Driver' Licences
Driver'sLic
Driver'sLics
Водительская лицензия
Лицензий драйверов
Driver's Lic
Driver's Lics
Driver's Licence
Driver's Licences
DriverLic#
DriverLics#
DriverLicence#
DriverLicences#
Driver Lic#
Driver Lics#
Driver Licence#
Driver Licences#
DriversLic#
DriversLics#
ДрайверыЛицензация#
ДрайверыЛицензии#
Drivers Lic#
Drivers Lics#
Drivers Licence#
Drivers Licences#
Driver'Lic#
Driver'Lics#
Водительские права#
Водительские права#
Driver' Lic#
Driver' Lics#
Driver' Licence#
Driver' Licences#
Driver'sLic#
Driver'sLics#
Водительская лицензия#
Лицензий драйверов#
Driver's Lic#
Driver's Lics#
Driver's Licence#
Driver's Licences#
Ааа
DriverLicense
DriverLicenses
Driver License
Driver Licenses
ДрайверыЛицензии
ДрайверыЛицензии
Drivers License
Drivers Licenses
Водительские права
Водительские лицензии
Driver' License
Driver' Licenses
Лицензия драйвера
Лицензии драйвера
Driver's License
Driver's Licenses
DriverLicense#
DriverLicenses#
Driver License#
Driver Licenses#
ДрайверыЛицензии#
ДрайверыЛицензии#
Drivers License#
Drivers Licenses#
Водительские права#
Водительские лицензии#
Driver' License#
Driver' Licenses#
Лицензия драйвера#
Лицензии драйвера#
Driver's License#
Driver's Licenses#

Номер карты медицинского страхования для Австралии

Формат: 10–11 цифр

Шаблон: 10–11 цифр:

  • Первая цифра находится в диапазоне 2–6.

  • Девятая цифра — проверочная.

  • Десятая цифра — цифра серии.

  • Одиннадцатая цифра (необязательно) — индивидуальный номер.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 95 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_australian_medical_account_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_Australia_Medical_Account_Number.

  • контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_australian_medical_account_number находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Australia Medical Account Number -->
<Entity id="104a99a0-3d3b-4542-a40d-ab0b9e1efe63" recommendedConfidence="85" patternsProximity="300">
    <Pattern confidenceLevel="95">
     <IdMatch idRef="Func_australian_medical_account_number"/>
     <Any minMatches="1">
     <Match idRef="Keyword_Australia_Medical_Account_Number"/>
     </Any>
  </Pattern>
<Pattern confidenceLevel="85">
     <IdMatch idRef="Func_australian_medical_account_number"/>
     <Any minMatches="0" maxMatches="0">
  <Match idRef="Keyword_Australia_Medical_Account_Number"/>
     </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_Australia_Medical_Account_Number
bank account details
medicare payments
mortgage account
bank payments
information branch
credit card loan
department of human services
local service
Medicare

Номер паспорта гражданина Австралии

Формат: буква, за которой следует семь цифр.

Шаблон: буква (без учета регистра), за которой следуют семь цифр.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_australia_passport_number находит содержимое, соответствующее шаблону.

  • Найдена ключевое слово из Keyword_passport или Keyword_australia_passport_number .

<!-- Australia Passport Number -->
<Entity id="29869db6-602d-4853-ab93-3484f905df50" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_australia_passport_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_passport" />
          <Match idRef="Keyword_australia_passport_number" />
        </Any>
   </Pattern>
</Entity>

Ключевые слова:

Keyword_passport Keyword_australia_passport_number
Passport Number
Passport No
Passport#
Паспорт#
PassportID
Passportno
passportnumber
パスポート
パスポート番号
パスポートのNum
パスポート#
Numéro de passeport
Passeport n °
Passeport Non
Passeport#
Passeport#
PasseportNon
Passeportn °
Паспорт
passport details
immigration and citizenship
commonwealth of australia
department of immigration
residential address
department of immigration and citizenship
Визы
national identity card
passport number
travel document
issuing authority

Номер налогоплательщика для Австралии

Формат: 8–9 цифр

Шаблон: 8–9 цифры обычно представлены пробелами следующим образом:

  • Три цифры

  • Необязательный пробел

  • Три цифры

  • Необязательный пробел

  • 2–3 цифры, причем последняя цифра — контрольная

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 95 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_australian_tax_file_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_Australia_Tax_File_Number.

  • Ключевое слово из Keyword_number_exclusions не найден.

  • контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_australian_tax_file_number находит содержимое, соответствующее шаблону.

  • Ключевое слово из Keyword_Australia_Tax_File_Number или Keyword_number_exclusions не найден.

  • Контрольная сумма проходит проверку.

<!-- Australia Tax File Number -->
<Entity id="e29bc95f-ff70-4a37-aa01-04d17360a4c5" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="95">
        <IdMatch idRef="Func_australian_tax_file_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_Australia_Tax_File_Number" />
        </Any>
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_number_exclusions" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_australian_tax_file_number" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_Australia_Tax_File_Number" />
          <Match idRef="Keyword_number_exclusions" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_Australia_Tax_File_Number Keyword_number_exclusions
australian business number
marginal tax rate
medicare levy
portfolio number
service veterans
withholding tax
individual tax return
tax file number
00000000
11111111
22222222
33333333
44444444
55555555
66666666
77777777
88888888
99999999
000000000
111111111
222222222
333333333
444444444
555555555
666666666
777777777
888888888
999999999
0000000000
1111111111
2222222222
3333333333
4444444444
5555555555
6666666666
7777777777
8888888888
9999999999

Внутренний идентификационный номер гражданина Бельгии

Формат: 11 цифр плюс разделители

Шаблон: 11 цифр плюс разделители:

  • шесть цифр и две точки в формате ГГ.ММ.ДД для даты рождения;

  • дефис;

  • три последовательные цифры (нечетные для мужчин, четные для женщин);

  • точка;

  • две проверочные цифры.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_belgium_national_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_belgium_national_number.

  • Контрольная сумма проходит проверку.

<!-- Belgium National Number -->
  <Entity id="fb969c9e-0fd1-4b18-8091-a2123c5e6a54" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_belgium_national_number"/>
     <Match idRef="Keyword_belgium_national_number"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_belgium_national_number
Удостоверение
Регистрация
Идентификации
Идентификатор
Identiteitskaart
Registratie nummer
Identificatie nummer
Identiteit
Registratie
Идентификация
Carte d'identité
numéro d'immatriculation
numéro d'identification
identité
Надпись
Идентификация
Identifizierung
Identifikationsnummer
Personalausweis
Registrierung
Registrationsnummer

Формат: 14 цифр, включая регистрационный номер, номер ветви и проверка цифры, а также разделители

Шаблон: 14 цифр, плюс разделители:

  • две цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры (эти первые восемь цифр — регистрационный номер);

  • косая черта;

  • номер отделения из четырех цифр;

  • дефис;

  • Две цифры, проверка цифры

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_brazil_cnpj находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_brazil_cnpj.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_brazil_cnpj находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Brazil Legal Entity Number (CNPJ) -->
<Entity id="9b58b5cd-5e90-4df6-b34f-1ebcc88ceae4" recommendedConfidence="85" patternsProximity="300">
   <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_brazil_cnpj"/>
     <Match idRef="Keyword_brazil_cnpj"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_brazil_cnpj"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_brazil_cnpj
CNPJ
CNPJ/MF
CNPJ-MF
National Registry of Legal Entities
Taxpayers Registry
Legal entity
Legal entities
Registration Status
Для бизнеса
Организация
CNPJ
Cadastro Nacional da Pessoa Jurídica
Cadastro Geral de Contribuintes
CGC
Pessoa jurídica
Pessoas jurídicas
Situação cadastral
Inscrição
Empresa

Номер CPF для Бразилии

Формат: 11 цифр, которые включают проверка цифру и могут быть отформатированы или неформатированы.

Шаблон:

Форматированные:

  • три цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры;

  • дефис;

  • две проверочные цифры.

Неформатировано: 11 цифр, где последние две цифры проверка цифры

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_brazil_cpf находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_brazil_cpf.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_brazil_cpf находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Brazil CPF Number -->
<Entity id="78e09124-f2c3-4656-b32a-c1a132cd2711" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_brazil_cpf"/>
     <Match idRef="Keyword_brazil_cpf"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_brazil_cpf"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_brazil_cpf
CPF
Идентификации
Регистрация
Доходов
Cadastro de Pessoas Físicas
Imposto
Identificação
Inscrição
Receita

Номер внутреннего удостоверения личности для Бразилии (RG)

Формат:

  • Registro Geral (старый формат): девять цифр плюс разделители

  • Registro de Identidade (RIC) (новый формат): 11 цифр плюс дефис

Шаблон:

Registro Geral (старый формат):

  • две цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры;

  • дефис;

  • одна цифра — проверочная.

Registro de Identidade (RIC) (новый формат):

  • 10 цифр;

  • дефис;

  • одна цифра — проверочная.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_brazil_rg находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_brazil_rg.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_brazil_rg находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Brazil National ID Card (RG) -->
<Entity id="486de900-db70-41b3-a886-abdf25af119c" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_brazil_rg"/>
     <Match idRef="Keyword_brazil_rg"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_brazil_rg"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_brazil_rg
National ID
Регистрация
Cédula de identidade
Registro Geral
RG
Registro de Identidade
РИК
Número de registo
Registro

Номер банковского счета для Канады

Формат: семь или двенадцать цифр

Шаблон: номер банковского счета в Канаде — семь или двенадцать цифр. Транзитный номер банковского счета в Канаде имеет указанный ниже формат.

  • пять цифр;

  • дефис;

  • три цифры.

    ИЛИ

  • ноль "0";

  • Восемь цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_canada_bank_account_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_canada_bank_account_number.

  • Регулярное выражение Regex_canada_bank_account_transit_number находит содержимое, соответствующее шаблону.

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_canada_bank_account_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_canada_bank_account_number.

<!-- Canada Bank Account Number -->
<Entity id="552e814c-cb50-4d94-bbaa-bb1d1ffb34de" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_canada_bank_account_number" />
        <Match idRef="Keyword_canada_bank_account_number" />
        <Match idRef="Regex_canada_bank_account_transit_number" />
   </Pattern>
   <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_bank_account_number" />
        <Match idRef="Keyword_canada_bank_account_number" />
   </Pattern>
</Entity>

Ключевые слова:

Keyword_canada_bank_account_number
canada savings bonds
canada revenue agency
canadian financial institution
direct deposit form
canadian citizen
legal representative
notary public
commissioner for oaths
child care benefit
universal child care
canada child tax benefit
income tax benefit
harmonized sales tax
social insurance number
income tax refund
child tax benefit
territorial payments
institution number
deposit request
banking information
direct deposit

Номер водительского удостоверения для Канады

Формат: зависит от провинции

Шаблон: различные узоры, охватывающие Альберту, Британскую Колумбию, Манитобу, Нью-Брансуик, Ньюфаундленд/Лабрадор, Новую Шотландию, Онтарио, остров Принца Эдуарда, Квебек и Саскачеван

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_[province_name]_drivers_license_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_[province_name]_drivers_license_name.

  • обнаружено ключевое слово из Keyword_canada_drivers_license.

<!-- Canada Driver's License Number -->
    <Entity id="37186abb-8e48-4800-ad3c-e3d1610b3db0" patternsProximity="300" recommendedConfidence="75">
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_alberta_drivers_license_number" />
        <Match idRef="Keyword_alberta_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_british_columbia_drivers_license_number" />
        <Match idRef="Keyword_british_columbia_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_manitoba_drivers_license_number" />
        <Match idRef="Keyword_manitoba_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_new_brunswick_drivers_license_number" />
        <Match idRef="Keyword_new_brunswick_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_newfoundland_labrador_drivers_license_number" />
        <Match idRef="Keyword_newfoundland_labrador_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_nova_scotia_drivers_license_number" />
        <Match idRef="Keyword_nova_scotia_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_ontario_drivers_license_number" />
        <Match idRef="Keyword_ontario_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_prince_edward_island_drivers_license_number" />
        <Match idRef="Keyword_prince_edward_island_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_quebec_drivers_license_number" />
        <Match idRef="Keyword_quebec_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_saskatchewan_drivers_license_number" />
        <Match idRef="Keyword_saskatchewan_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
    </Entity>

Ключевые слова:

Keyword_[province_name]_drivers_license_name Keyword_canada_drivers_license
Аббревиатура провинции, например AB.
Название провинции, например Альберта.
DL
DLS
CDL
CDLS
DriverLic
DriverLics
DriverLicense
DriverLicenses
DriverLicence
DriverLicences
Driver Lic
Driver Lics
Driver License
Driver Licenses
Driver Licence
Driver Licences
DriversLic
DriversLics
ДрайверыЛицензация
ДрайверыЛицензии
ДрайверыЛицензии
ДрайверыЛицензии
Drivers Lic
Drivers Lics
Drivers License
Drivers Licenses
Drivers Licence
Drivers Licences
Driver'Lic
Driver'Lics
Водительские права
Водительские лицензии
Водительские права
Водительские права
Driver' Lic
Driver' Lics
Driver' License
Driver' Licenses
Driver' Licence
Driver' Licences
Driver'sLic
Driver'sLics
Лицензия драйвера
Лицензии драйвера
Водительская лицензия
Лицензий драйверов
Driver's Lic
Driver's Lics
Driver's License
Driver's Licenses
Driver's Licence
Driver's Licences
Permis de Conduire
id
ids
idcard number
idcard numbers
idcard#
idcard #s
idcard card
idcard cards
idcard
identification number
identification numbers
identification #
identification #s
identification card
identification cards
Идентификации
DL#
DLS#
CDL#
CDLS#
DriverLic#
DriverLics#
DriverLicense#
DriverLicenses#
DriverLicence#
DriverLicences#
Driver Lic#
Driver Lics#
Driver License#
Driver Licenses#
Driver License#
Driver Licences#
DriversLic#
DriversLics#
ДрайверыЛицензии#
ДрайверыЛицензии#
ДрайверыЛицензация#
ДрайверыЛицензии#
Drivers Lic#
Drivers Lics#
Drivers License#
Drivers Licenses#
Drivers Licence#
Drivers Licences#
Driver'Lic#
Driver'Lics#
Водительские права#
Водительские лицензии#
Водительские права#
Водительские права#
Driver' Lic#
Driver' Lics#
Driver' License#
Driver' Licenses#
Driver' Licence#
Driver' Licences#
Driver'sLic#
Driver'sLics#
Лицензия драйвера#
Лицензии драйвера#
Водительская лицензия#
Лицензий драйверов#
Driver's Lic#
Driver's Lics#
Driver's License#
Driver's Licenses#
Driver's Licence#
Driver's Licences#
Permis de Conduire#
ID#
Идентификаторы#
idcard card#
idcard cards#
idcard#
identification card#
identification cards#
Идентификации#

Номер службы здравоохранения для Канады

Формат: 10 цифр

Шаблон: 10 цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_canada_health_service_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_canada_health_service_number.

<!-- Canada Health Service Number -->
<Entity id="59c0bf39-7fab-482c-af25-00faa4384c94" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_health_service_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_canada_health_service_number" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_canada_health_service_number
personal health number
patient information
health services
speciality services
automobile accident
patient hospital
Психиатр
workers compensation
Инвалидности

Номер паспорта гражданина Канады

Формат: две прописные буквы, за которыми следуют шесть цифр.

Шаблон: две прописные буквы, за которыми следуют шесть цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_canada_passport_number находит содержимое, соответствующее шаблону.

  • Найдена ключевое слово из Keyword_canada_passport_number или Keyword_passport .

<!-- Canada Passport Number -->
<Entity id="14d0db8b-498a-43ed-9fca-f6097ae687eb" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_passport_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_canada_passport_number" />
          <Match idRef="Keyword_passport" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_canada_passport_number Keyword_passport
canadian citizenship
canadian passport
passport application
passport photos
certified translator
canadian citizens
processing times
renewal application
Passport Number
Passport No
Passport#
Паспорт#
PassportID
Passportno
passportnumber
パスポート
パスポート番号
パスポートのNum
パスポート#
Numéro de passeport
Passeport n °
Passeport Non
Passeport#
Passeport#
PasseportNon
Passeportn °

Персональный идентификационный номер службы здравоохранения для Канады (PHIN)

Формат: девять цифр

Шаблон: девять цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_canada_phin находит содержимое, соответствующее шаблону.

  • Найдено по крайней мере два ключевых слова из Keyword_canada_phin или Keyword_canada_provinces ..

<!-- Canada PHIN -->
<Entity id="722e12ac-c89a-4ec8-a1b7-fea3469f89db" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_phin" />
        <Any minMatches="2">
          <Match idRef="Keyword_canada_phin" />
          <Match idRef="Keyword_canada_provinces" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_canada_phin Keyword_canada_provinces
social insurance number
health information act
income tax information
manitoba health
health registration
prescription purchases
benefit eligibility
personal health
power of attorney
registration number
personal health number
practitioner referral
wellness professional
patient referral
health and wellness
Нунавут
Квебек
Northwest Territories
Онтарио
British Columbia
Альберта
Саскачеван
Манитоба
Юкон
Newfoundland and Labrador
New Brunswick
Nova Scotia
Prince Edward Island
Канада

Номер карты социального страхования для Канады

Формат: девять цифр с необязательными дефисами или пробелами

Шаблон:

Форматированные:

  • Три цифры

  • Дефис или пробел

  • Три цифры

  • Дефис или пробел

  • Три цифры

Неформатировано: девять цифр

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_canadian_sin находит содержимое, соответствующее шаблону.

  • По крайней мере два из следующих сочетаний:

    • обнаружено ключевое слово из Keyword_sin.

    • обнаружено ключевое слово из Keyword_sin_collaborative.

    • Функция Func_eu_date находит дату в правильном формате даты.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_unformatted_canadian_sin находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_sin.

  • Контрольная сумма проходит проверку.

<!-- Canada Social Insurance Number -->
<Entity id="a2f29c85-ecb8-4514-a610-364790c0773e" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_canadian_sin" />
        <Any minMatches="2">
          <Match idRef="Keyword_sin" />
          <Match idRef="Keyword_sin_collaborative" />
          <Match idRef="Func_eu_date" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_canadian_sin" />
        <Match idRef="Keyword_sin" />
  </Pattern>
</Entity>

Ключевые слова:

Keyword_sin Keyword_sin_collaborative
sin
social insurance
numero d'assurance sociale
Грехи
Ssn
ssns
social security
numero d'assurance social
national identification number
national id
Грех#
soc ins
social ins
driver's license
drivers license
driver's licence
drivers licence
DOB
Birthdate
Birthday
Date of Birth

Номер удостоверения личности для Чили

Формат: 7–8 цифр плюс разделители проверка цифры или буквы

Шаблон: 7–8 цифр плюс разделители:

  • 1 или 2 цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры;

  • тире;

  • одна цифра или буква (без учета регистра) — проверочная.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_chile_id_card находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_chile_id_card.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_chile_id_card находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Chile Identity Card Number -->
<Entity id="4e979794-49a0-407e-a0b9-2c536937b925" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_chile_id_card"/>
     <Match idRef="Keyword_chile_id_card"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_chile_id_card"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_chile_id_card
National Identification Number
Identity card
Идентификатор
Идентификации
Rol Único Nacional
ЗАПУСТИТЬ
Rol Único Tributario
КОЛЕЮ
Cédula de Identidad
Número De Identificación Nacional
Tarjeta de identificación
Identificación

Номер удостоверения личности жителя Китая (КНР)

Формат: 18 цифр

Шаблон: 18 цифр:

  • шесть цифр — код адреса;

  • Восемь цифр в форме ГГГГММДД, которые являются датой рождения

  • Три цифры, которые являются кодом заказа

  • Одна цифра, которая является проверка цифрой

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_china_resident_id находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_china_resident_id.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_china_resident_id находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- China Resident Identity Card (PRC) Number -->
<Entity id="c92daa86-2d16-4871-901f-816b3f554fc1" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_china_resident_id"/>
     <Match idRef="Keyword_china_resident_id"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_china_resident_id"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_china_resident_id
Resident Identity Card
КНР
National Identification Card
身份证
居民 身份证
居民身份证
鉴定
身分證
居民 身份證
鑑定

Номер кредитной карты

Формат: 14 цифр, которые могут быть отформатированы или неформатированы (dddddd) и должны пройти тест Luhn.

Шаблон: очень сложный и надежный шаблон, который обнаруживает карты всех основных брендов по всему миру, включая Visa, MasterCard, Discover Card, JCB, American Express, подарочные карты и закусочные карты.

Контрольная сумма: Да, контрольная сумма Luhn

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_credit_card находит содержимое, соответствующее шаблону.

  • Верно одно из условий ниже:

    • обнаружено ключевое слово из Keyword_cc_verification.

    • обнаружено ключевое слово из Keyword_cc_name.

    • Функция Func_expiration_date находит дату в правильном формате даты.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 65 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Функция Func_credit_card находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Credit Card Number -->
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_cc_verification" />
          <Match idRef="Keyword_cc_name" />
          <Match idRef="Func_expiration_date" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_credit_card" />
  </Pattern>
</Entity>

Ключевые слова:

Keyword_cc_verification Keyword_cc_name
card verification
card identification number
Cvn
cid
cvc2
cvv2
pin block
security code
security number
security no
issue number
issue no
криптограмма
numéro de sécurité
numero de securite
kreditkartenprüfnummer
kreditkartenprufnummer
prüfziffer
prufziffer
sicherheits Kode
sicherheitscode
sicherheitsnummer
verfalldatum
codice di verifica
Трески. sicurezza
cod sicurezza
n autorizzazione
código
codigo
Трески. Seg
cod seg
código de segurança
codigo de seguranca
codigo de segurança
código de seguranca
cód. segurança
Трески. seguranca треска. segurança
cód. seguranca
cód segurança
cod seguranca cod segurança
cód seguranca
número de verificação
numero de verificacao
ablauf
gültig bis
gültigkeitsdatum
gultig bis
gultigkeitsdatum
scadenza
data scad
fecha de expiracion
fecha de venc
vencimiento
válido hasta
valido hasta
vto
data de expiração
data de expiracao
data em que expira
validade
Доблести
vencimento
Венк
Amex
american express
americanexpress
Визы
Mastercard
master card
Mc
masters
master cards
diner's Club
diners club
dinersclub
discover card
discovercard
discover cards
JCB
japanese card bureau
carte blanche
Картбланш
credit card
См3#
cc#:
expiration date
exp date
expiry date
date d'expiration
date d'exp
date expiration
bank card
банковская карта
card number
card num
cardnumber
cardnumbers
card numbers
кредитная карта
credit cards
кредитные карты
Ccn
card holder
Карточки
card holders
Держателей карт
check card
checkcard
check cards
контрольные знаки
debit card
дебетовая карта
debit cards
дебетовые карты
atm card
atmcard
atm cards
atmcards
Пути
en route
card type
carte bancaire
carte de crédit
carte de credit
numéro de carte
numero de carte
nº de la carte
nº de carte
kreditkarte
karte
karteninhaber
karteninhabers
kreditkarteninhaber
kreditkarteninstitut
kreditkartentyp
eigentümername
kartennr
kartennummer
kreditkartennummer
kreditkarten-nummer
carta di credito
carta credito
N. Carta
n carta
Nr. Carta
nr carta
numero carta
numero della carta
numero di carta
tarjeta credito
tarjeta de credito
tarjeta crédito
tarjeta de crédito
tarjeta de atm
tarjeta atm
tarjeta debito
tarjeta de debito
tarjeta débito
tarjeta de débito
nº de tarjeta
Нет. de tarjeta
no de tarjeta
numero de tarjeta
número de tarjeta
tarjeta no
tarjetahabiente
cartão de crédito
cartão de credito
cartao de crédito
cartao de credito
cartão de débito
cartao de débito
cartão de debito
cartao de debito
débito automático
debito automatico
número do cartão
numero do cartão
número do cartao
numero do cartao
número de cartão
numero de cartão
número de cartao
numero de cartao
nº do cartão
nº do cartao
n º. do cartão
no do cartão
no do cartao
Нет. do cartão
Нет. do cartao

Номер идентификационной карты гражданина Хорватии

Формат: девять цифр

Шаблон: девять последовательных цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_croatia_id_card находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_croatia_id_card.

<!--Croatia Identity Card Number-->
<Entity id="ff12f884-c20a-4189-b185-34c8e7258d47" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_croatia_id_card"/>
     <Match idRef="Keyword_croatia_id_card"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_croatia_id_card
Croatian identity card
Osobna iskaznica

Персональный идентификационный номер (OIB) гражданина Хорватии

Формат: 10 цифр

Шаблон: 10 цифр:

  • Шесть цифр в форме ДДММГГ, которые являются датой рождения

  • четыре цифры, где последняя цифра — проверочная.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_croatia_oib_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_croatia_oib_number.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_croatia_oib_number находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Croatia Personal Identification (OIB) Number -->
<Entity id="31983b6d-db95-4eb2-a630-b44bd091968d" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_croatia_oib_number"/>
     <Match idRef="Keyword_croatia_oib_number"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_croatia_oib_number"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_croatia_oib_number
Personal Identification Number
Osobni identifikacijski broj
OIB

Номер внутренней идентификационной карты гражданина Чехии

Формат: 10 цифр, содержащих косую черту

Шаблон: 10 цифр:

  • Шесть цифр, которые являются датой рождения

  • косая черта;

  • четыре цифры, где последняя цифра — проверочная.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_czech_id_card находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_czech_id_card.

  • Контрольная сумма проходит проверку.

<!-- Czech National Identity Card Number -->
<Entity id="60c0725a-4eb6-455b-9dda-05d8a7396497" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_czech_id_card"/>
     <Match idRef="Keyword_czech_id_card"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_czech_id_card
Czech national identity card
Občanský průka

Персональный идентификационный номер гражданина Дании

Формат: 10 цифр, содержащих дефис

Шаблон: 10 цифр:

  • Шесть цифр в формате ДДММГГ, которые являются датой рождения

  • дефис;

  • четыре цифры, где последняя цифра — проверочная.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_denmark_id находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_denmark_id.

  • Контрольная сумма проходит проверку.

<!-- Denmark Personal Identification Number -->
<Entity id="6c4f2fef-56e1-4c00-8093-88d7a01cf460" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_denmark_id"/>
     <Match idRef="Keyword_denmark_id"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_denmark_id
Personal Identification Number
CPR
Det Centrale Personregister
Personnummer

Номер Управления по борьбе с наркотиками США (DEA)

Формат: две буквы, за которыми следуют семь цифр

Шаблон: шаблон должен включать все следующие компоненты:

  • Одна буква (без учета регистра) из следующего набора: abcdefghjklmnprstux, представляющая собой код регистрирующегося лица

  • Одна буква (без учета регистра), представляющая собой первую букву фамилии регистрирующегося лица

  • Семь цифр, последняя из которых — контрольная

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_dea_number находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- DEA Number -->
<Entity id="9a5445ad-406e-43eb-8bd7-cac17ab6d0e4" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_dea_number"/>
  </Pattern>
</Entity>

Ключевые слова: None

Номер банковской карты, Европейский союз

Формат: 16 цифр

Шаблон: очень сложный и надежный шаблон

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_eu_debit_card находит содержимое, соответствующее шаблону.

  • Верно по меньшей мере одно из условий ниже:

    • обнаружено ключевое слово из Keyword_eu_debit_card.

    • обнаружено ключевое слово из Keyword_card_terms_dict.

    • обнаружено ключевое слово из Keyword_card_security_terms_dict.

    • обнаружено ключевое слово из Keyword_card_expiration_terms_dict.

    • Функция Func_eu_date1 находит дату в правильном формате даты.

    • Функция Func_eu_date2 находит дату в правильном формате даты.

  • Контрольная сумма проходит проверку.

<!-- EU Debit Card Number -->
<Entity id="0e9b3178-9678-47dd-a509-37222ca96b42" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_eu_debit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_eu_debit_card" />
          <Match idRef="Keyword_card_terms_dict" />
          <Match idRef="Keyword_card_security_terms_dict" />
          <Match idRef="Keyword_card_expiration_terms_dict" />
          <Match idRef="Func_expiration_date" />
          <Match idRef="Func_eu_date" />
          <Match idRef="Func_eu_date1" />
          <Match idRef="Func_eu_date2" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_eu_debit_card Keyword_card_terms_dict Keyword_card_security_terms_dict Keyword_card_expiration_terms_dict
account number
card number
card no.
security number
См3#
acct nbr
acct num
acct no
american express
americanexpress
americano espresso
Amex
atm card
atm cards
atm kaart
atmcard
atmcards
atmkaart
atmkaarten
bancontact
bank card
bankkaart
card holder
card holders
card num
card number
card numbers
card type
cardano numerico
Карточки
Держателей карт
cardnumber
cardnumbers
carta bianca
carta credito
carta di credito
cartao de credito
cartao de crédito
cartao de debito
cartao de débito
carte bancaire
carte blanche
carte bleue
carte de credit
carte de crédit
carte di credito
Картбланш
cartão de credito
cartão de crédito
cartão de debito
cartão de débito
Cb
Ccn
check card
check cards
checkcard
контрольные знаки
chequekaart
Cirrus
cirrus-edc-maestro
controlekaart
controlekaarten
credit card
credit cards
кредитная карта
кредитные карты
debetkaart
debetkaarten
debit card
debit cards
дебетовая карта
дебетовые карты
debito automatico
diners club
dinersclub
Обнаружить
discover card
discover cards
discovercard
карты обнаружения
débito automático
Edc
eigentümername
european debit card
hoofdkaart
hoofdkaarten
in viaggio
japanese card bureau
japanse kaartdienst
Jcb
kaart
kaart num
kaartaantal
kaartaantallen
kaarthouder
kaarthouders
karte
karteninhaber
karteninhabers
kartennr
kartennummer
kreditkarte
kreditkarten-nummer
kreditkarteninhaber
kreditkarteninstitut
kreditkartennummer
kreditkartentyp
Маэстро
master card
master cards
Mastercard
masters
Mc
mister cash
n carta
N. Carta
no de tarjeta
no do cartao
no do cartão
Нет. de tarjeta
Нет. do cartao
Нет. do cartão
nr carta
Nr. Carta
numeri di scheda
numero carta
numero de cartao
numero de carte
numero de cartão
numero de tarjeta
numero della carta
numero di carta
numero di scheda
numero do cartao
numero do cartão
numéro de carte
nº carta
nº de carte
nº de la carte
nº de tarjeta
nº do cartao
nº do cartão
n º. do cartão
número de cartao
número de cartão
número de tarjeta
número do cartao
scheda dell'assegno
scheda dell'atmosfera
scheda dell'atmosfera
scheda della banca
scheda di controllo
scheda di debito
scheda matrice
schede dell'atmosfera
schede di controllo
schede di debito
schede matrici
scoprono la scheda
scoprono le schede
Индивидуальные
supporti di scheda
supporto di scheda
Переключатель
tarjeta atm
tarjeta credito
tarjeta de atm
tarjeta de credito
tarjeta de debito
tarjeta debito
tarjeta no
tarjetahabiente
tipo della scheda
ufficio giapponese della
scheda
v pay
v-pay
Визы
visa plus
visa electron
Visto
visum
vpay
card identification number
card verification
cardi la verifica
cid
cod seg
cod seguranca
cod segurança
cod sicurezza
Трески. Seg
Трески. seguranca
Трески. segurança
Трески. sicurezza
codice di sicurezza
codice di verifica
codigo
codigo de seguranca
codigo de segurança
криттограмма
криптограмма
криптограмма
cv2
Cvc
cvc2
Cvn
Cvv
cvv2
cód seguranca
cód segurança
cód. seguranca
cód. segurança
código
código de seguranca
código de segurança
de kaart controle
geeft nr uit
issue no
issue number
kaartidentificatienummer
kreditkartenprufnummer
kreditkartenprüfnummer
kwestieaantal
Нет. dell'edizione
Нет. di sicurezza
numero de securite
numero de verificacao
numero dell'edizione
numero di identificazione della
scheda
numero di sicurezza
numero van veiligheid
numéro de sécurité
nº autorizzazione
número de verificação
perno il blocco
pin block
prufziffer
prüfziffer
security code
security no
security number
sicherheits kode
sicherheitscode
sicherheitsnummer
speldblok
veiligheid nr
veiligheidsaantal
veiligheidscode
veiligheidsnummer
verfalldatum
ablauf
data de expiracao
data de expiração
data del exp
data di exp
data di scadenza
data em que expira
data scad
data scadenza
date de validité
datum afloop
datum van exp
de afloop
espira
espira
exp date
exp datum
Истечения срока действия
Истекает
Истекает
Истечения
fecha de expiracion
fecha de venc
gultig bis
gultigkeitsdatum
gültig bis
gültigkeitsdatum
la scadenza
scadenza
valable
validade
valido hasta
Доблести
venc
vencimento
vencimiento
verloopt
vervaldag
vervaldatum
vto
válido hasta

Национальный идентификационный номер гражданина Финляндии

Формат: шесть цифр плюс символ, указывающий столетие плюс три цифры плюс проверка цифра

Шаблон: шаблон должен включать все следующие компоненты:

  • Шесть цифр в формате ДДММГГ, которые являются датой рождения

  • Маркер века (символы "-" и "+" или буква "a")

  • Трехзначный личный идентификационный номер

  • Цифра или буква (без учета регистра) — проверочная.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_finnish_national_id находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_finnish_national_id.

  • Контрольная сумма проходит проверку.

<!-- Finnish National ID-->
<Entity id="338FD995-4CB5-4F87-AD35-79BD1DD926C1" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_finnish_national_id" />
          <Match idRef="Keyword_finnish_national_id" />
  </Pattern>
</Entity>

Ключевые слова:

Keyword_finnish_national_id
Sosiaaliturvatunnus
SOTU Henkilötunnus HETU
Personbeteckning
Personnummer

Номер паспорта гражданина Финляндии

Формат: сочетание девяти букв и цифр

Шаблон: сочетание девяти букв и цифр:

  • две буквы (без учета регистра);

  • семь цифр.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_finland_passport_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_finland_passport_number.

<!-- Finland Passport Number -->
<Entity id="d1685ac3-1d3a-40f8-8198-32ef5669c7a5" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_finland_passport_number"/>
     <Match idRef="Keyword_finland_passport_number"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_finland_passport_number
Паспорт
Passi

Номер водительского удостоверения для Франции

Формат: 12 цифр

Шаблон: 12 цифр с проверкой для скидки на аналогичные шаблоны, такие как французские телефонные номера

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Функция Func_french_drivers_license находит содержимое, соответствующее шаблону.

  • Верно по меньшей мере одно из условий ниже:

    • обнаружено ключевое слово из Keyword_french_drivers_license.

    • Функция Func_eu_date находит дату в правильном формате даты.

<!-- France Driver's License Number -->
<Entity id="18e55a36-a01b-4b0f-943d-dc10282a1824" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_french_drivers_license" />
        <Any minMatches="1">
          <Match idRef="Keyword_french_drivers_license" />
          <Match idRef="Func_eu_date" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_french_drivers_license
drivers licence
drivers license
driving licence
driving license
permis de conduire
licence number
license number
licence numbers
license numbers

Национальная идентификационная карта гражданина Франции (CNI)

Формат: 12 цифр

Шаблон: 12 цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных на 65 % уверена, что обнаружен этот тип конфиденциальной информации, если в пределах 300 символов регулярное выражение Regex_france_cni находит содержимое, соответствующее шаблону.

<!-- France CNI -->
<Entity id="f741ac74-1bc0-4665-b69b-f0c7f927c0c4" patternsProximity="300" recommendedConfidence="65">
  <Pattern confidenceLevel="65">
        <IdMatch idRef="Regex_france_cni" />
  </Pattern>
</Entity>

Ключевые слова: None

Номер паспорта гражданина Франции

Формат: девять цифр и букв

Шаблон: девять цифр и букв:

  • Две цифры

  • Две буквы (без учета регистра)

  • Пять цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_fr_passport находит содержимое, соответствующее шаблону.

  • Найдена ключевое слово изKeyword_passport.

<!-- France Passport Number -->
<Entity id="3008b884-8c8c-4cd8-a289-99f34fc7ff5d" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_fr_passport" />
        <Match idRef="Keyword_passport" />
  </Pattern>
</Entity>

Ключевые слова:

Keyword_passport
Passport Number
Passport No
Passport#
Паспорт#
PassportID
Passportno
Соединенного Королевства
パスポート
パスポート番号
パスポートのNum
パスポート#
Numéro de passeport
Passeport n °
Passeport Non
Passeport#
Passeport#
PasseportNon
Passeportn °

Номер социального страхования для Франции (INSEE)

Формат: 15 цифр

Шаблон:

Должен соответствовать одному из двух шаблонов:

  • 13 цифр, за которыми идет пробел, а потом еще две цифры;

  • 15 последовательных цифр.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 95 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_french_insee или Func_fr_insee находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_fr_insee.

  • контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_french_insee или Func_fr_insee находит содержимое, соответствующее шаблону.

  • Ключевое слово из Keyword_fr_insee не найден.

  • Контрольная сумма проходит проверку.

<!-- France INSEE -->
<Entity id="71f62b97-efe0-4aa1-aa49-e14de253619d" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="95">
        <IdMatch idRef="Func_french_insee" />
        <Match idRef="Func_fr_insee" />
        <Any minMatches="1">
          <Match idRef="Keyword_fr_insee" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_french_insee" />
        <Match idRef="Func_fr_insee" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_fr_insee" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_fr_insee
Insee
securité sociale
securite sociale
national id
national identification
numéro d'identité
no d'identité
Нет. d'identité
numero d'identite
no d'identite
Нет. d'identite
social security number
social security code
social insurance number
le numéro d'identification nationale
d'identité nationale
numéro de sécurité sociale
le code de la sécurité sociale
numéro d'assurance sociale
numéro de sécu
code sécu

Номер водительского удостоверения для Германии

Формат: сочетание 11 цифр и букв

Шаблон: 11 цифр и букв (без учета регистра):

  • Одна цифра или буква

  • Две цифры

  • Шесть цифр или букв

  • Одна цифра

  • Одна цифра или буква

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_german_drivers_license находит содержимое, соответствующее шаблону.

  • Верно по меньшей мере одно из условий ниже:

    • обнаружено ключевое слово из Keyword_german_drivers_license_number.

    • обнаружено ключевое слово из Keyword_german_drivers_license_collaborative.

    • обнаружено ключевое слово из Keyword_german_drivers_license.

  • Контрольная сумма проходит проверку.

<!-- German Driver's License Number -->
<Entity id="91da9335-1edb-45b7-a95f-5fe41a16c63c" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_german_drivers_license" />
        <Any minMatches="1">
          <Match idRef="Keyword_german_drivers_license_number" />
          <Match idRef="Keyword_german_drivers_license_collaborative" />
          <Match idRef="Keyword_german_drivers_license" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_german_drivers_license_number Keyword_german_drivers_license_collaborative Keyword_german_drivers_license
Führerschein
Fuhrerschein
Fuehrerschein
Führerscheinnummer
Fuhrerscheinnummer
Fuehrerscheinnummer
Führerschein-
Fuhrerschein-
Fuehrerschein-
FührerscheinnummerNr
FuhrerscheinnummerNr
FuehrerscheinnummerNr
FührerscheinnummerKlasse
FuhrerscheinnummerKlasse
FuehrerscheinnummerKlasse
Führerschein- Nr
Fuhrerschein- Nr
Fuehrerschein- Nr
Führerschein- Klasse
Fuhrerschein- Klasse
Fuehrerschein- Klasse
FührerscheinnummerNr
FuhrerscheinnummerNr
FuehrerscheinnummerNr
FührerscheinnummerKlasse
FuhrerscheinnummerKlasse
FuehrerscheinnummerKlasse
Führerschein- Nr
Fuhrerschein- Nr
Fuehrerschein- Nr
Führerschein- Klasse
Fuhrerschein- Klasse
Fuehrerschein- Klasse
DL
DLS
Driv Lic
Driv Licen
Driv License
Driv Licenses
Driv Licence
Driv Licences
Driv Lic
Driver Licen
Driver License
Driver Licenses
Driver Licence
Driver Licences
Drivers Lic
Drivers Licen
Drivers License
Drivers Licenses
Drivers Licence
Drivers Licences
Driver's Lic
Driver's Licen
Driver's License
Driver's Licenses
Driver's Licence
Driver's Licences
Driving Lic
Driving Licen
Driving License
Driving Licenses
Driving Licence
Driving Licences
Nr-Führerschein
Nr-Fuhrerschein
Nr-Fuehrerschein
No-Führerschein
No-Fuhrerschein
No-Fuehrerschein
N-Führerschein
N-Fuhrerschein
N-Fuehrerschein
Nr-Führerschein
Nr-Fuhrerschein
Nr-Fuehrerschein
No-Führerschein
No-Fuhrerschein
No-Fuehrerschein
N-Führerschein
N-Fuhrerschein
N-Fuehrerschein
ausstellungsdatum
ausstellungsort
ausstellende behöde
ausstellende behorde
ausstellende behoerde

Номер удостоверения личности для Германии

Формат:

  • С 1 ноября 2010 года: девять букв и цифр

  • С 1 апреля 1987 года по 31 октября 2010 года: 10 цифр

Шаблон:

С 1 ноября 2010 г.:

  • одна буква (без учета регистра);

  • Восемь цифр

С 1 апреля 1987 года по 31 октября 2010 года: 10 цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 65 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Регулярное выражение Regex_germany_id_card находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_germany_id_card.

<!-- Germany Identity Card Number -->
<Entity id="e577372f-c42e-47a0-9d85-bebed1c237d4" recommendedConfidence="65" patternsProximity="300">
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Regex_germany_id_card"/>
     <Match idRef="Keyword_germany_id_card"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_germany_id_card
Identity Card
Идентификатор
Идентификации
Personalausweis
Identifizierungsnummer
Ausweis
Идентификация

Номер паспорта гражданина Германии

Формат: 10 цифр или букв

Шаблон: шаблон должен включать все следующие компоненты:

  • Первый символ — цифра или буква из следующего набора: C, F, G, H, J, K.

  • Три цифры

  • Пять цифр или букв из следующего набора: C, F-H, J-N, P, R, T, V-Z

  • Одна цифра

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_german_passport находит содержимое, соответствующее шаблону.

  • находится любое ключевое слово из пяти соответствующих списков;

  • контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_german_passport_data находит содержимое, соответствующее шаблону.

  • находится любое ключевое слово из пяти соответствующих списков;

  • контрольная сумма проходит проверку.

<!-- German Passport Number -->
<Entity id="2e3da144-d42b-47ed-b123-fbf78604e52c" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_german_passport" />
        <Any minMatches="1">
          <Match idRef="Keyword_german_passport" />
          <Match idRef="Keyword_german_passport_collaborative" />
          <Match idRef="Keyword_german_passport_number" />
          <Match idRef="Keyword_german_passport1" />
          <Match idRef="Keyword_german_passport2" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_german_passport_data" />
        <Any minMatches="1">
          <Match idRef="Keyword_german_passport" />
          <Match idRef="Keyword_german_passport_collaborative" />
          <Match idRef="Keyword_german_passport_number" />
          <Match idRef="Keyword_german_passport1" />
          <Match idRef="Keyword_german_passport2" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_german_passport Keyword_german_passport_collaborative Keyword_german_passport_number Keyword_german_passport1 Keyword_german_passport2
reisepass
reisepasse
reisepassnummer
Паспорт
Паспорта
geburtsdatum
ausstellungsdatum
ausstellungsort
No-Reisepass
Nr-Reisepass
Reisepass-Nr bnationalit.t

Национальная идентификационная карта гражданина Греции

Формат: сочетание 7–8 букв и цифр плюс тире

Шаблон:

Семь букв и чисел (старый формат):

  • одна буква (любая буква греческого алфавита);

  • тире;

  • шесть цифр.

Восемь букв и чисел (новый формат):

  • две буквы, которые в прописном виде есть как в греческом, так и латинском алфавите (ABEZHIKMNOPTYX);

  • тире;

  • шесть цифр.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_greece_id_card находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_greece_id_card.

<!-- Greece National ID Card -->
<Entity id="82568215-1da1-46d3-874a-d2294d81b5ac" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_greece_id_card"/>
     <Match idRef="Keyword_greece_id_card"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_greece_id_card
Greek identity Card
Таутотита
Δελτίο αστυνομικής ταυτότητας
Ταυτότητα

Номер удостоверения личности для Гонконга (HKID)

Формат: сочетание из 8–9 букв и цифр, а также необязательных скобок вокруг конечного символа

Шаблон: сочетание из 8–9 букв:

  • 1–2 буквы (без учета регистра);

  • шесть цифр;

  • последний символ (любая цифра или буква "A") является проверочной цифрой и заключен в скобки (необязательно).

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_hong_kong_id_card находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_hong_kong_id_card.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 65 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Функция Func_hong_kong_id_card находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Hong Kong Identity Card (HKID) number -->
<Entity id="e63c28a7-ad29-4c17-a41a-3d2a0b70fd9c" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_hong_kong_id_card"/>
     <Match idRef="Keyword_hong_kong_id_card"/>
  </Pattern>
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Func_hong_kong_id_card"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_hong_kong_id_card
Hong Kong Identity Card
HKID
ID card
香港身份證
香港永久性居民身份證

Идентификационный номер налогоплательщика для Индии

Формат: 10 букв или цифр

Шаблон: 10 букв или цифр:

  • пять букв (без учета регистра);

  • четыре цифры;

  • Буква, которая является алфавитной проверка цифрой

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_india_permanent_account_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_india_permanent_account_number.

  • Контрольная сумма проходит проверку.

<!-- India Permanent Account Number -->
<Entity id="2602bfee-9bb0-47a5-a7a6-2bf3053e2804" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_india_permanent_account_number"/>
     <Match idRef="Keyword_india_permanent_account_number"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_india_permanent_account_number
Permanent Account Number
ПАН

Индивидуальный идентификационный номер (Aadhaar) для Индии

Формат: 12 цифр, содержащих необязательные пробелы или дефисы.

Шаблон: 12 цифр:

  • четыре цифры;

  • необязательный пробел или тире;

  • четыре цифры;

  • необязательный пробел или тире;

  • Последняя цифра, которая является проверка цифрой

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_india_aadhaar находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_india_aadhar.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_india_aadhaar находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- India Unique Identification (Aadhaar) number -->
<Entity id="1ca46b29-76f5-4f46-9383-cfa15e91048f" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_india_aadhaar"/>
     <Match idRef="Keyword_india_aadhar"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_india_aadhaar"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_india_aadhar
Аадхар
Аадхаар
UID
आधार

Номер удостоверения личности (KTP) для Индонезии

Формат: 16 цифр, содержащих необязательные точки

Шаблон: 16 цифр:

  • две цифры (код провинции);

  • точка (необязательно);

  • две цифры (код округа или города);

  • две цифры (код района);

  • точка (необязательно);

  • Шесть цифр в формате ДДММГГ, которые являются датой рождения

  • точка (необязательно);

  • четыре цифры.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_indonesia_id_card находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_indonesia_id_card.

Политика защиты от потери данных на 75 % уверена, что обнаружен этот тип конфиденциальной информации, если в пределах 300 символов регулярное выражение Regex_indonesia_id_card находит содержимое, соответствующее шаблону.

<!-- Indonesia Identity Card (KTP) Number -->
<Entity id="da68fdb0-f383-4981-8c86-82689d3b7d55" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_indonesia_id_card"/>
     <Match idRef="Keyword_indonesia_id_card"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_indonesia_id_card"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_indonesia_id_card
KTP
Kartu Tanda Penduduk
Nomor Induk Kependudukan

Международный номер банковского счета (IBAN)

Формат: код страны (две буквы) плюс проверка цифры (две цифры) плюс число bban (до 30 символов).

Шаблон:

Шаблон должен включать в себя все указанные ниже элементы.

  • Двухбуквенный код страны

  • Две проверочные цифры (после которых может следовать пробел)

  • 1–7 групп из четырех букв или цифр (могут разделяться пробелами)

  • 1–3 буквы или цифры

Формат для названия каждой из стран немного отличается. Тип конфиденциальной информации IBAN охватывает следующие 60 стран: объявление, ae, al, at, az, ba, be, bg, bh, ch, cr, cy, cz, de, dk, do, ee, es, fi, fo, fr, gb, ge, gi, gl, gr, hr, hu, ie, il, is, it, kw, lb, li, lt, lu, lv, mc, md, me, mk, mr, mt, mu, nl, no, pl, pt, ro, rs, sa, se, si, sk, sm, tn, tr, vg

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_iban находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<Entity id="e7dc4711-11b7-4cb0-b88b-2c394a771f0e" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_iban" />
  </Pattern>
</Entity>

Ключевые слова: None

IP-адрес

Формат: IPv4 или IPv6-адрес

Шаблон:

  • IPv4: сложный шаблон, который учитывает форматированные (точки) и неформатированные (без периодов) версии IPv4-адресов.

  • IPv6: сложный шаблон, который учитывает форматированные числа IPv6 (которые включают двоеточия).

Контрольная сумма: Нет

Определение:

В случае с протоколом IPv4 политика защиты от потери данных с вероятностью в 95 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Регулярное выражение Regex_ipv4_address находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_ipaddress.

В случае с протоколом IPv6 политика защиты от потери данных с вероятностью в 95 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Регулярное выражение Regex_ipv6_address находит содержимое, соответствующее шаблону.

  • Ключевое слово из Keyword_ipaddress не найден.

В случае с протоколом IPv4 политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Регулярное выражение Regex_ipv4_address находит содержимое, соответствующее шаблону.

  • Ключевое слово из Keyword_ipaddress не найден.

В случае с протоколом IPv6 политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Регулярное выражение Regex_ipv6_address находит содержимое, соответствующее шаблону.

  • Ключевое слово из Keyword_ipaddress не найден.

<Entity id="1daa4ad5-e2dd-4ca4-a788-54722c09efb2" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="95">
        <IdMatch idRef="Regex_ipv4_address" />
        <Any minMatches="1">
          <Match idRef="Keyword_ipaddress" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="95">
        <IdMatch idRef="Regex_ipv6_address" />
        <Any minMatches="1">
          <Match idRef="Keyword_ipaddress" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_ipv4_address" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_ipaddress" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_ipv6_address" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_ipaddress" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_ipaddress
ip address
internet protocol
IP-כתובת ה

Индивидуальный социальный номер (PPS) для Ирландии

Формат:

  • Новый формат (1 января 2013 г. и более поздние): семь цифр, за которыми следуют две буквы

  • Старый формат (31 декабря 2012 года и более ранние): семь цифр, за которыми следуют 1-2 буквы

Шаблон:

Новый формат (1 января 2013 г. и более поздние версии)

  • семь цифр;

  • буква (без учета регистра), которая является алфавитным проверочным символом;

  • буква "A" или "H" (без учета регистра).

Старый формат (31 декабря 2012 г. и более ранние версии)

  • семь цифр;

  • 1–2 буквы (без учета регистра).

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_ireland_pps находит содержимое, соответствующее шаблону.

  • Верно одно из условий ниже:

    • обнаружено ключевое слово из Keyword_ireland_pps.

    • Функция Func_eu_date находит дату в правильном формате даты.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 65 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Функция Func_ireland_pps находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Ireland Personal Public Service (PPS) Number -->
<Entity id="1cdb674d-c19a-4fcf-9f4b-7f56cc87345a" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_ireland_pps"/>
     <Any minMatches="1">
  <Match idRef="Keyword_ireland_pps"/>
  <Match idRef="Func_eu_date"/>
     </Any>
  </Pattern>
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Func_ireland_pps"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_ireland_pps
Personal Public Service Number
PPS Number
PPS Num
PPS No.
PPS #
PPS#
PPSN
Public Services Card
Uimhir Phearsanta Seirbhíse Poiblí
Уим. PSP
PSP

Номер банковского счета для Израиля

Формат: 13 цифр

Шаблон:

Форматированные:

  • Две цифры

  • Тире

  • Три цифры

  • Тире

  • Восемь цифр

Неформатировано: 13 последовательных цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_israel_bank_account_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_israel_bank_account_number.

<!-- Israel Bank Account Number -->
<Entity id="7d08b2ff-a0b9-437f-957c-aeddbf9b2b25" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_israel_bank_account_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_israel_bank_account_number" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_israel_bank_account_number
Bank Account Number
Bank Account
Account Number
מספר חשבון בנק

Национальный идентификатор для Израиля

Формат: девять цифр

Шаблон: девять последовательных цифр

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_israeli_national_id_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_Israel_National_ID.

  • Контрольная сумма проходит проверку.

<!-- Israel National ID Number -->
<Entity id="e05881f5-1db1-418c-89aa-a3ac5c5277ee" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_israeli_national_id_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_Israel_National_ID" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_Israel_National_ID
מספר זהות
National ID Number

Номер водительского удостоверения для Италии

Формат: сочетание 10 букв и цифр

Шаблон: сочетание 10 букв и цифр:

  • Одна буква (без учета регистра)

  • Буква "A" или "V" (без учета регистра)

  • Семь букв (без учета регистра), цифр или символов подчеркивания

  • Одна буква (без учета регистра)

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_italy_drivers_license_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_italy_drivers_license_number.

<!-- Italy Driver's license Number -->
<Entity id="97d6244f-9157-41bd-8e0c-9d669a5c4d71" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_italy_drivers_license_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_italy_drivers_license_number" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_italy_drivers_license_number
numero di patente di guida
patente di guida

Номер банковского счета для Японии

Формат: семь или восемь цифр

Шаблон:

Номер банковского счета: семь или восемь цифр

Код филиала для банковского счета.

  • Четыре цифры

  • Пробел или тире (необязательно)

  • Три цифры

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_jp_bank_account находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_jp_bank_account.

  • Верно одно из условий ниже:

    • Функция Func_jp_bank_account_branch_code находит содержимое, соответствующее шаблону.

    • обнаружено ключевое слово из Keyword_jp_bank_branch_code.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_jp_bank_account находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_jp_bank_account.

<!-- Japan Bank Account Number -->
<Entity id="d354f95b-96ee-4b80-80bc-4377312b55bc" patternsProximity="300" recommendedConfidence="75">
  <Version minEngineVersion="15.01.0131.000">
    <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_jp_bank_account" />
          <Match idRef="Keyword_jp_bank_account" />
          <Any minMatches="1">
            <Match idRef="Func_jp_bank_account_branch_code" />
            <Match idRef="Keyword_jp_bank_branch_code" />
          </Any>
      </Pattern>
  </Version>
     <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_bank_account" />
        <Match idRef="Keyword_jp_bank_account" />
    </Pattern>
</Entity>

Ключевые слова:

Keyword_jp_bank_account Keyword_jp_bank_branch_code
Checking Account Number
Checking Account
Checking Account #
Checking Acct Number
Checking Acct #
Checking Acct No.
Checking Account No.
Bank Account Number
Bank Account
Bank Account #
Bank Acct Number
Bank Acct #
Bank Acct No.
Bank Account No.
Savings Account Number
Savings Account
Savings Account #
Savings Acct Number
Savings Acct #
Savings Acct No.
Savings Account No.
Debit Account Number
Debit Account
Debit Account #
Debit Acct Number
Debit Acct #
Debit Acct No.
Debit Account No.
口座番号を当座預金口座の確認
#アカウントの確認、勘定番号の確認
#勘定の確認
勘定番号の確認
口座番号の確認
銀行口座番号
銀行口座
銀行口座#
銀行の勘定番号
銀行のacct#
銀行の勘定いいえ
銀行口座番号
普通預金口座番号
預金口座
貯蓄口座#
貯蓄勘定の数
貯蓄勘定#
貯蓄勘定番号
普通預金口座番号
引き落とし口座番号
口座番号
口座番号#
デビットのacct番号
デビット勘定#
デビットACCTの番号
デビット口座番号
Отемачи

Номер водительского удостоверения для Японии

Формат: 12 цифр

Шаблон: 12 последовательных цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_jp_drivers_license_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_jp_drivers_license_number.

<!-- Japan Driver's License Number -->
<Entity id="c6011143-d087-451c-8313-7f6d4aed2270" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_drivers_license_number" />
        <Match idRef ="Keyword_jp_drivers_license_number" />
    </Pattern>
</Entity>

Ключевые слова:

Keyword_jp_drivers_license_number
driver license
drivers license
driver's license
drivers licenses
driver's licenses
driver licenses
Dl#
Dls#
Lic#
lics#
運転免許証
運転免許
免許証
免許
運転免許証番号
運転免許番号
免許証番号
免許番号
運転免許証ナンバー
運転免許ナンバー
免許証ナンバー
運転免許証No.
運転免許No.
免許証No.
免許No.
運転免許証#
運転免許#
免許証#
免許#

Номер паспорта гражданина Японии

Формат: две буквы, за которыми следуют семь цифр

Шаблон: две буквы (без учета регистра), за которыми следует семь цифр.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_jp_passport находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_jp_passport.

<!-- Japan Passport Number -->
<Entity id="75177310-1a09-4613-bf6d-833aae3743f8" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_passport" />
        <Match idRef="Keyword_jp_passport" />
    </Pattern>
</Entity>

Ключевые слова:

Keyword_jp_passport
パスポート
パスポート番号
パスポートのNum
パスポート#

Номер регистрации резидента Японии

Формат: 11 цифр

Шаблон: 11 последовательных цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_jp_resident_registration_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_jp_resident_registration_number.

<!-- Japan Resident Registration Number -->
<Entity id="01c1209b-6389-4faf-a5f8-3f7e13899652" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_resident_registration_number" />
        <Match idRef ="Keyword_jp_resident_registration_number" />
    </Pattern>
</Entity>

Ключевые слова:

Keyword_jp_resident_registration_number
Resident Registration Number
Resident Register Number
Residents Basic Registry Number
Resident Registration No.
Resident Register No.
Residents Basic Registry No.
Basic Resident Register No.
住民登録番号、登録番号をレジデント
住民基本登録番号、登録番号
住民基本レジストリ番号を常駐
登録番号を常駐住民基本台帳登録番号

Номер карты социального страхования для Японии (SIN)

Формат: 7–12 цифр

Шаблон: 7–12 цифр:

  • Четыре цифры

  • Дефис (необязательно)

  • Шесть цифр

    ИЛИ

  • 7–12 последовательных цифр.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_jp_sin находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_jp_sin.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_jp_sin_pre_1997 находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_jp_sin.

<!-- Japan Social Insurance Number -->
<Entity id="c840e719-0896-45bb-84fd-1ed5c95e45ff" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_jp_sin" />
        <Match idRef="Keyword_jp_sin" />
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_sin_pre_1997" />
        <Match idRef="Keyword_jp_sin" />
    </Pattern>
</Entity>

Ключевые слова:

Keyword_jp_sin
Social Insurance No.
Social Insurance Num
Social Insurance Number
社会保険のテンキー
社会保険番号

Номер удостоверения личности для Малайзии

Формат: 12 цифр, содержащих необязательные дефисы

Шаблон: 12 цифр:

  • Шесть цифр в формате ГГММДД, которые являются датой рождения

  • дефис (необязательно);

  • код места рождения из двух букв;

  • дефис (необязательно);

  • три случайные цифры;

  • код пола из одной цифры.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_malaysia_id_card_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_malaysia_id_card_number.

<!-- Malaysia ID Card Number -->
</Entity>
      <Entity id="7f0e921c-9677-435b-aba2-bb8f1013c749" patternsProximity="300" recommendedConfidence="85">
        <Pattern confidenceLevel="85">
            <IdMatch idRef="Regex_malaysia_id_card_number" />
            <Match idRef="Keyword_malaysia_id_card_number" />
        </Pattern>
</Entity>

Ключевые слова:

Keyword_malaysia_id_card_number
MyKad
Identity Card
ID Card
Identification Card
Digital Application Card
Kad Akuan Diri
Kad Aplikasi Digital

Номер гражданской службы для Нидерландов (BSN)

Формат: 8–9 цифр, содержащих необязательные пробелы

Шаблон: 8–9 цифр:

  • три цифры;

  • пробел (необязательно);

  • три цифры;

  • пробел (необязательно);

  • 2–3 цифры.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_netherlands_bsn находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_netherlands_bsn.

  • Функция Func_eu_date находит дату в правильном формате даты.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 65 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Функция Func_netherlands_bsn находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Netherlands Citizen's Service (BSN) Number -->
<Entity id="c5f54253-ef7e-44f6-a578-440ed67e946d" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_netherlands_bsn"/>
     <Match idRef="Keyword_netherlands_bsn"/>
     <Match idRef="Func_eu_date"/>
  </Pattern>
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Func_netherlands_bsn"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_netherlands_bsn
Citizen service number
BSN
Burgerservicenummer
Sofinummer
Persoonsgebonden nummer
Persoonsnummer

Номер министерства здравоохранения для Новой Зеландии

Формат: три буквы, пробел (необязательно) и четыре цифры

Шаблон: три буквы (без учета регистра) пробел (необязательно) четыре цифры

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_new_zealand_ministry_of_health_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_nz_terms.

  • Контрольная сумма проходит проверку.

<!-- New Zealand Health Number -->
<Entity id="2b71c1c8-d14e-4430-82dc-fd1ed6bf05c7" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_new_zealand_ministry_of_health_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_nz_terms" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_nz_terms
NHI
Новая Зеландия
Работоспособность
Лечения

Идентификационный номер для Норвегии

Формат: 11 цифр

Шаблон: 11 цифр:

  • Шесть цифр в формате ДДММГГ, которые являются датой рождения

  • индивидуальный номер из трех цифр;

  • две проверочные цифры.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_norway_id_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_norway_id_number.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_norway_id_numbe находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Norway Identification Number -->
<Entity id="d4c8a798-e9f2-4bd3-9652-500d24080fc3" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_norway_id_number"/>
     <Match idRef="Keyword_norway_id_number"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_norway_id_number"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_norway_id_number
Personal identification number
Norwegian ID Number
ID Number
Идентификации
Personnummer
Fødselsnummer

Единый многофункциональный идентификационный номер для Филиппин

Формат: 12 цифр, разделенных дефисами

Шаблон: 12 цифр:

  • четыре цифры;

  • дефис;

  • семь цифр;

  • дефис;

  • одна цифра.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_philippines_unified_id находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_philippines_id.

<!-- Philippines Unified Multi-Purpose ID number -->
<Entity id="019b39dd-8c25-4765-91a3-d9c6baf3c3b3" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_philippines_unified_id"/>
     <Match idRef="Keyword_philippines_id"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_philippines_id
Unified Multi-Purpose ID
УМИД
Identity Card
Pinag-isang Multi-Layunin ID

Удостоверение личности гражданина Польши

Формат: три буквы и шесть цифр

Шаблон: три буквы (без учета регистра), за которыми следует шесть цифр

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_polish_national_id находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_polish_national_id_passport_number.

  • Контрольная сумма проходит проверку.

<!-- Poland Identity Card-->
<Entity id="25E64989-ED5D-40CA-A939-6C14183BB7BF" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_polish_national_id" />
          <Match idRef="Keyword_polish_national_id_passport_number" />
      </Pattern>
</Entity>

Ключевые слова:

Keyword_polish_national_id_passport_number
Nazwa i nr dowodu tożsamości
Dowód Tożsamości
Dow. Os.

Национальный идентификационный номер гражданина Польши (PESEL)

Формат: 11 цифр

Шаблон: 11 последовательных цифр

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_pesel_identification_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_pesel_identification_number.

  • Контрольная сумма проходит проверку.

<!-- Poland National ID (PESEL) -->
<Entity id="E3AAF206-4297-412F-9E06-BA8487E22456" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_pesel_identification_number" />
          <Match idRef="Keyword_pesel_identification_number" />
      </Pattern>
</Entity>

Ключевые слова:

Keyword_pesel_identification_number
Nr PESEL
PESEL

Паспорт гражданина Польши

Формат: две буквы и семь цифр

Шаблон: две буквы (без учета регистра), за которыми следует семь цифр.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_polish_passport_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_polish_national_id_passport_number.

  • Контрольная сумма проходит проверку.

<!-- Poland Passport Number -->
<Entity id="03937FB5-D2B6-4487-B61F-0F8BFF7C3517" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_polish_passport_number" />
          <Match idRef="Keyword_polish_national_id_passport_number" />
      </Pattern>
</Entity>
</Version>

Ключевые слова:

Keyword_polish_national_id_passport_number
Nazwa i nr dowodu tożsamości
Dowód Tożsamości
Dow. Os.

Номер карты гражданина Португалии

Формат: восемь цифр

Шаблон: восемь цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_portugal_citizen_card находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_portugal_citizen_card.

<!-- Portugal Citizen Card Number -->
<Entity id="91a7ece2-add4-4986-9a15-c84544d81ecd" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_portugal_citizen_card"/>
     <Match idRef="Keyword_portugal_citizen_card"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_portugal_citizen_card
Citizen Card
National ID Card
CC
Cartão de Cidadão
Bilhete de Identidade

Национальный идентификатор для Саудовской Аравии

Формат: 10 цифр

Шаблон: 10 последовательных цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_saudi_arabia_national_id находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_saudi_arabia_national_id.

<!-- Saudi Arabia National ID -->
<Entity id="8c5a0ba8-404a-41a3-8871-746aa21ee6c0" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_saudi_arabia_national_id" />
        <Any minMatches="1">
          <Match idRef="Keyword_saudi_arabia_national_id" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_saudi_arabia_national_id
Identification Card
I card number
ID number
الوطنية الهوية بطاقة رقم

Номер внутреннего удостоверения личности гражданина Сингапура (NRIC)

Формат: девять букв и цифр

Шаблон: девять букв и цифр:

  • буква "F", "G", "S" или "T" (без учета регистра);

  • семь цифр;

  • алфавитный проверочный символ.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_singapore_nric находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_singapore_nric.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_singapore_nric находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Singapore National Registration Identity Card (NRIC) Number -->
<Entity id="cead390a-dd83-4856-9751-fb6dc98c34da" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_singapore_nric"/>
     <Match idRef="Keyword_singapore_nric"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_singapore_nric"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_singapore_nric
National Registration Identity Card
Identity Card Number
NRIC
IC
Foreign Identification Number
ПЛАВНИК
身份证
身份證

Идентификационный номер для Южной Африки

Формат: 13 цифр, которые могут содержать пробелы

Шаблон: 13 цифр:

  • Шесть цифр в формате ГГММДД, которые являются датой рождения

  • четыре цифры;

  • индикатор гражданства в виде одной цифры;

  • цифра "8" или "9";

  • Одна цифра, которая является контрольной суммой

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_south_africa_identification_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_south_africa_identification_number.

  • Контрольная сумма проходит проверку.

<!-- South Africa Identification Number -->
<Entity id="e2adf7cb-8ea6-4048-a2ed-d89eb65f2780" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_south_africa_identification_number"/>
     <Match idRef="Keyword_south_africa_identification_number"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_south_africa_identification_number
Identity card
Идентификатор
Идентификации

Регистрационный номер жителя Южной Кореи

Формат: 13 цифр, содержащих дефис

Шаблон: 13 цифр:

  • Шесть цифр в формате ГГММДД, которые являются датой рождения

  • дефис;

  • одна цифра (определяет век и пол);

  • код региона рождения из четырех цифр;

  • одна цифра, используемая для разграничения людей, у которых предшествующие цифры совпадают;

  • проверочная цифра.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_south_korea_resident_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_south_korea_resident_number.

  • Контрольная сумма проходит проверку.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_south_korea_resident_number находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- South Korea Resident Registration Number -->
<Entity id="5b802e18-ba80-44c4-bc83-bf2ad36ae36a" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_south_korea_resident_number"/>
     <Match idRef="Keyword_south_korea_resident_number"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_south_korea_resident_number"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_south_korea_resident_number
National ID card
Citizen's Registration Number
Jumin deungnok beonho
RRN
주민등록번호

Номер социального страхования Испании (SSN)

Формат: 11–12 цифр

Шаблон: 11–12 цифр:

  • Две цифры

  • Косая черта (необязательно)

  • 7–8 цифр

  • Косая черта (необязательно)

  • Две цифры

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_spanish_social_security_number находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Spain SSN -->
<Entity id="5df987c0-8eae-4bce-ace7-b316347f3070" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_spanish_social_security_number" />
    </Pattern>
</Entity>

Ключевые слова: None

Национальный идентификационный номер гражданина Швеции

Формат: 10 или 12 цифр и необязательный разделитель

Шаблон: 10 или 12 цифр и необязательный разделитель:

  • 2–4 цифры (необязательно)

  • Шесть цифр в формате даты ГГММДД.

  • Разделитель - или + (необязательно)

  • четыре цифры.

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_swedish_national_identifier находит содержимое, соответствующее шаблону.

  • Контрольная сумма проходит проверку.

<!-- Sweden National ID -->
<Entity id="f69aaf40-79be-4fac-8f05-fd1910d272c8" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_swedish_national_identifier" />
    </Pattern>
</Entity>

Ключевые слова: None

Номер паспорта гражданина Швеции

Формат: восемь цифр

Шаблон: восемь последовательных цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_sweden_passport_number находит содержимое, соответствующее шаблону.

  • Верно одно из условий ниже:

    • обнаружено ключевое слово из Keyword_passport.

    • обнаружено ключевое слово из Keyword_sweden_passport.

<!-- Sweden Passport Number -->
<Entity id="ba4e7456-55a9-4d89-9140-c33673553526" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_sweden_passport_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_passport" />
          <Match idRef="Keyword_sweden_passport" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_sweden_passport Keyword_passport
visa requirements
Alien Registration Card
Schengen visas
Schengen visa
Visa Processing
Visa Type
Single Entry
Multiple Entry
G3 Processing Fees
Passport Number
Passport No
Passport#
Паспорт#
PassportID
Passportno
Соединенного Королевства
パスポート
パスポート番号
パスポートのNum
パスポート#
Numéro de passeport
Passeport n °
Passeport Non
Passeport#
Passeport#
PasseportNon
Passeportn °

Код SWIFT

Формат: четыре буквы, за которыми следуют 5–31 буквы или цифры

Шаблон: четыре буквы, за которыми следуют 5–31 буквы или цифры:

  • Четырехбуквенный код банка (без учета регистра)

  • Необязательный пробел

  • 4–28 букв или цифр (основной номер банковского счета, BBAN)

  • Необязательный пробел

  • 1–3 буквы или цифры (оставшаяся часть BBAN)

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_swift находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_swift.

<Entity id="cb2ab58c-9cb8-4c81-baf8-a4e106791df4" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_swift" />
        <Match idRef="Keyword_swift" />
    </Pattern>
</Entity>

Ключевые слова:

Keyword_swift
international organization for standardization 9362
iso 9362
iso9362
Swift#
swift code
swift number
swiftroutingnumber
swift code
swift number #
swift routing number
bic number
bic code
bic#
Bic#
bank identifier code
標準化9362
迅速#
SWIFTコード
SWIFT番号
迅速なルーティング番号
BIC番号
BICコード
銀行識別コードのための国際組織
Organisation internationale de normalisation 9362
rapide #
code SWIFT
le numéro de swift
swift numéro d'acheminement
le numéro BIC
# BIC
code identificateur de banque

Тайваньский идентификатор

Формат: одна буква (на английском языке), за которой следуют девять цифр

Шаблон: одна буква (на английском языке), за которой следует девять цифр:

  • Один символ (на английском языке, без учета регистра)

  • Цифра 1 или 2

  • Восемь цифр

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_taiwanese_national_id находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_taiwanese_national_id.

  • Контрольная сумма проходит проверку.

<!-- Taiwanese National ID -->
<Entity id="4C7BFC34-8DD1-421D-8FB7-6C6182C2AF03" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_taiwanese_national_id" />
          <Match idRef="Keyword_taiwanese_national_id" />
      </Pattern>
</Entity>

Ключевые слова:

Keyword_taiwanese_national_id
身份證字號
身份證
身份證號碼
身份證號
身分證字號
身分證
身分證號碼
身份證號
身分證統一編號
國民身分證統一編號
簽名
蓋章
簽名或蓋章
簽章

Номер паспорта гражданина Тайваня

Формат:

  • Номер биометрического паспорта: девять цифр

  • Небиометрический номер паспорта: девять цифр

Шаблон:

  • Номер биометрического паспорта:

    • цифра "3";

    • Восемь цифр

  • Небиометрический номер паспорта: девять цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_taiwan_passport находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_taiwan_passport.

<!-- Taiwan Passport Number -->
<Entity id="e7251cb4-4c2c-41df-963e-924eb3dae04a" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_taiwan_passport"/>
     <Match idRef="Keyword_taiwan_passport"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_taiwan_passport
ROC passport number
Passport number
Passport no
Passport Num
Passport #
护照
中華民國護照
Zhōnghuá Mínguó hùzhào

Номер удостоверения жителя Тайваня (ARC/TARC)

Формат: 10 букв и цифр

Шаблон: 10 букв и цифр:

  • две буквы (без учета регистра);

  • Восемь цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_taiwan_resident_certificate находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_taiwan_resident_certificate.

<!-- Taiwan Resident Certificate (ARC/TARC) -->
<Entity id="48269fec-05ea-46ea-b326-f5623a58c6e9" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_taiwan_resident_certificate"/>
     <Match idRef="Keyword_taiwan_resident_certificate"/>
  </Pattern>
</Entity>

Ключевые слова:

Keyword_taiwan_resident_certificate
Resident Certificate
Resident Cert
Resident Cert.
Identification card
Alien Resident Certificate
ARC
Taiwan Area Resident Certificate
TARC
居留證
外僑居留證
台灣地區居留證

Номер водительского удостоверения для Соединенного Королевства

Формат: сочетание 18 букв и цифр в указанном формате

Шаблон: 18 букв и цифр:

  • Пять букв (без учета регистра) или цифра 9 вместо буквы

  • Одна цифра

  • Пять цифр в формате даты ДДММГ, представляющие собой дату рождения

  • Две буквы (без учета регистра) или цифра 9 вместо буквы

  • Пять цифр

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_uk_drivers_license находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_uk_drivers_license.

  • Контрольная сумма проходит проверку.

<!-- U.K. Driver's License Number -->
<Entity id="f93de4be-d94c-40df-a8be-461738047551" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_uk_drivers_license" />
        <Match idRef="Keyword_uk_drivers_license" />
    </Pattern>
</Entity>

Ключевые слова:

Keyword_uk_drivers_license
DVLA
light vans
Квадроциклы
motor cars
125cc
Коляской
Трициклов
Мотоциклов
Лицензия на карта фотографий
learner drivers
licence holder
licence holders
driving licences
driving licence
dual control car

Регистрационный номер избирателя для Соединенного Королевства

Формат: две буквы, за которыми следуют 1–4 цифры

Шаблон: две буквы (без учета регистра), за которыми следуют 1–4 цифры

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_uk_electoral находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_uk_electoral.

<!-- U.K. Electoral Number -->
<Entity id="a3eea206-dc0c-4f06-9e22-aa1be3059963" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_uk_electoral" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_electoral" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_uk_electoral
council nomination
nomination form
electoral register
electoral roll

Номер национальной службы здравоохранения для Соединенного Королевства

Формат: 10–17 цифр, разделенных пробелами

Шаблон: 10–17 цифр:

  • 3 или 10 цифр

  • Пробел

  • Три цифры

  • Пробел

  • Четыре цифры

Контрольная сумма: Да

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_uk_nhs_number находит содержимое, соответствующее шаблону.

  • Верно одно из условий ниже:

    • обнаружено ключевое слово из Keyword_uk_nhs_number.

    • обнаружено ключевое слово из Keyword_uk_nhs_number1.

    • обнаружено ключевое слово из Keyword_uk_nhs_number_dob.

  • Контрольная сумма проходит проверку.

<!-- U.K. NHS Number -->
<Entity id="3192014e-2a16-44e9-aa69-4b20375c9a78" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_uk_nhs_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_nhs_number" />
          <Match idRef="Keyword_uk_nhs_number1" />
          <Match idRef="Keyword_uk_nhs_number_dob" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_uk_nhs_number Keyword_uk_nhs_number1 Keyword_uk_nhs_number_dob
national health service
Nhs
health services authority
health authority
идентификатор пациента
patient identification
patient no
patient number
GP
DOB
D.O.B
Date of Birth
Birth Date

Номер карты национального страхования для Соединенного Королевства (NINO)

Формат: девять букв и цифр, каждая пара букв и цифр при необходимости разделена пробелами или дефисами.

Шаблон: девять букв и цифр, каждая пара букв и цифр, при необходимости разделенных пробелами или дефисами:

  • Две любые буквы (без учета регистра), кроме D, F, I, Q, U или V. Кроме того, в качестве второй буквы невозможно использовать O. Не допускаются также следующие сочетания: BG, GB, KN, NK, NT, TN и ZZ.

  • Шесть цифр

  • Пробел или тире (необязательно)

  • Две цифры

  • Пробел или тире (необязательно)

  • Две цифры

  • Пробел или тире (необязательно)

  • Две цифры

  • Одна буква (A, B, C или D) или один пробел.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_uk_nino находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_uk_nino.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_uk_nino находит содержимое, соответствующее шаблону.

  • Ключевое слово из Keyword_uk_nino не найден.

<!-- U.K. NINO -->
<Entity id="16c07343-c26f-49d2-a987-3daf717e94cc" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_uk_nino" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_nino" />
        </Any>
    </Pattern>
     <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_uk_nino" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_uk_nino" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_uk_nino
national insurance number
national insurance contributions
protection act
Страхование
social security number
insurance application
medical application
social insurance
medical attention
social security
great britain
Страхование

Номер паспорта гражданина США и/или Соединенного Королевства

Формат: девять цифр

Шаблон: девять последовательных цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_usa_uk_passport находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_passport.

<Entity id="178ec42a-18b4-47cc-85c7-d62c92fd67f8" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_usa_uk_passport" />
        <Match idRef="Keyword_passport" />
    </Pattern>
</Entity>

Ключевые слова:

Keyword_passport
Passport Number
Passport No
Passport#
Паспорт#
PassportID
Passportno
Соединенного Королевства
パスポート
パスポート番号
パスポートのNum
パスポート#
Numéro de passeport
Passeport n °
Passeport Non
Passeport#
Passeport#
PasseportNon
Passeportn °

Номер банковского счета для США

Формат: 4–17 цифр

Шаблон: 4–17 последовательных цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Регулярное выражение Regex_usa_bank_account_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_usa_Bank_Account.

<!-- U.S. Bank Account Number -->
<Entity id="a2ce32a8-f935-4bb6-8e96-2a5157672e2c" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_usa_bank_account_number" />
        <Match idRef="Keyword_usa_Bank_Account" />
    </Pattern>
</Entity>

Ключевые слова:

Keyword_США_Bank_Account
Checking Account Number
Checking Account
Checking Account #
Checking Acct Number
Checking Acct #
Checking Acct No.
Checking Account No.
Bank Account Number
Bank Account #
Bank Acct Number
Bank Acct #
Bank Acct No.
Bank Account No.
Savings Account Number
Savings Account.
Savings Account #
Savings Acct Number
Savings Acct #
Savings Acct No.
Savings Account No.
Debit Account Number
Debit Account
Debit Account #
Debit Acct Number
Debit Acct #
Debit Acct No.
Debit Account No.

Номер водительского удостоверения для США

Формат: зависит от состояния

Шаблон: зависит от штата, например, Нью-йорк:

  • Подойдут девять цифр в формате ццц ццц ццц.

  • Не подойдут девять цифр в формате ццццццццц.

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_new_york_drivers_license_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_[state_name]_drivers_license_name.

  • обнаружено ключевое слово из Keyword_us_drivers_license.

Политика защиты от потери данных с вероятностью в 65 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Функция Func_new_york_drivers_license_number находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_[state_name]_drivers_license_name.

  • обнаружено ключевое слово из Keyword_us_drivers_license_abbreviations.

  • Ключевое слово из Keyword_us_drivers_license не найден.

<Pattern confidenceLevel="75">
        <IdMatch idRef="Func_new_york_drivers_license_number" />
        <Match idRef="Keyword_new_york_drivers_license_name" />
        <Match idRef="Keyword_us_drivers_license" />
    </Pattern>
    <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_new_york_drivers_license_number" />
        <Match idRef="Keyword_new_york_drivers_license_name" />
        <Match idRef="Keyword_us_drivers_license_abbreviations" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_us_drivers_license" />
        </Any>
    </Pattern>

Ключевые слова:

Keyword_us_drivers_license_abbreviations Keyword_us_drivers_license Keyword_[state_name]_drivers_license_name
DL
DLS
CDL
CDLS
Идентификатор
Идентификаторы
DL#
DLS#
CDL#
CDLS#
ID#
Идентификаторы#
ID number
ID numbers
LIC
LIC#
DriverLic
DriverLics
DriverLicense
DriverLicenses
Driver Lic
Driver Lics
Driver License
Driver Licenses
DriversLic
DriversLics
ДрайверыЛицензии
ДрайверыЛицензии
Drivers Lic
Drivers Lics
Drivers License
Drivers Licenses
Driver'Lic
Driver'Lics
Водительские права
Водительские лицензии
Driver' Lic
Driver' Lics
Driver' License
Driver' Licenses
Driver'sLic
Driver'sLics
Лицензия драйвера
Лицензии драйвера
Driver's Lic
Driver's Lics
Driver's License
Driver's Licenses
identification number
identification numbers
identification #
ID card
Удостоверения личности
identification card
identification cards
DriverLic#
DriverLics#
DriverLicense#
DriverLicenses#
Driver Lic#
Driver Lics#
Driver License#
Driver Licenses#
DriversLic#
DriversLics#
ДрайверыЛицензии#
ДрайверыЛицензии#
Drivers Lic#
Drivers Lics#
Drivers License#
Drivers Licenses#
Driver'Lic#
Driver'Lics#
Водительские права#
Водительские лицензии#
Driver' Lic#
Driver' Lics#
Driver' License#
Driver' Licenses#
Driver'sLic#
Driver'sLics#
Лицензия драйвера#
Лицензии драйвера#
Driver's Lic#
Driver's Lics#
Driver's License#
Driver's Licenses#
идентификатор карта#
Удостоверения личности#
identification card#
identification cards#
Аббревиатура штата (например, NY)
Название штата (например, New York)

Идентификационный номер налогоплательщика для США (ITIN)

Формат: девять цифр, которые начинаются с "9" и содержат "7" или "8" в качестве четвертой цифры, при необходимости отформатированные пробелами или дефисами.

Шаблон:

Форматированные:

  • Цифра 9

  • Две цифры

  • Пробел или тире

  • Цифра 7 или 8

  • Одна цифра

  • Пробел или тире

  • Четыре цифры

Неформатированный:

  • Цифра 9

  • Две цифры

  • Цифра 7 или 8

  • Пять цифр

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_formatted_itin находит содержимое, соответствующее шаблону.

  • Верно по меньшей мере одно из условий ниже:

    • обнаружено ключевое слово из Keyword_itin.

    • Функция Func_us_address находит адрес в правильном формате даты.

    • Функция Func_us_date находит дату в правильном формате даты.

    • обнаружено ключевое слово из Keyword_itin_collaborative.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_unformatted_itin находит содержимое, соответствующее шаблону.

  • Верно по меньшей мере одно из условий ниже:

    • обнаружено ключевое слово из Keyword_itin_collaborative.

    • Функция Func_us_address находит адрес в правильном формате даты.

    • Функция Func_us_date находит дату в правильном формате даты.

<!-- U.S. Individual Taxpayer Identification Number (ITIN) -->
<Entity id="e55e2a32-f92d-4985-a35d-a0b269eb687b" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_formatted_itin" />
        <Any minMatches="1">
          <Match idRef="Keyword_itin" />
          <Match idRef="Func_us_address" />
          <Match idRef="Func_us_date" />
          <Match idRef="Keyword_itin_collaborative" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_itin" />
        <Match idRef="Keyword_itin" />
        <Any minMatches="1">
          <Match idRef="Keyword_itin_collaborative" />
          <Match idRef="Func_us_address" />
          <Match idRef="Func_us_date" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_itin Keyword_itin_collaborative
Налогоплательщик
налоговый идентификатор
tax identification
itin
Ssn
Олова
social security
tax payer
itins
за рулем
individual taxpayer
Лицензия
DL
DOB
Birthdate
Birthday
Date of Birth

Страховой номер для США (SSN)

Формат: девять цифр, которые могут иметь форматированный или неформатированный шаблон

Примечание.

Есть SSN выдан до середины 2011 г., он отличается строгим форматированием, при котором определенные части номера должны входить в указанные диапазоны (при этом нет контрольной суммы).

Шаблон. Четыре функции ищут сети SSN в четырех разных шаблонах:

  • Func_ssn находит сети SSN с строгим форматированием до 2011 года, отформатированными с помощью дефисов или пробелов (ddd-dd-dddd OR ddd dddd)

  • Func_unformatted_ssn находит сети SSN со строгим форматированием до 2011 года, которые не отформатированы в виде девяти последовательных цифр (ddddddddd)

  • Func_randomized_formatted_ssn находит сети SSN после 2011 года, отформатированные с помощью дефисов или пробелов (ddd-ddd-dddd OR ddd dddd)

  • Func_randomized_unformatted_ssn находит сети SSN после 2011 года, которые не отформатированы как девять последовательных цифр (ddddddddd)

Контрольная сумма: Нет

Определение:

Политика защиты от потери данных с вероятностью в 85 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_ssn находит содержимое, соответствующее шаблону.

  • Верно по меньшей мере одно из условий ниже:

    • обнаружено ключевое слово из Keyword_ssn.

    • Функция Func_us_date находит дату в правильном формате даты.

    • Функция Func_us_address находит адрес в правильном формате даты.

Политика защиты от потери данных с вероятностью в 75 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, не отдаленном более чем на 300 знаков:

  • Функция Func_unformatted_ssn находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_ssn.

  • Верно по меньшей мере одно из условий ниже:

    • Функция Func_us_date находит дату в правильном формате даты.

    • Функция Func_us_address находит адрес в правильном формате даты.

Политика защиты от потери данных с вероятностью в 65 % верно обнаруживает этот тип конфиденциальной информации, если в расположении, отдаленном не более чем на 300 знаков:

  • Функция Func_randomized_formatted_ssn находит содержимое, соответствующее шаблону.

  • Функция Func_ssn не находит содержимое, соответствующее шаблону.

  • Верно по меньшей мере одно из условий ниже:

    • обнаружено ключевое слово из Keyword_ssn.

    • Функция Func_us_date находит дату в правильном формате даты.

    • Функция Func_us_address находит адрес в правильном формате даты.

Политика защиты от потери данных с вероятностью в 55 % верно обнаружила этот тип конфиденциальной информации, если в пределах ближайших 300 знаков:

  • Функция Func_randomized_unformatted_ssn находит содержимое, соответствующее шаблону.

  • обнаружено ключевое слово из Keyword_ssn.

  • Функция Func_unformatted_ssn не находит содержимое, соответствующее шаблону.

  • Верно по меньшей мере одно из условий ниже:

    • Функция Func_us_date находит дату в правильном формате даты.

    • Функция Func_us_address находит адрес в правильном формате даты.

<!-- U.S. Social Security Number (SSN) -->
<Entity id="a44669fe-0d48-453d-a9b1-2cc83f2cba77" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_ssn" />
        <Any minMatches="1">
          <Match idRef="Keyword_ssn" />
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_ssn" />
        <Match idRef="Keyword_ssn" />
        <Any minMatches="1">
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_randomized_formatted_ssn" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Func_ssn" />
        </Any>
        <Any minMatches="1">
          <Match idRef="Keyword_ssn" />
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="55">
        <IdMatch idRef="Func_randomized_unformatted_ssn" />
        <Match idRef="Keyword_ssn" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Func_unformatted_ssn" />
        </Any>
        <Any minMatches="1">
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова:

Keyword_ssn
Social Security
Social Security#
Soc Sec
SSN
SSNS
SSN#
SS#
SSID