Дополнительные сведения о типах конфиденциальной информацииLearn about sensitive information types

Определение и классификация конфиденциальных элементов, которые находятся под контролем организаций, является первым шагом в области защиты информации.Identifying and classifying sensitive items that are under your organizations control is the first step in the Information Protection discipline. Microsoft 365 предоставляет три способа определения элементов, чтобы их можно было классифицировать:Microsoft 365 provides three ways of identifying items so that they can be classified:

  • вручную пользователямиmanually by users
  • автоматическое распознавание шаблонов, например типы конфиденциальной информацииautomated pattern recognition, like sensitive information types
  • машинное обучениеmachine learning

Типы конфиденциальных сведений — классификаторы на основе шаблонов.Sensitive information types are pattern-based classifiers. Они обнаруживают конфиденциальную информацию, например номера социального обеспечения, кредитной карты или банковских счетов, чтобы идентифицировать конфиденциальные элементы, см. в статьи Определения объектов типа конфиденциальной информации.They detect sensitive information like social security, credit card, or bank account numbers to identify sensitive items, see Sensitive information types entity definitions

Типы конфиденциальной информации используются вSensitive information types are used in

Основные части типа конфиденциальной информацииFundamental parts of a sensitive information type

Каждая сущность типа конфиденциальной информации определяется этими полями:Every sensitive information type entity is defined by these fields:

  • имя: как называется тип конфиденциальной информацииname: how the sensitive information type is referred to
  • описание: описывает, что ищет тип конфиденциальной информацииdescription: describes what the sensitive information type is looking for
  • шаблон. Шаблон определяет, что обнаруживает тип конфиденциальной информации.pattern: A pattern defines what a sensitive information type detects. Он состоит из следующих компонентовIt consists of the following components
    • Основной элемент — основной элемент, который ищет тип конфиденциальной информации.Primary element – the main element that the sensitive information type is looking for. Это может быть регулярное выражение с проверкой проверки или без нее, список ключевых слов, словарь ключевых слов или функция.It can be a regular expression with or without a checksum validation, a keyword list, a keyword dictionary, or a function.
    • Вспомогательный элемент — элементы, которые выступают в качестве подтверждающих доказательств, которые помогают в повышении уверенности в совпадении.Supporting element – elements that act as supporting evidence that help in increasing the confidence of the match. Например, ключевое слово "SSN" в непосредственной близости от номера SSN.For example, keyword “SSN” in proximity of an SSN number. Это может быть регулярное выражение с проверкой или без проверки, списком ключевых слов, словарем ключевых слов.It can be a regular expression with or without a checksum validation, keyword list, keyword dictionary.
    • Уровень доверия . Уровни доверия (высокий, средний, низкий) отражают, сколько подтверждающих данных было обнаружено вместе с основным элементом.Confidence Level - Confidence levels (high, medium, low) reflect how much supporting evidence was detected along with the primary element. Чем больше подтверждающих данных содержит элемент, тем выше уверенность в том, что соответствие элементу содержит чувствительную информацию, которую вы ищете.The more supporting evidence an item contains, the higher the confidence that a matched item contains the sensitive info you're looking for.
    • Близость — количество символов между основным и вспомогательным элементомProximity – Number of characters between primary and supporting element

Схема подтверждающего признака и интервала вероятности

Дополнительные информацию об уровнях уверенности в этом видеоLearn more about confidence levels in this video

Пример типа конфиденциальной информацииExample sensitive information type

Номер национального удостоверения (DNI) АргентиныArgentina national identity (DNI) number

ФорматFormat

Восемь цифр, разделенных точками.Eight digits separated by periods

ШаблонPattern

Восемь цифр:Eight digits:

  • две цифрыtwo digits
  • периодa period
  • три цифрыthree digits
  • периодa period
  • три цифрыthree digits

Контрольная суммаChecksum

НетNo

ОпределениеDefinition

Политика DLP имеет среднюю уверенность в том, что она обнаруживает этот тип конфиденциальной информации, если в непосредственной близости от 300 символов:A DLP policy has medium confidence that it's detected this type of sensitive information if, within a proximity of 300 characters:

  • регулярное выражение Regex_argentina_national_id находит содержимое, которое соответствует шаблону;The regular expression Regex_argentina_national_id finds content that matches the pattern.
  • находится ключевое слово из Keyword_argentina_national_id.A keyword from Keyword_argentina_national_id is found.
<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
      <IdMatch idRef="Regex_argentina_national_id"/>
      <Match idRef="Keyword_argentina_national_id"/>
  </Pattern>
</Entity>

Ключевые словаKeywords

Keyword_argentina_national_idKeyword_argentina_national_id

  • Argentina National Identity numberArgentina National Identity number
  • УдостоверениеIdentity
  • Удостоверение национальной идентификацииIdentification National Identity Card
  • DNIDNI
  • Национальный реестр лиц NICNIC National Registry of Persons
  • Documento Nacional de IdentidadDocumento Nacional de Identidad
  • Registro Nacional de las PersonasRegistro Nacional de las Personas
  • IdentidadIdentidad
  • IdentificaciónIdentificación

More on confidence levelsMore on confidence levels

В определении объекта типа конфиденциальной информации уровень доверия отражает, сколько подтверждающих данных обнаруживается в дополнение к основному элементу. In a sensitive information type entity definition, confidence level reflects how much supporting evidence is detected in addition to the primary element. Чем больше подтверждающих данных содержит элемент, тем выше уверенность в том, что соответствие элементу содержит чувствительную информацию, которую вы ищете.The more supporting evidence an item contains, the higher the confidence that a matched item contains the sensitive info you're looking for. Например, совпадения с высоким уровнем доверия будут содержать больше подтверждающих данных в непосредственной близости от основного элемента, в то время как совпадения с низким уровнем доверия не содержат практически никаких подтверждающих доказательств в непосредственной близости.For example, matches with a high confidence level will contain more supporting evidence in close proximity of the primary element, whereas matches with a low confidence level would contain little to no supporting evidence in close proximity.

Высокий уровень доверия возвращает меньшее количество ложных срабатывай, но может привести к более ложным отрицательным результатам.A high confidence level returns the fewest false positives but might result in more false negatives. Низкий или средний уровень уверенности возвращает больше ложных срабатывай, но мало к нулю ложных негативов.Low or medium confidence levels returns more false positives but few to zero false negatives.

  • низкая достоверность: значение 65, совпадают элементы будут содержать меньшее количество ложных негативов, но наиболее ложных срабатывалось.low confidence: Value of 65, matched items will contain the fewest false negatives but the most false positives. Низкая достоверность возвращает все совпадения низкой, средней и высокой уверенности.Low confidence returns all low, medium, and high confidence matches.
  • средняя уверенность: значение 75, совпадает элементов будет содержать среднее количество ложных срабатывай и ложных негативов.medium confidence: Value of 75, matched items will contain an average amount of false positives and false negatives. Средняя уверенность возвращает все средние и высокие совпадения доверия.Medium confidence returns all medium, and high confidence matches.
  • высокая уверенность: значение 85, совпадают элементы будут содержать меньшее количество ложных срабатывай, но наиболее ложных негативов.high confidence: Value of 85, matched items will contain the fewest false positives but the most false negatives. Высокая уверенность возвращает только матчи высокой уверенности.High confidence only returns high confidence matches.

Вы должны использовать шаблоны высокого уровня доверия с низким количеством, скажем, от пяти до десяти, и с низким уровнем доверия с более высокими подсчетами, скажем, 20 или более.You should use high confidence level patterns with low counts, say five to ten, and low confidence patterns with higher counts, say 20 or more.

Примечание

Если у вас есть существующие политики или настраиваемые типы конфиденциальной информации (SITs), определяемые с помощью уровней уверенности на основе номеров (также знаю, как точность), они автоматически будут сопопосаться с тремя дискретными уровнями уверенности; низкая уверенность, средняя уверенность и высокая уверенность в пользовательском интерфейсе Центра обеспечения безопасности и соответствия требованиям.If you have existing policies or custom sensitive information types (SITs) defined using number-based confidence levels (also know as accuracy), they will automatically be mapped to the three discrete confidence levels; low confidence, medium confidence, and high confidence, across the Security @ Compliance Center UI.

  • Все политики с минимальной точностью или настраиваемые шаблоны SIT с уровнем доверия от 76 до 100 будут иметь высокую степень уверенности.All policies with minimum accuracy or custom SIT patterns with confidence levels of between 76 and 100 will be mapped to high confidence.
  • Все политики с минимальной точностью или настраиваемые шаблоны SIT с уровнем доверия от 66 до 75 будут соедему со средней степенью уверенности.All policies with minimum accuracy or custom SIT patterns with confidence levels of between 66 and 75 will be mapped to medium confidence.
  • Все политики с минимальной точностью или настраиваемые шаблоны SIT с уровнем уверенности менее 65 или равными 65, будут иметь низкое доверие.All policies with minimum accuracy or custom SIT patterns with confidence levels less than or equal to 65 will be mapped to low confidence.

Создание пользовательских типов конфиденциальной информацииCreating custom sensitive information types

Создать пользовательский тип конфиденциальной информации для защиты от потери данных в Центре безопасности и соответствия требованиям можно с помощью нескольких вариантов:To create custom sensitive information types in the Security & Compliance Center, you can choose from several options:

Примечание

Улучшенные уровни доверия доступны для немедленного использования в рамках предотвращения потери данных для служб Microsoft 365, Microsoft Information Protection for Microsoft 365 services, Communication Compliance, Information Governance и Records Management.Improved confidence levels are available for immediate use within Data Loss Prevention for Microsoft 365 services, Microsoft Information Protection for Microsoft 365 services, Communication Compliance, Information Governance, and Records Management.

Служба защиты информации Microsoft 365 теперь поддерживает в предварительный версии языки с набором двухбайтовых символов:Microsoft 365 Information Protection now supports in preview double byte character set languages for:

  • Китайский (упрощенное письмо)Chinese (simplified)
  • Китайский (традиционное письмо)Chinese (traditional)
  • КорейскийKorean
  • ЯпонскийJapanese

Эта поддержка доступна для конфиденциальных типов информации.This support is available for sensitive information types. Дополнительные сведения см. в статье Заметки о выпуске: поддержка защиты информации для наборов двухбайтовых символов (предварительная версия).See, Information protection support for double byte character sets release notes (preview) for more information.

Дополнительные сведенияFor further information

Сведения о том, как использовать типы конфиденциальной информации для соблюдения правил конфиденциальности данных, см. в странице Развертывание защиты информации для правил конфиденциальности данных с помощью Microsoft 365 (aka.ms/m365dataprivacy).To learn how to use sensitive information types to comply with data privacy regulations, see Deploy information protection for data privacy regulations with Microsoft 365 (aka.ms/m365dataprivacy).