Настройка и создание типа конфиденциальной информацииCustomize or create a new sensitive information type

В этой статье приведены три примера того, как изменить или создать типы конфиденциальной информации в Office 365 для соблюдения регламента GDPR.This article provides three examples to demonstrate how to modify or create new Office 365 sensitive information types for GDPR.

  • Изменение имеющегося типа конфиденциальной информации — номер банковской карты для ЕСModify an existing sensitive information type — EU Debit Card Number

  • Создание типа конфиденциальной информации — адрес электронной почтыCreate a new sensitive information type — email address

  • Создание типа конфиденциальной информации с примером XML-файла — номер клиента ContosoCreate a new sensitive information type with example XML file — Contoso customer number

См. также:Also see:

Изменение типа конфиденциальной информации для повышения точности данныхModify a sensitive information type to improve accuracy

Если вы используете веб-часть "Поиск контента" для поиска персональных данных с помощью типов конфиденциальной информации, но при этом не получаете ожидаемых результатов либо запрос возвращает слишком много ложных срабатываний, рекомендуется изменять тип конфиденциальной информации в соответствии с вашей средой.If you’re using Content Search to search for personal data using sensitive information types and you’re not returning the expected results, or the query returns too many false positives, consider modifying the sensitive information type to work better with your environment.

Тип конфиденциальной информации рекомендуется создавать или настраивать на основе имеющегося типа, присвоив ему уникальное имя и идентификаторы. Например, если вы хотите настроить параметры типа конфиденциальной информации "Номер банковской карты для ЕС", копию соответствующего правила можно назвать "Номер банковской карты для ЕС, улучшенная версия", чтобы отличать этот тип от исходного.The best practice when creating or customizing a sensitive information type is to create a new sensitive information type based on an existing one, giving it a unique name and identifiers. For example, if you wish to adjust the parameters of the “EU Debit Card Number” sensitive information type, you could name your copy of that rule “EU Debit Card Enhanced” to distinguish it from the original.

В новом типе конфиденциальной информации просто измените необходимые значения, чтобы повысить точность данных. После завершения отправьте новый тип конфиденциальной информации и создайте новое правило защиты от потери данных (или измените имеющееся), чтобы использовать новый тип конфиденциальной информации, который вы только что добавили. Изменение точности типов конфиденциальной информации выполняется методом проб и ошибок, поэтому рекомендуется сохранить копию исходного типа, к которому вы можете при необходимости вернуться в будущем.In your new sensitive information type, simply modify the values you wish to change to improve its accuracy. Once complete, upload your new sensitive information type and create a new DLP rule (or modify an existing one) to use the new sensitive information type you just added. Modifying the accuracy of sensitive information types might require some trial and error, so maintaining a copy of the original type allows you to fall back to it if required in the future.

Вот как настроить тип конфиденциальной информации:To customize a sensitive information type:

  1. Экспортируйте имеющийся пакет правил Майкрософт со встроенными типами конфиденциальной информации в Office 365.Export the existing Microsoft Rule Package of built in sensitive information types in Office 365.

  2. Переименуйте этот XML-файл и откройте его в своем любимом редакторе XML.Rename this XML file and open it in your favorite XML editor.

  3. Изолируйте нужный тип конфиденциальной информации и удалите все остальные.Isolate the sensitive information type and remove all others.

  4. С помощью PowerShell создайте два GUID для типа конфиденциальной информации, который вы изменяете.Use PowerShell to generate two new GUIDs for the sensitive information type you are modifying.

  5. Измените идентификатор и другие основные элементы, чтобы сделать тип конфиденциальной информации уникальным (в том числе замените два GUID только что созданными).Modify the ID and other basic elements so the sensitive information type is unique (this includes replacing two GUIDs with the new ones you generated).

  6. Настройте требования к соответствию для повышения точности.Tune the match requirements to improve accuracy.

    1. Изменения в расположении слов и знаков: измените расположение слов и знаков, чтобы расширить или сжать окно, в котором тип конфиденциальной информации должны окружать ключевые слова.Proximity modifications — Modify the character pattern proximity to expand or shrink the window in which keywords must be found around the sensitive information type.

    2. Изменения в ключевых словах: добавьте ключевые слова в один из элементов <Ключевые слова>, чтобы предоставить более конкретные подкрепляющие доказательства для типа конфиденциальной информации с целью обнаружения соответствия этому правилу. Вы также можете удалить ключевые слова, которые приводят к ложным срабатываниям.Keyword modifications — Add keywords to one of the <Keywords> element in order to provide our sensitive information type more specific corroborative evidence to search for in order to signal a match on this rule. Or remove keywords that are causing false positives.

    3. Изменения в доверии: измените доверие, при котором тип конфиденциальной информации должен соответствовать условиям, заданным в его определении, для нахождения совпадения и сообщения о нем.Confidence modifications — Modify the confidence with which the sensitive information type must match the criteria specified in its definition before a match is signaled and reported.

  7. Передайте новый тип конфиденциальной информации.Upload the new sensitive information type.

  8. Выполните повторный обход контента, чтобы идентифицировать конфиденциальную информацию. См. статью Ручной запрос обхода контента и переиндексации сайта.Recrawl your content to identify the sensitive information. See Manually request crawling and re-indexing of a site.

Пример: изменение типа конфиденциальной информации "Номер банковской карты для ЕС"Example: modify the ‘EU Debit Card Number’ sensitive information type

Для повышения точности правил защиты от потери данных в любой системе их необходимо проверить путем сравнения с примером набора данных. Кроме того, может потребоваться точная настройка путем многократных изменений и проверок. В этом примере приведены изменения, внесенные в тип конфиденциальной информации "Номер банковской карты для ЕС" для повышения его точности.Improving the accuracy of DLP rules in any system requires testing against a sample data set, and may require fine tuning through repetitive modifications and tests. This example demonstrates modifications to the ‘EU Debit Card Number’ sensitive information type to improve its accuracy.

При поиске номера банковской карты для ЕС в нашем примере определение соответствующего номера строго ограничено 16 знаками с использованием сложного шаблона. Кроме того, применяется проверка контрольной суммы. Мы не можем изменить этот шаблон из-за определения строки для этого типа конфиденциальной информации. Тем не менее мы можем внести перечисленные ниже изменения, чтобы повысить точность поиска этого типа конфиденциальной информации в среде Office 365 с помощью защиты от потери данных в Office 365.When searching for an EU Debit Card Number in our example, the definition of that number is strictly defined as 16 digits using a complex pattern, and being subject to the validation of a checksum. We cannot alter this pattern due to the string definition of this sensitive information type. However, we can make the following adjustments to improve the accuracy of how Office 365 DLP finds this sensitive information type within Office 365.

Изменение расположения слов и знаковProximity modification

Окно будет сжато путем изменения значения patternProximity в элементе <Entity> с 300 на 150 символов. Это значит, что подкрепляющие доказательства, или ключевые слова, должны в большей мере соответствовать нашему типу конфиденциальной информации для обнаружения соответствия этому правилу.We'll shrink the window by modifying the patternProximity value in our <Entity> element from 300 to 150 characters. This means that our corroborative evidence, or our keywords, must be closer to our sensitive information type in order to signal a match on this rule.

<Entity id="48da7072-821e-4804-9fab-72ffb48f6f78" patternsProximity="150" recommendedConfidence="85"><Entity id="48da7072-821e-4804-9fab-72ffb48f6f78" patternsProximity="150" recommendedConfidence="85">

Изменения ключевых словKeyword modifications

Некоторые ключевые слова могут приводить к ложным срабатываниям, поэтому их может потребоваться удалить. Вот ключевые слова в этом примере:Some keywords might cause false positives to occur. As a result you might want to remove keywords. Here are the keywords for this example::

<Keyword id="Keyword_card_terms_dict"><Keyword id="Keyword_card_terms_dict">

<Group><Group>

<Term>корпоративная карта</Term><Term>corporate card</Term>

<Term>карта организации</Term><Term>organization card</Term>

<Term>acct nbr</Term><Term>acct nbr</Term>

<Term>acct num</Term><Term>acct num</Term>

<Term>acct no</Term><Term>acct no</Term>

...

</Group></Group>

</Keyword></Keyword>

Изменения в доверииConfidence modifications

Удаляя ключевые слова из определения, вы, как правило, хотите настроить вероятность нахождения этого типа конфиденциальной информации путем сокращения этого значения. Стандартный уровень для типа "Номер банковской карты для ЕС" — 85.If you remove keywords from the definition, you would typically want to adjust how confident you are that this sensitive information type was found by lowering this value. The default level for EU Debit Card Number type is 85.

<Entity id="48da7072-821e-4804-9fab-72ffb48f6f78" patternsProximity="150" recommendedConfidence="85"><Entity id="48da7072-821e-4804-9fab-72ffb48f6f78" patternsProximity="150" recommendedConfidence="85">

<Pattern confidenceLevel="85"><Pattern confidenceLevel="85">

...

</Pattern></Pattern>

</Entity></Entity>

Создание пользовательского типа конфиденциальной информацииCreate a new custom sensitive information type

Чтобы создать пользовательский тип конфиденциальной информации, сначала воспользуйтесь веб-частью "Поиск контента" для:To create a new custom sensitive information type, start by using Content Search to:

  • оптимизации запроса KQL;Optimize a KQL query

  • определения наиболее полезных ключевых слов.See which keywords are most useful

Используйте эти результаты, чтобы создать тип конфиденциальной информации. Затем оптимизируйте новый тип конфиденциальной информации для своей среды.Use these results to create a new sensitive information type. Then optimize the new sensitive information type for your environment.

Примечание. В ближайшее время будет представлен ряд новых типов конфиденциальной информации для персональных данных в странах ЕС. Если вам нужно создать типы конфиденциальной информации, сначала определите данные, характерные для вашей среды.Note: Many new sensitive information types are coming soon for personal data in EU countries. If you need to create new sensitive information types, begin by targeting data that is custom to your environment.

Шаг 1. Использование запросов KQL и ключевых слов для поиска дополнительных данных в средеStep 1 — Use KQL queries and key words to find additional data in your environment

Возможно, вам потребуется создать дополнительные запросы для поиска персональных данных, подпадающих под действие регламента GDPR. Для поиска данных в веб-части "Поиск контента" используется язык запросов Keyword Query Language (KQL). Точное обнаружение большинства конфиденциальных данных невозможно только с использованием языка KQL без применения типов конфиденциальной информации. Поэтому наша цель — проверить и оптимизировать строки KQL с помощью веб-части "Поиск контента", а затем использовать их для создания и настройки новых типов конфиденциальной информации, чтобы повысить точность данных.You might need to create additional queries to find personal data that is subject to GDPR. Content Search uses Keyword Query Language (KQL) to find data. Most sensitive data can’t be accurately detected using just KQL without sensitive information types. So the goal is to test and optimize KQL strings using Content Search and then use these to create and tune new sensitive information types where you can achieve even greater accuracy.

Для формулирования и оптимизации запросов с помощью KQL используйте эти ресурсы:Use these resources to formulate and optimize queries using KQL:

Поиск контента предоставляет еще один ресурс, который помогает создавать запросы KQL и типы конфиденциальной информации, — ключевые слова. Зачем использовать список ключевых слов? Вы можете получить статистические данные о том, сколько элементов соответствуют каждому ключевому слову. Это поможет быстро определить наиболее (и наименее) эффективные ключевые слова. Дополнительные сведения о статистике поиска см. в статье Просмотр статистики ключевых слов для результатов поиска контента.Content Search provides another resource to help you develop KQL queries and sensitive information types — keywords. Why use the keyword list? You can get statistics that show how many items match each keyword. This can help you quickly identify which keywords are the most (and least) effective. For more information about search statistics, see View keyword statistics for Content Search results.

Ключевые слова в каждой строке соединяются с помощью оператора OR в созданном поисковом запросе. В строке также можно использовать ключевую фразу (которая заключается в скобки).Keywords on each row are connected by the OR operator in the search query that's created. You can also use a keyword phrase (surrounded by parentheses) in a row.

Подробнее см. в статье Запросы ключевых слов и условия поиска контента.For more information, see Keyword queries and search conditions for Content Search.

Пример: использование веб-части "Поиск контента" для определения адресов электронной почтыExample—Using Content Search to identify email addresses

Адреса электронной почты считаются конфиденциальной информацией, связанной с субъектами данных. В этом простом примере показано, как использовать Поиск контента.Email addresses are considered sensitive information related to data subjects. This is a simple example to demonstrate how Content Search can help.

Запросы KQL и ключевые слова невозможно использовать одновременно. Применяйте эти средства по отдельности, чтобы уточнить запрос и определить ключевые слова, которые могут понадобиться в типах конфиденциальной информации.KQL and keywords can’t be used together. Use these tools separately to hone your query and determine keywords that might be useful in sensitive information types.

Запрос KQLKQL query

(^|\b)([a-zA-Z0-9_\-\.]+)@([a-zA-Z0-9_\-\.]+)\.([a-zA-Z]{2,5})($|\b)(^|\b)([a-zA-Z0-9_\-\.]+)@([a-zA-Z0-9_\-\.]+)\.([a-zA-Z]{2,5})($|\b)

Примечания.Notes:

  • Для поиска с учетом расположения можно использовать операторы NEAR и ONEAR.You can use NEAR and ONEAR for proximity searches.

  • К сожалению, язык KQL не поддерживают запросы с классом Regex (например, IdRef="Regex_адрес_электронной_почты")Unfortunately, KQL doesn’t support queries with the Regex Class (ex: IdRef="Regex_email_address")

Ключевые словаKeywords

Введите каждое ключевое слово в отдельной строке. Примеры ключевых слов:Enter each keyword on a separate line. Example keywords:

  • адрес электронной почты;email address

  • почта;mail

  • контакт;contact

  • отправитель;sender

  • получатель;recipient

  • копия;cc

  • СК.bcc

В этом примере вы можете узнать, что ключевые слова использовать необязательно, так как они приводят к большому количеству ложных срабатываний.In this example, you might learn the keywords are not necessary and produce a lot of false positive results.

Шаг 2. Создание пользовательского типа конфиденциальной информацииStep 2 — Create a new custom sensitive information type

После того, как вы используете запросы KQL и ключевые слова для определения конфиденциальной информации, создайте с их помощью пользовательские типы конфиденциальной информации. Во многих случаях вам потребуется усложнить типы конфиденциальной информации, чтобы обеспечить нужный уровень точности. Затем эти пользовательские типы конфиденциальной информации можно использовать в веб-части "Поиск контента", в политиках защиты от потери данных и других инструментах, а также в других запросах KQL.After using KQL queries and keywords to identify sensitive information, use these to create new custom sensitive information types. In many cases, you’ll require the sophistication of sensitive information types to achieve the right level of accuracy. You can then use these custom sensitive information types with Content Search, in DLP policies and other tools, and within other KQL queries.

Тип конфиденциальной информации рекомендуется создавать на основе имеющегося типа. Выполните действия, описанные выше в этой статье.The best practice is to create a new sensitive information type based on an existing one. Use the same process described earlier in this article.

Пример: создание типа конфиденциальной информации для адресов электронной почтыExample — Create a new sensitive information for email addresses

Мы продолжим использовать адрес электронной почты для примера ввиду его простоты. В таблице ниже описаны изменения, которые рекомендуется внести в новый тип конфиденциальной информации для электронной почты.We’ll continue with the email address as an example because it’s simple. The following table details the modifications recommended for a new email sensitive information type.

ШагStep ИзменениеModification Пример синтаксиса XMLExample XML syntax
11 Установка свойства IdRefSet the IdRef property

В элементе <Entity> измените элемент <IdMatch> таким образом, чтобы его свойство idRef равнялось уникальному значению. Это значение будет указывать на элемент, определяющий наше регулярное выражение для адресов электронной почты.Within the <Entity> element, modify the <IdMatch> element so that its idRef property is = to a unique value. This value will point to an element that defines our regular expression to find email addresses.

IdRef="Regex_email_address"IdRef="Regex_email_address"
22

Атрибут расстоянияProximity attribute

Мы начнем со значения patternProximity в элементе <Entity>, равного 300.We'll start with a patternProximity value in our <Entity> element of 300.

patternsProximity="300"patternsProximity="300"
33

Уровень вероятностиConfidence level

Установите для свойства recommendedConfidence значение, которое, по вашему мнению, соответствует вероятности нахождения точного совпадения. Скорее всего, для получения точного результата потребуется проверка с использованием репрезентативного набора данных. В качестве начального параметра задайте значение 75.Set the recommendedConfidence property to a value you feel will represent the confidence of finding an accurate match. This will likely require testing with a representative data set to get an accurate result. As an initial setting, set this value to 75.

recommendedConfidence="75">recommendedConfidence="75">

Полученный в результате код XML для первых трех элементов выглядит примерно так:The resulting XML for these first three elements combined looks like this:

<Entity id="42e6348e-27f0-4774-9604-d470cb3e219a" patternsProximity="300" recommendedConfidence="75"><Entity id="42e6348e-27f0-4774-9604-d470cb3e219a" patternsProximity="300" recommendedConfidence="75">

<Pattern confidenceLevel="75"><Pattern confidenceLevel="75">

<IdMatch idRef="Regex_email_address" /><IdMatch idRef="Regex_email_address" />

<Any minMatches="1"><Any minMatches="1">

<Match idRef="Keyword_email_terms" /><Match idRef="Keyword_email_terms" />

</Any></Any>

</Pattern></Pattern>

</Entity></Entity>

44

Элемент RegexRegex element

Сразу после элементов <Entity> добавьте новый элемент <Regex>, определяющий регулярное выражение, которое используется для определения адресов электронной почты.Add a new <Regex> element immediately be below the <Entity> elements that defines the regular expression used to identify email addresses.

<Regex id=&quot;Regexemail_address">(^|\b)([a-zA-Z0-9-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})($|\b)</Regex><Regex id=&quot;Regexemail_address">(^|\b)([a-zA-Z0-9-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})($|\b)</Regex>
55

Ключевые словаKeywords

После элемента <Regex> добавьте новый элемент <Keyword>, который определяет список ключевых слов, связанных с адресами электронной почты. Убедитесь, что значение идентификатора для элемента <Keyword> соответствует значению <Match idRef> в элементе <Entity><Pattern>. При необходимости вы можете добавить собственные ключевые слова.Add a new <Keyword> element below the <Regex> element that defines list of email address related keywords. Ensure that the id value for the <Keyword> element matches the <Match idRef> value in the <Entity><Pattern> element. You may continue to add your own keywords if needed.

Ключевые слова необязательно включать в тип конфиденциальной информации, связанный с электронной почтой. Эти ключевые слова приведены для примера.Keywords are likely not necessary to include in an email sensitive information type. These are provided as an example.

<Keyword id="Keyword_email_terms"><Keyword id="Keyword_email_terms">

<Group><Group>

<Term>электронная почта</Term><Term>email</Term>

<Term>адрес электронной почты</Term><Term>email address</Term>

<Term>контакт</Term><Term>contact</Term>

</Group></Group>

</Keyword></Keyword>

66

Элемент LocalizedStringsLocalizedStrings element

Убедитесь, что элемент <LocalizedStrings><Resource> включает уникальное имя, определяющее ваш тип конфиденциальной информации.In the <LocalizedStrings><Resource> element ensure that you have a unique name that identifies your sensitive information type.

<LocalizedStrings><LocalizedStrings>

<Resource idRef="42e6348e-27f0-4774-9604-d470cb3e219a"><Resource idRef="42e6348e-27f0-4774-9604-d470cb3e219a">

<Name default="true" langcode="ru-ru">Адрес электронной почты</Name><Name default="true" langcode="en-us">Email Address</Name>

<Description default="true" langcode="ru-ru">Обнаружение адресов электронной почты.</Description><Description default="true" langcode="en-us">Detects email addresses.</Description>

</Resource></Resource>

</LocalizedStrings></LocalizedStrings>

Создание типа конфиденциальной информации с примером XML-файла с помощью PowerShell — номер клиента ContosoCreate a new sensitive information type with example PowerShell and XML file — Contoso customer number

Организация Contoso использует номер клиента Contoso (CCN — Contoso Customer Number) для идентификации каждого клиента в базе данных. Вот из каких компонентов состоит номер CCN.Contoso uses a Contoso Customer Number (CCN) to identify each customer in their customer database. A CCN consists of the following taxonomy:

  • Две цифры представляют собой год создания записи. Организацию Contoso основали в 2002 году, поэтому самое раннее возможное значение составляет 02.Two digits to represent the year that the record was created. Contoso was founded in 2002; therefore, the earliest possible value would be 02.

  • Три цифры представляют собой партнерское агентство, создавшее запись. Возможные значения — от 000 до 999.Three digits to represent the partner agency that created the record. Possible agency values range from 000 to 999.

  • Символ "альфа" представляет собой сферу деятельности. Возможные значения: a–z без учета регистра.An alpha character to represent the line of business. Possible values are a-z and should be case insensitive.

  • Четырехзначный серийный номер. Возможные значения — от 0000 до 9999.A four-digit serial number. Possible serial number values range from 0000 to 9999.

Примеры номеров CCN:Example CCNs:

15080P9562;15080P9562

14040O1119;14040O1119

15020J8317;15020J8317

14050E2330;14050E2330

16050E2166;16050E2166

17040O1118.17040O1118

Организация Contoso всегда ссылается на клиентов, используя номер CCN во внутренних и внешних сообщениях, документах и т. д. Ей требуется создать тип конфиденциальной информации для обнаружения использования номеров CCN в Office 365, чтобы получить возможность применить защиту к использованию этой разновидности персональных данных.Contoso always refers to customers by using a CCN in internal correspondence, external correspondence, documents, etc. They would like to create a custom sensitive information type to detect the use of CCN in Office 365 so that they may apply protection to the use of this form of personal data.

Создание типа конфиденциальной информации для номера клиента ContosoCreate a new sensitive information type for Contoso customer number

ШагStep Действие Action РезультатResult
11 Contoso использует PowerShell и Поиск контента для поиска документов, которые соответствуют примеру набора номеров CCN.Contoso uses PowerShell and Content Search to find documents that match an example set of CCNs.

#Connect to Office 365 Security & Compliance Center#Connect to Office 365 Security & Compliance Center

$adminUser = &quot;alland@contoso.com"$adminUser = &quot;alland@contoso.com"

Connect-IPPSSession -UserPrincipalName $adminUserConnect-IPPSSession -UserPrincipalName $adminUser

#Create & start search for sample data#Create & start search for sample data

$searchName = "Sample Customer Information Search"$searchName = "Sample Customer Information Search"

$searchQuery = "15080P9562 OR 14040O1119 OR 15020J8317 OR 14050E2330 OR 16050E2166 OR 17040O1118"$searchQuery = "15080P9562 OR 14040O1119 OR 15020J8317 OR 14050E2330 OR 16050E2166 OR 17040O1118"

New-ComplianceSearch -Name $searchName -SharePointLocation All -ExchangeLocation All -ContentMatchQuery $searchQueryNew-ComplianceSearch -Name $searchName -SharePointLocation All -ExchangeLocation All -ContentMatchQuery $searchQuery

Start-ComplianceSearch -Identity $searchNameStart-ComplianceSearch -Identity $searchName

22 Организация Contoso анализирует результаты. При каждом применении номера CCN использовалась дата в формате, принятом в ЕС, а также одно из приведенных справа ключевых слов с параметром близости в 300 символов.Contoso analyzes the results. Every time the CCN was used, an EU formatted date was used and one of these keywords were also used within a proximity of 300 characters. номер клиента, н-р клиента, № клиента, №клиента, клиент Contosocustomer number, customer no, customer #, customer#, Contoso customer
33 Организация Contoso разработала приведенный справа шаблон регулярного выражения (RegEx) для определения своих номеров CCN.Contoso developed the following Regular Expression (RegEx) pattern to identify their CCN. [0-1][0-9][0-9]{3}[A-Za-z][0-9]{4}[0-1][0-9][0-9]{3}[A-Za-z][0-9]{4}
44 Организация Contoso разработала приведенный справа шаблон регулярного выражения (RegEx) для определения дат в форматах, которые приняты в ЕС и используются в ее различных дочерних подразделениях.Contoso developed the following Regular Expression (RegEx) pattern to identify EU dates in the formats used by their various subsidiaries. xml (0?[1-9]|[12][0-9]|3[0-1])[\/-](0?[1-9]|1[0-2]|j\x00e4n(uar)?|jan(uary|uari|uar|eiro|vier|v)?|ene(ro)?|genn(aio)?|‌ feb(ruary|ruari|rero|braio|ruar|br)?|f\x00e9vr(ier)?|fev(ereiro)?|mar(zo|o|ch|s)?|m\x00e4rz|maart|‌ apr(ile|il)?|abr(il)?|avril|may(o)?|magg(io)?|mai|mei|mai(o)?|jun(io|i|e|ho)?|giugno|juin|jul(y|io|i|ho)?|lu(glio)?|juil(let)?|ag(o|osto)?|aug(ustus|ust)?|ao\x00fbt|sep|sept(ember|iembre|embre)?|sett(embre)?|set(embro)?|‌ oct(ober|ubre|obre)?|ott(obre)?|okt(ober)?|out(ubro)?|nov(ember|iembre|embre|embro)?|dec(ember)?|‌ dic(iembre|embre)?|dez(ember|embro)?|d\x00e9c(embre)?)[ \/-](19|20)?[0-9]{2}
55 Организация Contoso создала три уникальных GUID с помощью PowerShell.Contoso uses PowerShell to generate three unique GUIDs.

#Generate a unique GUID for RulePack Id, Publisher Id, and Entity Id#Generate a unique GUID for RulePack Id, Publisher Id, and Entity Id

[guid]::NewGuid().Guid

[guid]::NewGuid().Guid

[guid]::NewGuid().Guid

66 Организация Contoso определяет приведенные справа параметры для соответствующего правила в отношении типа конфиденциальных данных.Contoso defines the following parameters for their sensitive item type rule.

Имя: номер клиента Contoso (CCN)Name: Contoso Customer Number (CCN)

Описание: номер клиента Contoso (CCN), который используется для поиска дополнительных ключевых слов и даты в формате, принятом в ЕСDescription: Contoso Customer Number (CCN) that looks for additional keywords and EU formatted date

77 Организация Contoso создает XML-файл для нового типа конфиденциальной информации с целью обнаружения номера клиента Contoso (CCN) и сохраняет его в локальной файловой системе как C:\Scripts\ContosoCCN.xml в кодировке UTF-8.Contoso creates an XML file for a new sensitive information type to detect a Contoso Customer Number (CCN) and saves this to a local file system as C:\Scripts\ContosoCCN.xml in with UTF-8 encoding. См. XML-файл под этой таблицей.See the XML file below this table.
88 Организация Contoso создает пользовательский тип конфиденциальной информации с помощью PowerShell, как показано справа.Contoso creates the custom sensitive information type with the following PowerShell.

#Connect to Office 365 Security & Compliance Center#Connect to Office 365 Security & Compliance Center

$adminUser = &quot;alland@contoso.com"$adminUser = &quot;alland@contoso.com"

Connect-IPPSSession -UserPrincipalName $adminUserConnect-IPPSSession -UserPrincipalName $adminUser

#Create new Sensitive Information Type#Create new Sensitive Information Type

New-DlpSensitiveInformationTypeRulePackage -FileData (Get-Content -Path "C:\Scripts\ContosoCCN.xml" -Encoding Byte -ReadCount 0)New-DlpSensitiveInformationTypeRulePackage -FileData (Get-Content -Path "C:\Scripts\ContosoCCN.xml" -Encoding Byte -ReadCount 0)

Пример XML-файла для нового типа конфиденциальной информации (шаг 7)Example XML file for the new sensitive information type (step 7)

\<?xml version="1.0" encoding="utf-8"?\>

\<RulePackage xmlns="http://schemas.microsoft.com/office/2011/mce"\>

\<RulePack id="130ae63b-a91e-4a12-9e02-a90e36a83d7f"\>

\<Version major="1" minor="0" build="0" revision="0" /\>

\<Publisher id="47148982-defd-42a1-890a-7b9472099f1f" /\>

\<Details defaultLangCode="en"\>

\<LocalizedDetails langcode="en"\>

\<PublisherName\>Contoso Ltd.\</PublisherName\>

\<Name\>Contoso Rule Package\</Name\>

\<Description\>Defines Contoso's custom set of classification rules\</Description\>

\</LocalizedDetails\>

\</Details\>

\</RulePack\>

\<Rules\>

\<!-- Contoso Customer Number (CCN) --\>

\<Entity id="a91f9a2e-6cfc-4622-8c5d-954875aa5b2b" patternsProximity="300" recommendedConfidence="85"\>

\<Pattern confidenceLevel="85"\>

\<IdMatch idRef="Regex\_contoso\_ccn" /\>

\<Match idRef="Keyword\_contoso\_ccn" /\>

\<Match idRef="Regex\_eu\_date" /\>

\</Pattern\>

\</Entity\>

\<Regex id="Regex\_contoso\_ccn"\>[0-1][0-9][0-9]{3}[A-Za-z][0-9]{4}\</Regex\>

\<Keyword id="Keyword\_contoso\_ccn"\>

\<Group matchStyle="word"\>

\<Term caseSensitive="false"\>customer number\</Term\>

\<Term caseSensitive="false"\>customer no\</Term\>

\<Term caseSensitive="false"\>customer \#\</Term\>

\<Term caseSensitive="false"\>customer\#\</Term\>

\<Term caseSensitive="false"\>Contoso customer\</Term\>

\</Group\>

\</Keyword\>

\<Regex id="Regex\_eu\_date"\> (0?[1-9]|[12][0-9]|3[0-1])[\\/-](0?[1-9]|1[0-2]|j\\x00e4n(uar)?|jan(uary|uari|uar|eiro|vier|v)?|ene(ro)?|genn(aio)?‌ |feb(ruary|ruari|rero|braio|ruar|br)?|f\\x00e9vr(ier)?|fev(ereiro)?|mar(zo|o|ch|s)?|m\\x00e4rz|maart‌|apr(ile|il)?|abr(il)?|avril‌ |may(o)?|magg(io)?|mai|mei|mai(o)?|jun(io|i|e|ho)?|giugno|juin|jul(y|io|i|ho)?|lu(glio)?|juil(let)?|ag(o|osto)?|aug(ustus|ust)?|ao\\x00fbt|sep|sept(ember|iembre|embre)?|sett(embre)?|set(embro)?|oct(ober|ubre|obre)?|ott(obre)?|okt(ober)?|out(ubro)?‌ |nov(ember|iembre|embre|embro)?|dec(ember)?|dic(iembre|embre)?|dez(ember|embro)?|d\\x00e9c(embre)?)[ \\/-](19|20)?[0-9]{2}\</Regex\>

\<LocalizedStrings\>

\<Resource idRef="a91f9a2e-6cfc-4622-8c5d-954875aa5b2b"\>

\<Name default="true" langcode="en-us"\>Contoso Customer Number (CCN)\</Name\>

\<Description default="true" langcode="en-us"\>Contoso Customer Number (CCN) that looks for additional keywords and EU formatted date\</Description\>

\</Resource\>

\</LocalizedStrings\>

\</Rules\>

\</RulePackage\>