Информация об обучаемых классификаторах

Классификация и маркировка содержимого, чтобы его можно было защитить и правильно обрабатывать, является отправной точкой для дисциплины защиты информации. Microsoft Purview имеет три способа классификации содержимого: вручную, с помощью автоматического сопоставления шаблонов и с помощью классификаторов.

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Вручную

Для классификации содержимого вручную требуется человеческое суждение и действия. Пользователи и администраторы классифицируют содержимое по мере его возникновения. Можно использовать либо существующие метки и типы конфиденциальной информации, либо те, которые вы создаете самостоятельно. Затем вы можете защитить содержимое и управлять его ликвидацией.

Автоматическое сопоставление шаблонов

Эти механизмы классификации включают поиск содержимого с помощью:

Затем метки конфиденциальности и хранения можно автоматически применить, чтобы сделать содержимое доступным для использования в статье Сведения о Защита от потери данных Microsoft Purview и политики автоматического применения меток хранения.

Классификаторы

Этот метод классификации хорошо подходит для содержимого, которое невозможно легко определить с помощью ручных или автоматических методов сопоставления шаблонов. Этот метод классификации предназначен для использования классификатора для идентификации элемента на основе элемента, а не по элементам, которые находятся в элементе (сопоставление шаблонов). Классификатор узнает, как определить тип содержимого, просмотрев сотни примеров содержимого, которое требуется обнаружить.

Примечание.

В предварительной версии: Обучаемые классификаторы можно просмотреть в обозревателе содержимого, разверните раздел Обучаемые классификаторы на панели фильтров. Обучаемые классификаторы будут автоматически отображать количество инцидентов, обнаруженных в SharePoint, Teams и OneDrive, без применения каких-либо меток. Если вы не хотите использовать эту функцию, необходимо отправить запрос с помощью служба поддержки Майкрософт. Это приведет к отключению отображения конфиденциальных данных, которые не используются ни в каких политиках маркировки в Обозреватель содержимого. Вы также можете отключить сканирование данных. Если сканирование отключено, метки конфиденциальности и политики защиты от потери данных с этими классификаторами не будут работать.

Где можно использовать классификаторы

Классификаторы можно использовать в качестве условия для следующих задач.

Важно!

Классификаторы работают только с элементами, которые не зашифрованы.

Типы классификаторов

  • Предварительно обученные классификаторы . Корпорация Майкрософт создала и предварительно обучила несколько классификаторов, которые можно начать использовать, не обучая их. Эти классификаторы отображаются с состоянием Ready to use.
  • Пользовательские обучаемые классификаторы . Если вам нужно определить и классифицировать содержимое за пределами предварительно обученных классификаторов, можно создать и обучить собственные классификаторы.

Полный список всех предварительно обученных классификаторов см. в статье Определения классификаторов с возможностью обучения.

Настраиваемые классификаторы

Важно!

Ограничение языка: Поддержка пользовательских классификаторов ограничена английским языком.

Если предварительно обученные классификаторы не соответствуют вашим потребностям, можно создать и обучить собственные классификаторы. При создании собственных необходимо больше работы, но они лучше подходят для вашей организации.

Чтобы создать настраиваемый обучаемый классификатор, начните с подачи ему одного набора примеров, которые определенно находятся в категории, и еще одного набора примеров, которые определенно не относятся. Microsoft Purview обрабатывает эти примеры, а затем классификатор делает прогнозы относительно того, попадает ли какой-либо элемент в категорию, которую вы создаете. Затем вы подтверждаете результаты, отсортируя истинные положительные, истинные отрицательные, ложноположительные и ложноотрицания, чтобы повысить точность прогнозов.

При публикации классификатора он сортирует элементы в таких расположениях, как SharePoint, Exchange и OneDrive, и классифицирует содержимое.

Например, вы можете создать обучаемые классификаторы для следующих категорий.

  • Юридические документы, такие как адвокатская привилегия клиента, закрывающие наборы, выписка о работе
  • Стратегические бизнес-документы, такие как пресс-релизы, слияние и приобретение, сделки, бизнес- или маркетинговые планы, интеллектуальная собственность, патенты, документация по проектированию
  • Сведения о ценах, такие как счета, ценовые предложения, заказы на работу, документы для торгов
  • Финансовая информация, например организационные инвестиции, квартальные или годовые результаты

Процесс создания пользовательских классификаторов

На следующей схеме показан процесс создания и публикации классификатора для использования в решениях соответствия требованиям, таких как политики хранения и контроль обмена данными. Дополнительные сведения о создании настраиваемого обучаемого классификатора см. в статье Начало работы с обучаемыми классификаторами.

Схема рабочего процесса для создания настраиваемого обучаемого классификатора.

Совет

Если вы создаете новый сайт и папку SharePoint для начальных данных, предоставьте по крайней мере час индексации этого расположения перед созданием обучаемого классификатора, который будет использовать эти начальные данные.

Переобучение классификаторов

Переобучение опубликованных пользовательских классификаторов больше не поддерживается. Если вам нужно повысить точность опубликованного обучаемого классификатора, удалите классификатор и начните с более крупных наборов выборок.

Чтобы повысить точность неопубликованного классификатора, просмотрите результаты теста, обновите набор данных дополнительными данными и перезапустите обучение.

См. также