Информация об обучаемых классификаторах

Классификация и маркировка содержимого, чтобы его можно было защитить и правильно обрабатывать, является отправной точкой для дисциплины защиты информации. Microsoft Purview предоставляет три способа классификации содержимого.

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Вручную

Для классификации вручную требуется человеческое суждение и действия. Пользователи и администраторы классифицируют содержимое по мере его возникновения. Можно использовать либо существующие метки и типы конфиденциальной информации, либо пользовательские созданные. Затем можно защитить содержимое и управлять его ликвидацией.

Автоматическое сопоставление шаблонов

Эти механизмы классификации включают поиск содержимого с помощью:

Затем можно автоматически применить метки конфиденциальности и хранения, чтобы сделать содержимое доступным для использования в статье Сведения о Защита от потери данных Microsoft Purview и автоматическое применение политик для меток хранения.

Классификаторы

Этот метод классификации хорошо подходит для содержимого, которое не легко определить с помощью ручных или автоматических методов сопоставления шаблонов. Этот метод классификации больше связан с использованием классификатора для идентификации элемента на основе элемента, а не по элементам, которые находятся в элементе (сопоставление шаблонов). Классификатор узнает, как определить тип содержимого, рассматривая сотни примеров содержимого, который вы хотите определить.

Примечание.

В предварительной версии — вы можете просмотреть обучаемые классификаторы в обозревателе содержимого, разверните раздел Обучаемые классификаторы на панели фильтров. Обучаемые классификаторы будут автоматически отображать количество инцидентов, обнаруженных в SharePoint, Teams и OneDrive, без применения каких-либо меток. Если вы не хотите использовать эту функцию, необходимо отправить запрос с помощью служба поддержки Майкрософт. Это приведет к отключению отображения конфиденциальных данных, которые не используются ни в каких политиках маркировки в Обозреватель содержимого. Вы также можете отключить сканирование данных. Если сканирование отключено, метки конфиденциальности и политики защиты от потери данных с этими классификаторами не будут работать.

Где можно использовать классификаторы

Классификаторы можно использовать в качестве условия для:

Важно!

Классификаторы работают только с элементами, которые не зашифрованы.

Типы классификаторов

  • предварительно обученные классификаторы . Корпорация Майкрософт создала и предварительно обучила несколько классификаторов, которые можно использовать без их обучения. Эти классификаторы будут отображаться с состоянием Ready to use.
  • пользовательские обучаемые классификаторы . Если у вас есть требования к идентификации и классификации содержимого, которые выходят за рамки предварительно обученных классификаторов, вы можете создавать и обучать собственные классификаторы.

Полный список всех предварительно обученных классификаторов см. в разделе Определения классификаторов с возможностью обучения.

Пользовательские классификаторы

Если предварительно обученные классификаторы не соответствуют вашим потребностям, вы можете создать и обучить собственные классификаторы. При создании собственных будет больше работы, но они будут гораздо лучше адаптированы к потребностям вашей организации.

Вы начинаете создание настраиваемого обучаемого классификатора с подачи ему примеров, которые определенно находятся в категории. После обработки этих примеров вы протестируете их, предоставив ему сочетание как соответствующих, так и несоединяющихся примеров. Затем классификатор делает прогнозы о том, попадает ли какой-либо элемент в категорию, которую вы создаете. Затем вы подтверждаете его результаты, отбирая истинные положительные, истинные отрицательные, ложноположительные и ложноотрицания, чтобы повысить точность прогнозов.

При публикации классификатора он сортирует элементы в таких расположениях, как SharePoint Online, Exchange и OneDrive, и классифицирует содержимое. После публикации классификатора можно продолжить обучение с помощью процесса обратной связи, аналогичного начальному процессу обучения.

Например, можно создать обучаемые классификаторы для:

  • Юридические документы, такие как адвокатская привилегия клиента, закрывающие наборы, выписка о работе
  • Стратегические бизнес-документы, такие как пресс-релизы, слияние и приобретение, сделки, бизнес- или маркетинговые планы, интеллектуальная собственность, патенты, документация по проектированию
  • Сведения о ценах, такие как счета, ценовые предложения, заказы на работу, документы для торгов
  • Финансовая информация, например организационные инвестиции, квартальные или годовые результаты

Процесс создания пользовательских классификаторов

Создание и публикация классификатора для использования в решениях соответствия требованиям, таких как политики хранения и контроль обмена данными, следует этому потоку. Дополнительные сведения о создании настраиваемого обучаемого классификатора см. в статье Создание пользовательского классификатора.

Пользовательский классификатор потока обработки.

Переобучение классификаторов

Вы можете повысить точность всех настраиваемых обучаемых классификаторов, предоставив им отзывы о точности выполняемой классификации. Это называется переобучением и следует за этим рабочим процессом.

Примечание.

Предварительно обученные классификаторы не могут быть переобучены.

Рабочий процесс переобучения классификатора.

Предоставление обратной связи о соответствии или не точности соответствия в обучаемых классификаторах

Количество совпадений для обучаемого классификатора можно просмотреть в обозревателе содержимого и обучаемых классификаторах. Вы также можете предоставить отзыв о том, является ли элемент на самом деле совпадением или нет, используя механизм обратной связи "Соответствие, а не соответствие" , и использовать этот отзыв для настройки классификаторов. Дополнительные сведения см. в статье Повышение точности классификатора .

См. также