En savoir plus sur les classifieurs avec capacité d’apprentissage

Article
02/21/2024

La catégorisation et l’étiquetage du contenu afin qu’il puisse être protégé et géré correctement est le point de départ de la discipline de protection des informations. Microsoft Purview propose trois façons de classifier le contenu.

Conseil

Si vous n’êtes pas un client E5, utilisez la version d’évaluation de 90 jours des solutions Microsoft Purview pour découvrir comment des fonctionnalités Supplémentaires purview peuvent aider vos organization à gérer les besoins en matière de sécurité et de conformité des données. Commencez dès maintenant au hub d’essais portail de conformité Microsoft Purview. En savoir plus sur les conditions d’inscription et d’essai.

Manuellement

La catégorisation manuelle nécessite un jugement et une action humains. Les utilisateurs et les administrateurs catégorisent le contenu au fur et à mesure qu’ils le rencontrent. Vous pouvez utiliser les étiquettes et les types d’informations sensibles préexistants, ou utiliser des étiquettes personnalisées créées. Vous pouvez ensuite protéger le contenu et gérer sa destruction.

Mise en correspondance automatique des modèles

Ces mécanismes de catégorisation incluent la recherche de contenu par :

Mots clés ou valeurs de métadonnées (mot clé langage de requête).
Utilisation de modèles précédemment identifiés d’informations sensibles comme la sécurité sociale, les carte de crédit ou les numéros de compte bancaire (définitions d’entité de type d’informations sensibles)
Reconnaissance d’un élément, car il s’agit d’une variante sur un modèle (impression au doigt de document).
Utilisation de la présence de chaînes exactes correspondant exactement aux données.

Les étiquettes de confidentialité et de rétention peuvent ensuite être appliquées automatiquement pour rendre le contenu disponible dans En savoir plus sur Protection contre la perte de données Microsoft Purview et appliquer automatiquement les stratégies pour les étiquettes de rétention.

Classificateurs

Cette méthode de catégorisation est bien adaptée au contenu qui n’est pas facilement identifié par les méthodes manuelles ou automatisées de correspondance de modèle. Cette méthode de catégorisation consiste davantage à utiliser un classifieur pour identifier un élément en fonction de ce qu’est l’élément, et non par des éléments qui se trouvent dans l’élément (critère de correspondance). Un classifieur apprend à identifier un type de contenu en examinant des centaines d’exemples de contenu que vous souhaitez identifier.

Remarque

En préversion : vous pouvez afficher les classifieurs pouvant être formés dans l’Explorateur de contenu en développant Classifieurs trainables dans le panneau filtres. Les classifieurs pouvant être entraînés affichent automatiquement le nombre d’incidents détectés dans SharePoint, Teams et OneDrive, sans nécessiter d’étiquetage. Si vous ne souhaitez pas utiliser cette fonctionnalité, vous devez envoyer une demande avec Support Microsoft. Cela désactive l’affichage de vos données sensibles qui ne sont utilisées dans aucune stratégie d’étiquetage dans Content Explorer. Vous pouvez également désactiver l’analyse de vos données. Si l’analyse est désactivée, l’étiquetage de confidentialité et les stratégies DLP avec ces classifieurs ne fonctionneront pas

Où vous pouvez utiliser des classifieurs

Les classifieurs peuvent être utilisés comme condition pour :

Étiquetage automatique Office avec étiquettes de confidentialité
Appliquer automatiquement la stratégie d’étiquette de rétention en fonction d’une condition
Conformité des communications
Les étiquettes de confidentialité peuvent utiliser des classifieurs comme conditions. Consultez Appliquer automatiquement une étiquette de confidentialité au contenu.
Protection contre la perte de données

Importante

Les classifieurs fonctionnent uniquement avec les éléments qui ne sont pas chiffrés.

Types de classifieurs

classifieurs préentraînés : Microsoft a créé et préentraîné plusieurs classifieurs que vous pouvez commencer à utiliser sans les entraîner. Ces classifieurs s’affichent avec la status de Ready to use.
classifieurs pouvant être entraînés personnalisés : si vous avez des besoins en matière d’identification et de catégorisation du contenu qui vont au-delà de ce que couvrent les classifieurs préentraînés, vous pouvez créer et entraîner vos propres classifieurs.

Pour obtenir la liste complète de tous les classifieurs préentraînés, consultez Définitions des classifieurs pouvant être entraînés.

Classifieurs personnalisés

Lorsque les classifieurs préentraînés ne répondent pas à vos besoins, vous pouvez créer et entraîner vos propres classifieurs. Il y a plus de travail à faire pour créer votre propre, mais ils seront beaucoup mieux adaptés aux besoins de votre organisation.

Vous commencez à créer un classifieur pouvant être entraîné personnalisé en lui fournissant des exemples qui sont certainement dans la catégorie. Une fois qu’il a traité ces exemples, vous le testez en lui donnant une combinaison d’exemples correspondants et non correspondants. Le classifieur effectue ensuite des prédictions pour déterminer si un élément donné appartient à la catégorie que vous créez. Vous confirmez ensuite ses résultats, en triant les vrais positifs, les vrais négatifs, les faux positifs et les faux négatifs pour aider à augmenter la précision de ses prédictions.

Lorsque vous publiez le classifieur, il trie les éléments dans des emplacements tels que SharePoint Online, Exchange et OneDrive, et classifie le contenu. Après avoir publié le classifieur, vous pouvez continuer à l’entraîner à l’aide d’un processus de commentaires similaire au processus d’entraînement initial.

Par exemple, vous pouvez créer des classifieurs pouvant être entraînés pour :

Documents juridiques - tels que le privilège client de l’avocat, les jeux de clôture, l’énoncé de travail
Documents commerciaux stratégiques - tels que les communiqués de presse, les fusions et acquisitions, les transactions, les plans d’affaires ou de marketing, la propriété intellectuelle, les brevets, la documentation de conception
Informations de tarification - telles que les factures, les devis, les ordres de travail, les documents d’enchères
Informations financières , telles que les investissements organisationnels, les résultats trimestriels ou annuels

Flux de processus pour la création de classifieurs personnalisés

La création et la publication d’un classifieur à utiliser dans des solutions de conformité, telles que les stratégies de rétention et la supervision des communications, suivent ce flux. Pour plus d’informations sur la création d’un classifieur pouvant être formé personnalisé, consultez Création d’un classifieur personnalisé.

classifieur personnalisé de flux de processus.

Reformation des classifieurs

Vous pouvez aider à améliorer la précision de tous les classifieurs pouvant être entraînés personnalisés et en leur fournissant des commentaires sur la précision de la classification qu’ils effectuent. Il s’agit d’un réentraînement et suit ce flux de travail.

Remarque

Les classifieurs préentraînés ne peuvent pas être réentraînés.

workflow de réentraînement du classifieur.

Fournir un retour d’exactitude de correspondance/non dans les classifieurs pouvant être formés

Vous pouvez afficher le nombre de correspondances d’un classifieur pouvant être formé dans l’Explorateur de contenu et les classifieurs pouvant être formés. Vous pouvez également fournir des commentaires indiquant si un élément est réellement une correspondance ou non à l’aide du mécanisme de commentaires Match, Not a Match et utiliser ces commentaires pour paramétrer vos classifieurs. Pour plus d’informations, consultez Augmenter la précision du classifieur .