En savoir plus sur les classifieurs avec capacité d’apprentissage
La catégorisation et l’étiquetage du contenu afin qu’il puisse être protégé et géré correctement est le point de départ de la discipline de protection des informations. Microsoft Purview propose trois façons de classifier le contenu.
Conseil
Si vous n’êtes pas un client E5, utilisez la version d’évaluation de 90 jours des solutions Microsoft Purview pour découvrir comment des fonctionnalités Supplémentaires purview peuvent aider vos organization à gérer les besoins en matière de sécurité et de conformité des données. Commencez dès maintenant au hub d’essais portail de conformité Microsoft Purview. En savoir plus sur les conditions d’inscription et d’essai.
Manuellement
La catégorisation manuelle nécessite un jugement et une action humains. Les utilisateurs et les administrateurs catégorisent le contenu au fur et à mesure qu’ils le rencontrent. Vous pouvez utiliser les étiquettes et les types d’informations sensibles préexistants, ou utiliser des étiquettes personnalisées créées. Vous pouvez ensuite protéger le contenu et gérer sa destruction.
Mise en correspondance automatique des modèles
Ces mécanismes de catégorisation incluent la recherche de contenu par :
- Mots clés ou valeurs de métadonnées (mot clé langage de requête).
- Utilisation de modèles précédemment identifiés d’informations sensibles comme la sécurité sociale, les carte de crédit ou les numéros de compte bancaire (définitions d’entité de type d’informations sensibles)
- Reconnaissance d’un élément, car il s’agit d’une variante sur un modèle (impression au doigt de document).
- Utilisation de la présence de chaînes exactes correspondant exactement aux données.
Les étiquettes de confidentialité et de rétention peuvent ensuite être appliquées automatiquement pour rendre le contenu disponible dans En savoir plus sur Protection contre la perte de données Microsoft Purview et appliquer automatiquement les stratégies pour les étiquettes de rétention.
Classificateurs
Cette méthode de catégorisation est bien adaptée au contenu qui n’est pas facilement identifié par les méthodes manuelles ou automatisées de correspondance de modèle. Cette méthode de catégorisation consiste davantage à utiliser un classifieur pour identifier un élément en fonction de ce qu’est l’élément, et non par des éléments qui se trouvent dans l’élément (critère de correspondance). Un classifieur apprend à identifier un type de contenu en examinant des centaines d’exemples de contenu que vous souhaitez identifier.
Remarque
En préversion : vous pouvez afficher les classifieurs pouvant être formés dans l’Explorateur de contenu en développant Classifieurs trainables dans le panneau filtres. Les classifieurs pouvant être entraînés affichent automatiquement le nombre d’incidents détectés dans SharePoint, Teams et OneDrive, sans nécessiter d’étiquetage. Si vous ne souhaitez pas utiliser cette fonctionnalité, vous devez envoyer une demande avec Support Microsoft. Cela désactive l’affichage de vos données sensibles qui ne sont utilisées dans aucune stratégie d’étiquetage dans Content Explorer. Vous pouvez également désactiver l’analyse de vos données. Si l’analyse est désactivée, l’étiquetage de confidentialité et les stratégies DLP avec ces classifieurs ne fonctionneront pas
Où vous pouvez utiliser des classifieurs
Les classifieurs peuvent être utilisés comme condition pour :
- Étiquetage automatique Office avec étiquettes de confidentialité
- Appliquer automatiquement la stratégie d’étiquette de rétention en fonction d’une condition
- Conformité des communications
- Les étiquettes de confidentialité peuvent utiliser des classifieurs comme conditions. Consultez Appliquer automatiquement une étiquette de confidentialité au contenu.
- Protection contre la perte de données
Importante
Les classifieurs fonctionnent uniquement avec les éléments qui ne sont pas chiffrés.
Types de classifieurs
- classifieurs préentraînés : Microsoft a créé et préentraîné plusieurs classifieurs que vous pouvez commencer à utiliser sans les entraîner. Ces classifieurs s’affichent avec la status de
Ready to use
. - classifieurs pouvant être entraînés personnalisés : si vous avez des besoins en matière d’identification et de catégorisation du contenu qui vont au-delà de ce que couvrent les classifieurs préentraînés, vous pouvez créer et entraîner vos propres classifieurs.
Pour obtenir la liste complète de tous les classifieurs préentraînés, consultez Définitions des classifieurs pouvant être entraînés.
Classifieurs personnalisés
Lorsque les classifieurs préentraînés ne répondent pas à vos besoins, vous pouvez créer et entraîner vos propres classifieurs. Il y a plus de travail à faire pour créer votre propre, mais ils seront beaucoup mieux adaptés aux besoins de votre organisation.
Vous commencez à créer un classifieur pouvant être entraîné personnalisé en lui fournissant des exemples qui sont certainement dans la catégorie. Une fois qu’il a traité ces exemples, vous le testez en lui donnant une combinaison d’exemples correspondants et non correspondants. Le classifieur effectue ensuite des prédictions pour déterminer si un élément donné appartient à la catégorie que vous créez. Vous confirmez ensuite ses résultats, en triant les vrais positifs, les vrais négatifs, les faux positifs et les faux négatifs pour aider à augmenter la précision de ses prédictions.
Lorsque vous publiez le classifieur, il trie les éléments dans des emplacements tels que SharePoint Online, Exchange et OneDrive, et classifie le contenu. Après avoir publié le classifieur, vous pouvez continuer à l’entraîner à l’aide d’un processus de commentaires similaire au processus d’entraînement initial.
Par exemple, vous pouvez créer des classifieurs pouvant être entraînés pour :
- Documents juridiques - tels que le privilège client de l’avocat, les jeux de clôture, l’énoncé de travail
- Documents commerciaux stratégiques - tels que les communiqués de presse, les fusions et acquisitions, les transactions, les plans d’affaires ou de marketing, la propriété intellectuelle, les brevets, la documentation de conception
- Informations de tarification - telles que les factures, les devis, les ordres de travail, les documents d’enchères
- Informations financières , telles que les investissements organisationnels, les résultats trimestriels ou annuels
Flux de processus pour la création de classifieurs personnalisés
La création et la publication d’un classifieur à utiliser dans des solutions de conformité, telles que les stratégies de rétention et la supervision des communications, suivent ce flux. Pour plus d’informations sur la création d’un classifieur pouvant être formé personnalisé, consultez Création d’un classifieur personnalisé.
Reformation des classifieurs
Vous pouvez aider à améliorer la précision de tous les classifieurs pouvant être entraînés personnalisés et en leur fournissant des commentaires sur la précision de la classification qu’ils effectuent. Il s’agit d’un réentraînement et suit ce flux de travail.
Remarque
Les classifieurs préentraînés ne peuvent pas être réentraînés.
Fournir un retour d’exactitude de correspondance/non dans les classifieurs pouvant être formés
Vous pouvez afficher le nombre de correspondances d’un classifieur pouvant être formé dans l’Explorateur de contenu et les classifieurs pouvant être formés. Vous pouvez également fournir des commentaires indiquant si un élément est réellement une correspondance ou non à l’aide du mécanisme de commentaires Match, Not a Match et utiliser ces commentaires pour paramétrer vos classifieurs. Pour plus d’informations, consultez Augmenter la précision du classifieur .
Voir aussi
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : pendant toute l’année 2024, nous allons éliminer progressivement Problèmes GitHub comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, voir :Soumettre et afficher des commentaires pour