En savoir plus sur les classifieurs avec capacité d’apprentissageLearn about trainable classifiers

La classification et l'étiquetage du contenu afin qu'il puisse être protégé et géré correctement constitue le point de départ de la protection des informations.Classifying and labeling content so it can be protected and handled properly is the starting place for the information protection discipline. Microsoft 365 trois façons de classer le contenu.Microsoft 365 has three ways to classify content.

ManuellementManually

Cette méthode nécessite un juge humain et une action.This method requires human judgment and action. Un administrateur peut utiliser les étiquettes pré-existantes et les types d'informations sensibles ou créer les leurs, puis les publier.An admin may either use the pre-existing labels and sensitive information types or create their own and then publish them. Les utilisateurs et les administrateurs les appliquent au contenu à mesure qu'ils le rencontrent.Users and admins apply them to content as they encounter it. Vous pouvez ensuite protéger le contenu et gérer sa disposition.You can then protect the content and manage its disposition.

Correspondance automatique des modèlesAutomated pattern matching

Cette catégorie de mécanismes de classification inclut la recherche de contenu par :This category of classification mechanisms include finding content by:

Les étiquettes de sensibilité et de rétention peuvent ensuite être appliquées automatiquement pour rendre le contenu disponible pour une utilisation dans En savoir plus sur la protection contre la perte de données )et appliquer automatiquement des stratégies pour les étiquettes de rétention.Sensitivity and retention labels can then be automatically applied to make the content available for use in Learn about data loss prevention) and auto-apply polices for retention labels.

ClassifieursClassifiers

Cette méthode de classification est particulièrement bien adaptée au contenu qui n'est pas facilement identifié par les méthodes manuelles ou automatisées de correspondance de modèle.This classification method is particularly well suited to content that isn't easily identified by either the manual or automated pattern matching methods. Cette méthode de classification consiste davantage à former un classifieur à identifier un élément en fonction de ce qu’il est, et non par les éléments qui se trouvent dans l’élément (critères spéciaux).This method of classification is more about training a classifier to identify an item based on what the item is, not by elements that are in the item (pattern matching). Un classifieur apprend à identifier un type de contenu en regardant des centaines d'exemples du contenu que vous souhaitez classer.A classifier learns how to identify a type of content by looking at hundreds of examples of the content you're interested in classifying. Commencez par lui donner des exemples qui sont certainement dans la catégorie.You start by feeding it examples that are definitely in the category. Une fois qu'il les traite, vous le testez en lui donnant un mélange d'exemples correspondants et non correspondants.Once it processes those, you test it by giving it a mix of both matching and non-matching examples. Le classifieur effectue ensuite des prédictions quant à l'entrée d'un élément donné dans la catégorie que vous construisez.The classifier then makes predictions as to whether any given item falls into the category you're building. Vous confirmez ensuite ses résultats, en triant les vrais positifs, les vrais négatifs, les faux positifs et les faux négatifs pour améliorer la précision de ses prédictions.You then confirm its results, sorting out the true positives, true negatives, false positives, and false negatives to help increase the accuracy of its predictions.

Lorsque vous publiez le classifieur, il trie les éléments dans des emplacements tels que SharePoint Online, Exchange et OneDrive, et classifie le contenu.When you publish the classifier, it sorts through items in locations like SharePoint Online, Exchange, and OneDrive, and classifies the content. Après avoir publié le classificateur, vous pouvez continuer à l'entraîner à l'aide d'un processus de commentaires semblable au processus de formation initial.After you publish the classifier, you can continue to train it using a feedback process that is similar to the initial training process.

Où utiliser des classifieurs entraisablesWhere you can use trainable classifiers

Les classifieursintégrés et les classifieurs entraçables sont disponibles en tant que condition pour l'étiquetage automatique d'Office avec des étiquettes de confidentialité, une stratégie d'étiquette de rétention à application automatique basée sur une condition et dans la conformité des communications.Both built-in classifiers and trainable classifiers are available as a condition for Office autolabeling with sensitivity labels, auto-apply retention label policy based on a condition and in communication compliance.

Les étiquettes de sensibilité peuvent utiliser des classifieurs comme conditions. Voir Appliquer automatiquement une étiquette de sensibilité au contenu.Sensitivity labels can use classifiers as conditions, see Apply a sensitivity label to content automatically.

Important

Les classifieurs fonctionnent uniquement avec les éléments qui ne sont pas chiffrés et qui sont en anglais.Classifiers only work with items that are not encrypted and are in English.

Types de classifieursTypes of classifiers

  • Classifieurs pré-formés : Microsoft a créé et pré-formé un certain nombre de classifieurs que vous pouvez commencer à utiliser sans les former.pre-trained classifiers - Microsoft has created and pre-trained a number of classifiers that you can start using without training them. Ces classifieurs apparaissent avec l'état Ready to use de .These classifiers will appear with the status of Ready to use.
  • classifieurs personnalisés : si vous avez des besoins de classification qui s'étendent au-delà de ce que couvrent les classifieurs pré-formés, vous pouvez créer et former vos propres classifieurs.custom classifiers - If you have classification needs that extend beyond what the pre-trained classifiers cover, you can create and train your own classifiers.

Classifieurs pré-formésPre-trained classifiers

Microsoft 365 est livré avec cinq classifieurs pré-formés :Microsoft 365 comes with five pre-trained classifiers:

Attention

Nous déprécions le classificateur de langage choquant pré-entraîné, car il a produit un grand nombre de faux positifs.We are deprecating the Offensive Language pre-trained classifier because it has been producing a high number of false positives. Ne l'utilisez pas et si vous l'utilisez actuellement, vous devez en déplacer vos processus d'entreprise.Don't use it and if you are currently using it, you should move your business processes off of it. Nous vous recommandons plutôt d'utiliser les classifieurs pré-formés contre les menaces, les blasphémités et le harcèlement. We recommend using the Threat, Profanity, and Harassment pre-trained classifiers instead.

  • Cv : détecte les éléments qui sont des comptes textuels de qualifications personnelles, pédagogiques, professionnelles, professionnelles et autres informations d'identification personnelle d'un candidatResumes: detects items that are textual accounts of an applicant's personal, educational, professional qualifications, work experience, and other personally identifying information
  • Code source: détecte les éléments qui contiennent un ensemble d'instructions et d'instructions écrites dans les 25 langages de programmation informatique les plus utilisés sur GitHubSource Code: detects items that contain a set of instructions and statements written in the top 25 used computer programming languages on GitHub
    • ActionScriptActionScript
    • CC
    • C #C#
    • C++C++
    • ÉryjureClojure
    • CoffeeScriptCoffeeScript
    • ActiverGo
    • HaskellHaskell
    • JavaJava
    • JavaScriptJavaScript
    • LuaLua
    • MATLABMATLAB
    • Objective-CObjective-C
    • PerlPerl
    • PHPPHP
    • PythonPython
    • RR
    • RubyRuby
    • ScalaScala
    • ShellShell
    • SwiftSwift
    • TexTex
    • Vim ScriptVim Script

Notes

Le code source est formé pour détecter quand l'essentiel du texte est du code source.Source Code is trained to detect when the bulk of the text is source code. Il ne détecte pas le texte de code source qui est entrecoupé de texte simple.It does not detect source code text that is interspersed with plain text.

  • Harcèlement: détecte une catégorie spécifique d'éléments de texte de langage choquant liés à une conduite choquante ciblant un ou plusieurs individus en fonction des caractéristiques suivantes : course, ancienneté, genre, origine nationale, sexe, orientation sexuelle, âge, handicap/invaliditéHarassment: detects a specific category of offensive language text items related to offensive conduct targeting one or multiple individuals based on the following traits: race, ethnicity, religion, national origin, gender, sexual orientation, age, disability
  • Blasphémité: détecte une catégorie spécifique d'éléments de texte de langage choquant qui contiennent des expressions qui gênent la plupart des personnesProfanity: detects a specific category of offensive language text items that contain expressions that embarrass most people
  • Menace: détecte une catégorie spécifique d'éléments de texte de langage choquant liés aux menaces de violence ou d'atteinte physique ou de dommages à une personne ou à une propriétéThreat: detects a specific category of offensive language text items related to threats to commit violence or do physical harm or damage to a person or property

Ceux-ci apparaissent dans l Microsoft 365 de classification des données du centre de conformité avec l'état de > > Ready to use .These appear in the Microsoft 365 compliance center > Data classification > Trainable classifiers view with the status of Ready to use.

classifieurs-pré-formés-classifieurs

Important

Veuillez noter que le langage choquant, le harcèlement, la blasphémité et les classifieurs de menaces fonctionnent uniquement avec du texte utilisable dans une recherche et ne sont pas exhaustifs ou complets.Please note that the offensive language, harassment, profanity, and threat classifiers only work with searchable text are not exhaustive or complete. En outre, les normes linguistiques et culturelles changent continuellement et, à la lumière de ces exigences, Microsoft se réserve le droit de mettre à jour ces classifieurs à sa discrétion.Further, language and cultural standards continually change, and in light of these realities, Microsoft reserves the right to update these classifiers in its discretion. Bien que les classifieurs peuvent aider votre organisation à surveiller les langages choquants et autres utilisés, ils ne répondent pas aux conséquences de ce langage et ne sont pas destinés à fournir l'unique moyen de surveillance ou de réponse de votre organisation à l'utilisation de ce langage.While the classifiers may assist your organization in monitoring offensive and other language used, the classifiers do not address consequences of such language and are not intended to provide your organization's sole means of monitoring or responding to the use of such language. Votre organisation, et non Microsoft ou ses filiales, reste responsable de toutes les décisions relatives à la surveillance, à l'application, au blocage, à la suppression et à la rétention de tout contenu identifié par un classificateur pré-formé.Your organization, and not Microsoft or its subsidiaries, remains responsible for all decisions related to monitoring, enforcement, blocking, removal and retention of any content identified by a pre-trained classifier.

Classifieurs personnalisésCustom classifiers

Lorsque les classifieurs pré-formés ne répondent pas à vos besoins, vous pouvez créer et former vos propres classifieurs.When the pre-trained classifiers don't meet your needs, you can create and train your own classifiers. Il y a beaucoup plus de travail à faire avec la création de vos propres produits, mais ils seront bien mieux adaptés aux besoins de votre organisation.There's significantly more work involved with creating your own, but they'll be much better tailored to your organizations needs.

Par exemple, vous pouvez créer des classifieurs entraisables pour :For example you could create trainable classifiers for:

  • Documents juridiques : par exemple, privilège client avocat, jeux de fermeture, déclaration de travailLegal documents - such as attorney client privilege, closing sets, statement of work
  • Documents d'entreprise stratégiques : communiqués de presse, fusion et acquisition, transactions, plans commerciaux ou commerciaux, propriété intellectuelle, brevets, documents de conceptionStrategic business documents - like press releases, merger and acquisition, deals, business or marketing plans, intellectual property, patents, design docs
  • Informations tarifaires : par exemple, factures, devis, commandes de travail, documents d'auteurPricing information - like invoices, price quotes, work orders, bidding documents
  • Informations financières , telles que les investissements organisationnels, les résultats trimestrielles ou annuelsFinancial information - such as organizational investments, quarterly or annual results

Flux de processus pour la création de classifieurs personnalisésProcess flow for creating custom classifiers

La création et la publication d'un classifieur à utiliser dans les solutions de conformité, telles que les stratégies de rétention et la surveillance des communications, suivent ce flux.Creating and publishing a classifier for use in compliance solutions, such as retention policies and communication supervision, follows this flow. Pour plus d'informations sur la création d'un classifieur entraisable personnalisé, voir Création d'un classificateur personnalisé.For more detail on creating a custom trainable classifier see, Creating a custom classifier.

classifieur personnalisé de flux de processus

Retraining classifiersRetraining classifiers

Vous pouvez améliorer la précision de tous les classifieurs personnalisés et de certains classifieurs pré-formés en leur fournissant des commentaires sur la précision de la classification qu'ils effectuent.You can help improve the accuracy of all custom classifiers and some pre-trained classifiers by providing them with feedback on the accuracy of the classification that they perform. C'est ce qu'on appelle une nouvelle formation et suivre ce flux de travail.This is called retraining and follow this workflow.

flux de travail de formation du classificateur

Voir aussiSee also