Prise en main des classifieurs avec capacité d’apprentissageGet started with trainable classifiers

Un Microsoft 365 classifieur entraisable est un outil que vous pouvez former pour reconnaître différents types de contenu en lui donnant des exemples à examiner.A Microsoft 365 trainable classifier is a tool you can train to recognize various types of content by giving it samples to look at. Une fois formé, vous pouvez l’utiliser pour identifier l’élément à appliquer Office étiquettes de confidentialité, stratégies de conformité des communications et stratégies d’étiquette de rétention.Once trained, you can use it to identify item for application of Office sensitivity labels, Communications compliance policies, and retention label policies.

La création d’un classifieur entraisable personnalisé implique d’abord de lui donner des exemples qui sont choisis par l’homme et qui correspondent à la catégorie.Creating a custom trainable classifier first involves giving it samples that are human picked and positively match the category. Ensuite, après les avoir traitées, vous testez la capacité des classifieurs à prévoir en lui donnant un mélange d’échantillons positifs et négatifs.Then, after it has processed those, you test the classifiers ability to predict by giving it a mix of positive and negative samples. Cet article vous montre comment créer et former un classifieur personnalisé et comment améliorer les performances des classifieurs entraînables personnalisés et des classifieurs pré-formés tout au long de leur durée de vie via une nouvelle formation.This article shows you how to create and train a custom classifier and how to improve the performance of custom trainable classifiers and pre-trained classifiers over their lifetime through retraining.

Pour en savoir plus sur les différents types de classifieurs, voir En savoir plus sur les classifieurs entraisables.To learn more about the different types of classifiers, see Learn about trainable classifiers.

Regardez cette vidéo pour obtenir un résumé rapide de la création d’un classifieur entraisable.Watch this video for a quick summary of creating a trainable classifier. Vous devrez tout de même lire cet article complet pour obtenir les détails.You'll still need to read this full article to get the details.


Configuration requisePrerequisites

Conditions d'octroi de licenceLicensing requirements

Les classifieurs sont une fonctionnalité Microsoft 365 E5 conformité E5.Classifiers are a Microsoft 365 E5, or E5 Compliance feature. Vous devez avoir l’un de ces abonnements pour pouvoir les utiliser.You must have one of these subscriptions to make use of them.

AutorisationsPermissions

Pour accéder aux classifieurs dans l’interface utilisateur :To access classifiers in the UI:

  • L’administrateur global doit choisir le client pour créer des classifieurs personnalisés.the Global admin needs to opt in for the tenant to create custom classifiers.
  • Le rôle Administrateur de conformité est requis pour former un classifieur.Compliance Administrator role is required to train a classifier.

Vous aurez besoin de comptes avec ces autorisations pour utiliser des classifieurs dans les scénarios suivants :You'll need accounts with these permissions to use classifiers in these scenarios:

  • Scénario de stratégie d’étiquette de rétention : rôles gestion des enregistrement et gestion de la rétentionRetention label policy scenario: Record Management and Retention Management roles
  • Scénario de stratégie d’étiquette de confidentialité : administrateur de sécurité, administrateur de conformité, administrateur de données de conformitéSensitivity label policy scenario: Security Administrator, Compliance Administrator, Compliance Data Administrator
  • Scénario de stratégie de conformité des communications : administrateur de la gestion des risques internes, administrateur de vérification de surveillanceCommunication compliance policy scenario: Insider Risk Management Admin, Supervisory Review Administrator

Important

Par défaut, seul l’utilisateur qui crée un classifieur personnalisé peut entraîner et passer en revue les prédictions faites par ce classificateur.By default, only the user who creates a custom classifier can train and review predictions made by that classifier.

Préparer un classifieur entraisable personnaliséPrepare for a custom trainable classifier

Il est utile de comprendre ce qui est impliqué dans la création d’un classifieur entraisable personnalisé avant de vous plonger.It's helpful to understand what's involved in creating a custom trainable classifier before you dive in.

ChronologieTimeline

Cette chronologie reflète un exemple de déploiement de classifieurs entraisables.This timeline reflects a sample deployment of trainable classifiers.

trainable-classifier-timeline

Conseil

L’option d’opt-in est requise la première fois pour les classifieurs entraisables.Opt-in is required the first time for trainable classifiers. Douze jours s’Microsoft 365 pour effectuer une évaluation de référence du contenu de votre organisation.It takes twelve days for Microsoft 365 to complete a baseline evaluation of your organizations content. Contactez votre administrateur général pour lancer le processus d’opt-in.Contact your global administrator to kick off the opt-in process.

Flux de travail globalOverall workflow

Pour en savoir plus sur le flux de travail global de création de classifieurs entra nessables personnalisés, voir Flux de processus pour la création de classifieurs entra mentables par le client.To understand more about the overall workflow of creating custom trainable classifiers, see Process flow for creating customer trainable classifiers.

Contenu d’amorçageSeed content

Lorsque vous souhaitez qu’un classificateur entraisable identifie de manière indépendante et précise un élément comme étant dans une catégorie particulière de contenu, vous devez d’abord le présenter avec de nombreux exemples du type de contenu qui se trouverait dans la catégorie.When you want a trainable classifier to independently and accurately identify an item as being in particular category of content, you first have to present it with many samples of the type of content that are in the category. Cet amorçage d’échantillons au classifieur entraçable est appelé amorçage.This feeding of samples to the trainable classifier is known as seeding. Le contenu de amorçage est sélectionné par un humain et est jugé pour représenter la catégorie de contenu.Seed content is selected by a human and is judged to represent the category of content.

Conseil

Vous devez avoir au moins 50 échantillons positifs et jusqu’à 500.You need to have at least 50 positive samples and as many as 500. Le classificateur entraçable traitera jusqu’aux 500 exemples créés les plus récents (par horodateur de date/heure de création de fichier).The trainable classifier will process up to the 500 most recent created samples (by file created date/time stamp). Plus vous fournissez d’exemples, plus les prédictions du classifieur seront précises.The more samples you provide, the more accurate the predictions the classifier will make.

Test du contenuTesting content

Une fois que le classifieur entraisable a traitée suffisamment d’échantillons positifs pour créer un modèle de prédiction, vous devez tester les prédictions qu’il effectue pour voir si le classifieur peut correctement faire la distinction entre les éléments qui correspondent à la catégorie et les éléments qui ne le sont pas.Once the trainable classifier has processed enough positive samples to build a prediction model, you need to test the predictions it makes to see if the classifier can correctly distinguish between items that match the category and items that don't. Pour ce faire, vous sélectionnez un autre ensemble de contenu sélectionné par l’être humain, avec un plus grand nombre d’échantillons qui doivent être placés dans la catégorie et des exemples qui ne le seront pas.You do this by selecting another, hopefully larger, set of human picked content that consists of samples that should fall into the category and samples that won't. Vous devez tester avec des données différentes des données initiales initiales que vous avez fournies.You should test with different data than the initial seed data you first provided. Une fois qu’il les traite, vous allez manuellement à travers les résultats et vérifiez si chaque prédiction est correcte, incorrecte ou vous n’êtes pas sûr.Once it processes those, you manually go through the results and verify whether each prediction is correct, incorrect, or you aren't sure. Le classifieur entraisable utilise ce retour d’expérience pour améliorer son modèle de prédiction.The trainable classifier uses this feedback to improve its prediction model.

Conseil

Pour obtenir de meilleurs résultats, vous devez avoir au moins 200 éléments dans votre exemple de test avec une distribution équitable de correspondances positives et négatives.For best results, have at least 200 items in your test sample set with an even distribution of positive and negative matches.

Comment créer un classifieur entraisableHow to create a trainable classifier

  1. Collectez entre 50 et 500 éléments de contenu d’amorçage.Collect between 50-500 seed content items. Il doit s’agit uniquement d’exemples qui représentent fortement le type de contenu que le classifieur entraçable doit identifier comme étant dans la catégorie de classification.These must be only samples that strongly represent the type of content you want the trainable classifier to positively identify as being in the classification category. Reportez-vous aux extensions de nom de fichier et aux types de fichiers analyse par défaut dans SharePoint Server pour les types de fichiers pris en charge.See, Default crawled file name extensions and parsed file types in SharePoint Server for the supported file types.

    Important

    Les exemples d’amorçage et de test ne doivent pas être chiffrés et doivent être en anglais.The seed and test sample items must not be encrypted and they must be in English.

    Important

    Assurez-vous que les éléments de votre ensemble de valeurs de amorçage sont de forts exemples de la catégorie.Make sure the items in your seed set are strong examples of the category. Le classifieur entraçable crée initialement son modèle en fonction de ce avec quoi vous l’amorçez.The trainable classifier initially builds its model based on what you seed it with. Le classificateur suppose que tous les échantillons de amorçage sont des positifs forts et n’a aucun moyen de savoir si un échantillon est une correspondance faible ou négative avec la catégorie.The classifier assumes all seed samples are strong positives and has no way of knowing if a sample is a weak or negative match to the category.

  2. Placez le contenu d’amorçage dans un SharePoint Online dédié à la mise en place du contenu d’amorçage uniquement.Place the seed content in a SharePoint Online folder that is dedicated to holding the seed content only. Notez l’URL du site, de la bibliothèque et du dossier.Make note of the site, library, and folder URL.

    Conseil

    Si vous créez un site et un dossier pour vos données d’amorçage, autorisez l’indexation d’au moins une heure de cet emplacement avant de créer le classifieur entraisable qui utilisera ces données d’amorçage.If you create a new site and folder for your seed data, allow at least an hour for that location to be indexed before creating the trainable classifier that will use that seed data.

  3. Connectez-vous au centre Microsoft 365 conformité avec l’accès au rôle d’administrateur de conformité ou d’administrateur de sécurité et ouvrez Microsoft 365 centre de conformité ou Microsoft 365 classification des données du centre > de sécurité.Sign in to Microsoft 365 compliance center with compliance admin or security admin role access and open Microsoft 365 compliance center or Microsoft 365 security center > Data classification.

  4. Sélectionnez l’onglet Classifieurs avec formation.Choose the Trainable classifiers tab.

  5. Choose Create trainable classifier.Choose Create trainable classifier.

  6. Remplissez les valeurs appropriées pour les champs de la catégorie d’éléments que ce Name Description classifieur entraçable doit identifier.Fill in appropriate values for the Name and Description fields of the category of items you want this trainable classifier to identify.

  7. Choisissez l’URL SharePoint site, bibliothèque et dossier en ligne pour le site de contenu d’amorçage à l’étape 2.Pick the SharePoint Online site, library, and folder URL for the seed content site from step 2. Choose Add .Choose Add.

  8. Examinez les paramètres et choisissez Create trainable classifier .Review the settings and choose Create trainable classifier.

  9. Dans un délai de 24 heures, le classifieur entraçable traitera les données d’amorçage et créera un modèle de prédiction.Within 24 hours the trainable classifier will process the seed data and build a prediction model. L’état du classificateur est In progress pendant qu’il traite les données d’amorçage.The classifier status is In progress while it processes the seed data. Lorsque le classificateur a terminé le traitement des données de amorçage, l’état change en Need test items .When the classifier is finished processing the seed data, the status changes to Need test items.

  10. Vous pouvez désormais afficher la page de détails en choisissant le classificateur.You can now view the details page by choosing the classifier.

    Classifieur entraisable prêt pour le testtrainable classifier ready for testing

  11. Collectez au moins 200 éléments de contenu de test (10 000 max) pour obtenir de meilleurs résultats.Collect at least 200 test content items (10,000 max) for best results. Il doit s’agit d’un mélange d’éléments qui sont de forts positifs, de négatifs forts et d’autres qui sont un peu moins évidents dans leur nature.These should be a mix of items that are strong positives, strong negatives and some that are a little less obvious in their nature. Reportez-vous aux extensions de nom de fichier et aux types de fichiers analyse par défaut dans SharePoint Server pour les types de fichiers pris en charge.See, Default crawled file name extensions and parsed file types in SharePoint Server for the supported file types.

    Important

    Les exemples d’éléments ne doivent pas être chiffrés et doivent être en anglais.The sample items must not be encrypted and they must be in English.

  12. Placez le contenu de test dans un dossier SharePoint Online dédié à la mise en place du contenu de test uniquement.Place the test content in a SharePoint Online folder that is dedicated to holding the test content only. Notez l’URL SharePoint site, bibliothèque et dossier en ligne.Make note of the SharePoint Online site, library, and folder URL.

    Conseil

    Si vous créez un site et un dossier pour vos données de test, autorisez l’indexation d’au moins une heure de cet emplacement avant de créer le classifieur entraisable qui utilisera ces données d’amorçage.If you create a new site and folder for your test data, allow at least an hour for that location to be indexed before creating the trainable classifier that will use that seed data.

  13. Choose Add items to test .Choose Add items to test.

  14. Choisissez l’URL SharePoint site, bibliothèque et dossier en ligne pour le site de contenu de test à l’étape 12.Pick the SharePoint Online site, library, and folder URL for the test content site from step 12. Choose Add .Choose Add.

  15. Terminez l’Assistant en choisissant Done .Finish the wizard by choosing Done. Le traitement des fichiers de test peut prendre jusqu’à une heure.Your trainable classifier will take up to an hour to process the test files.

  16. Lorsque le classifieur entra ne peut pas traiter vos fichiers de test, l’état de la page de détails passe à Ready to review .When the trainable classifier is done processing your test files, the status on the details page will change to Ready to review. Si vous devez augmenter la taille de l’échantillon de test, choisissez et autorisez le Add items to test classifieur entraçable à traiter les éléments supplémentaires.If you need to increase the test sample size, choose Add items to test and allow the trainable classifier to process the additional items.

    Capture d’écran prête à être revueready to review screenshot

  17. Choisissez Tested items to review l’onglet pour passer en revue les éléments.Choose Tested items to review tab to review items.

  18. Microsoft 365 présente 30 éléments à la fois.Microsoft 365 will present 30 items at a time. Examinez-les et dans la We predict this item is "Relevant". Do you agree? zone choisissez Yes l’une ou No l’autre ou Not sure, skip to next item .Review them and in the We predict this item is "Relevant". Do you agree? box choose either Yes or No or Not sure, skip to next item. La précision du modèle est automatiquement mise à jour après 30 éléments.Model accuracy is automatically updated after every 30 items.

    zone d’avis sur les élémentsreview items box

  19. Passer en revue au moins 200 éléments.Review at least 200 items. Une fois que le score de précision s’est stabilisé, l’option de publication devient disponible et l’état du classificateur le dit Ready to use .Once the accuracy score has stabilized, the publish option will become available and the classifier status will say Ready to use.

    score de précision et prêt à être publiéaccuracy score and ready to publish

  20. Publiez le classifieur.Publish the classifier.

  21. Une fois publié, votre classifieur sera disponible en tant que condition dans l’étiquetageautomatique Office avec des étiquettes de confidentialité , appliquer automatiquement une stratégie d’étiquette de rétention basée sur une condition et dans la conformité des communications.Once published your classifier will be available as a condition in Office auto-labeling with sensitivity labels, auto-apply retention label policy based on a condition and in Communication compliance.