Créer un classifieur dans Microsoft SharePoint SyntexCreate a classifier in Microsoft SharePoint Syntex



Un classifieur est un type de modèle permettant d’automatiser l’identification et la classification d’un type de document.A classifier is a type of model that you can use to automate identification and classification of a document type. Par exemple, vous devez parfois identifier tous les documents Renouvellement de contrat ajoutés à votre bibliothèque de documents, comme indiqué dans l’illustration suivante.For example, you may want to identify all Contract Renewal documents that are added to your document library, such as is shown in the following illustration.

Document Renouvellement de contrat

La création d’un classifieur vous permet de créer un type de contenu SharePoint qui sera associé au modèle.Creating a classifier enables you to create a new SharePoint content type that will be associated to the model.

Lors de la création du classifieur, vous devez créer des explications pour définir le modèle.When creating the classifier, you need to create explanations to define the model. Cela vous permet de noter les données courantes nécessaires pour trouver systématiquement ce type de document.This enables you to note common data that you would expect to consistently find this document type.

Utilisez des exemples de type de document (« exemples de fichiers ») pour « entraîner » votre modèle à identifier les fichiers qui ont le même type de contenu.Use examples of the document type ("example files") to "train" your model to identify files that have the same content type.

Pour créer un classifieur, vous devez :To create a classifier, you need to:

  1. Nommer votre modèle.Name your model.
  2. Ajouter vos exemples de fichiers.Add your example files.
  3. Étiqueter vos exemples de fichiers.Label your example files.
  4. Créer une explication.Create an explanation.
  5. Tester votre modèle.Test your model.

Notes

Bien que votre modèle utilise un classifieur pour identifier et classifier des types de documents, vous pouvez également choisir d’extraire des informations spécifiques de chaque fichier identifié par le modèle.While your model uses a classifier to identify and classify document types, you can also choose to pull specific pieces of information from each file identified by the model. Pour ce faire, créez un extracteur à ajouter à votre modèle.Do this by creating an extractor to add to your model. Si vous souhaitez en savoir plus, veuillez consulter la rubrique Créer un extracteur.See Create an extractor.

Nommer votre modèleName your model

La première étape de création de votre modèle consiste à lui attribuer un nom :The first step to create your model is to give it a name:

  1. Dans le centre de contenu, sélectionnez Nouveau, puis Créer un modèle.From the content center, select New, and then Create a model.

  2. Dans le volet Nouveau modèle de compréhension de document, renseignez le champ Nom avec le nom du modèle.In the New document understanding model pane, in the Name field type the name of the model. Par exemple, si vous souhaitez identifier les documents de renouvellement de contrat, vous pouvez nommer le modèle Renouvellement de contrat.For example, if you want to identify contract renewal documents, you could name the model Contract Renewal.

  3. Sélectionnez Créer.Choose Create. Cette opération permet de créer une page d’accueil pour le modèle.This creates a home page for the model.

    Page d’accueil du modèle de classifieur

La création d’un modèle entraîne également celle d’un type de contenu de site.When you create a model, you are also creating a new site content type. Un type de contenu représente une catégorie de documents qui ont des caractéristiques communes et qui partagent une collection de colonnes ou de propriétés de métadonnées pour ce contenu spécifique.A content type represents a category of documents that have common characteristics and share a collection of columns or metadata properties for that particular content. Les types de contenu SharePoint sont gérés via la galerie des types de contenu.SharePoint content types are managed through the Content types gallery. Pour cet exemple, la création du modèle entraîne celle d’un type de contenu Renouvellement de contrat.For this example, when you create the model, you are creating a new Contract Renewal content type.

Sélectionnez Paramètres avancés si vous souhaitez mapper ce modèle à un type de contenu d’entreprise existant dans la galerie des types de contenu SharePoint, pour utiliser son schéma.Select Advanced settings if you want to map this model to an existing enterprise content type in the SharePoint Content types gallery to use its schema. Les types de contenu d’entreprise sont stockés dans le hub Type de contenu au sein du Centre d’administration SharePoint. Ils sont syndiqués sur tous les sites du client.Enterprise content types are stored in the Content Type Hub in the SharePoint admin center and are syndicated to all sites in the tenant. Note : vous pouvez certes utiliser un type de contenu existant pour tirer parti de son schéma et faciliter l’identification et la classification. Néanmoins, vous devez entraîner votre modèle à extraire des informations des fichiers qu’il identifie.Note that while you can use an existing content type to leverage its schema to help with identification and classification, you still need to train your model to extract information from files it identifies.

Paramètres avancés

Ajouter vos exemples de fichiersAdd your example files

Sur la page d’accueil du modèle, ajoutez vos exemples de fichiers dont vous aurez besoin pour entraîner le modèle à identifier votre type de document.On the model home page, add your examples files you will need to help train the model to identify your document type.


Notes

Vous devez utiliser les mêmes fichiers pour le classifieur et l’entraînement de l’extracteur.You should use the same files for both classifier and extractor training. Vous pouvez toujours ajouter d’autres fichiers ultérieurement, mais l’ensemble déjà ajouté d’exemples de fichiers est en général complet.You always have the option to add more later, but typically you add a full set of example files. Étiquetez certains d’entre eux pour entraîner votre modèle, puis testez les autres non étiquetés pour évaluer l’adéquation du modèle.Label some to train your model, and test the remaining unlabeled ones to evaluate model fitness.

Pour votre ensemble d’apprentissage, vous devez utiliser des exemples positifs et négatifs :For your training set, you want to use both positive and negative examples:

  • Exemple positif : documents représentant le type de document.Positive example: Documents that represent the document type. Ces documents contiennent des chaînes et des informations qui doivent toujours figurer dans ce type de document.These contain strings and information that would always be in this type of document.
  • Exemple négatif : tout autre document ne représentant pas le document à classer.Negative example: Any other document that does not represent the document you want to classify.

Veillez à utiliser au moins cinq exemples positifs et au moins un exemple négatif pour entraîner votre modèle.Be sure to use at least five positive examples and at least one negative example to train your model. Vous devez créer d’autres exemples pour tester votre modèle après le processus d’entraînement.You want to create additional ones to test your model after the training process.

Pour ajouter des exemples de fichiers :To add example files:

  1. Sur la page d’accueil du modèle, dans la mosaïque Ajouter des exemples de fichiers, cliquez sur Ajouter des fichiers.On the model home page, in the Add example files tile, click Add files.

  2. À la page Sélectionner des exemples de fichiers pour votre modèle, sélectionnez vos exemples de fichiers dans la bibliothèque Fichiers d’entraînement du centre de contenu.On the Select example files for your model page, select your example files from the Training files library in the content center. Si vous ne l’avez pas déjà fait, choisissez de les charger maintenant en cliquant sur Charger pour les copier dans la bibliothèque Fichiers d’entraînement.If you had not already uploaded them there, choose to upload them now by clicking Upload to copy them to the Training files library.

  3. Après avoir sélectionné vos exemples de fichiers à utiliser pour entraîner le modèle, cliquez sur Ajouter.After selecting your example files to use to train the model, click Add.

    Sélectionner des exemples de fichiers

Étiqueter vos exemples de fichiersLabel your example files

Une fois que vous avez ajouté vos exemples de fichiers, vous devez les étiqueter comme positifs ou négatifs.After adding your example files, you need to label them as either positive or negative examples.

  1. Depuis la page d’accueil du modèle, dans la mosaïque Classer des fichiers et exécuter l’entraînement, cliquez sur Entraîner le classifieur.From the model home page, on the Classify files and run training tile, click Train classifier. La page d’étiquettes affiche alors une liste de vos exemples de fichiers, le premier fichier étant visible dans la visionneuse.This displays the label page that shows a listing of your example files, with the first file visible in the viewer.

  2. Dans la visionneuse située en haut du premier exemple de fichier, un texte doit vous demander si le fichier est un exemple du modèle que vous venez de créer.In the viewer on the top of the first example file, you should see text asking if the file is an example of the model you just created. Si cet exemple est positif, sélectionnez Oui.If it is a positive example, select Yes. Si cet exemple est négatif, sélectionnez Non.If it is a negative example, select No.

  3. Dans la liste Exemples étiquetés à gauche, sélectionnez, puis étiquetez les fichiers supplémentaires à utiliser comme exemples.From the Labeled examples list on the left, select additional files that you want to use as examples, and label them.

    Page d’accueil du classifieur

Notes

Étiquetez au moins cinq exemples positifs.Label at least five positive examples. Vous devez également étiqueter au moins un exemple négatif.You must also label at least one negative example.

Créer une explicationCreate an explanation

L’étape suivante consiste à créer une explication à la page Entraîner.The next step is for you to create an explanation on the Train page. Une explication permet au modèle de comprendre comment reconnaître le document.An explanation helps the model understand how to recognize the document. Par exemple, les documents Renouvellement de contrat contiennent toujours une chaîne de caractères Demande de divulgation supplémentaire.For example, the Contract Renewal documents always contain a Request for additional disclosure text string.

Notes

Utilisées avec des extracteurs, les explications identifient la chaîne à extraire du document.When used with extractors, an explanation identifies the string that you want to extract from the document.

Pour créer une explication :To create an explanation:

  1. Depuis la page d’accueil du modèle, sélectionnez l’onglet Entraîner pour accéder à la page correspondante.From the model home page, select the Train tab to go to the Train page.

  2. À la page Entraîner, la section Fichiers entraînés contient normalement une liste des exemples de fichiers précédemment étiquetés.On the Train page, in the Trained files section you should see a list of the sample files that you previously labeled. Sélectionnez un des fichiers positifs de la liste pour l’afficher dans la visionneuse.Select one of the positive files from the list, and it displays in the viewer.

  3. Dans la section Explication, sélectionnez Nouveau, puis Espace.In the Explanation section, select New and then Blank.

  4. À la page Créer une explication :On the Create an explanation page:
    a.a. Tapez le nom (par exemple, « bloc de divulgation »).Type the Name (for example, "Disclosure Block").
    b.b. Sélectionnez le type.Select the Type. Pour l’échantillon, sélectionnez Liste d’expressions, puisque vous ajoutez une chaîne de caractères.For the sample, select Phrase list, since you add a text string.
    c.c. Dans la zone Tapez ici, tapez la chaîne.In the Type here box, type the string. Pour l’échantillon, ajoutez « Demande de divulgation supplémentaire ».For the sample, add "Request for additional disclosure". Vous pouvez sélectionner Respecter la casse si la chaîne doit respecter la casse.You can select Case sensitive if the string needs to be case sensitive.
    d.d. Cliquez sur Enregistrer.Click Save.

    Créer une explication

  5. Le centre de contenu vérifie à présent si l’explication que vous avez créée suffisamment complète pour identifier correctement comme positifs et négatifs les autres exemples de fichiers étiquetés.The Content Center now checks to see if the explanation you created is complete enough to identify the remaining labeled example files correctly, as positive and negative examples. Dans la section Fichiers entraînés, consultez la colonne Évaluation après la fin de l’apprentissage pour afficher les résultats.In the Trained Files section, check the Evaluation column after the training has completed to see the results. Les fichiers affichent la valeur Correspondance si les explications que vous avez créées sont suffisantes pour correspondre aux éléments étiquetés comme positifs ou négatifs.The files show a value of Match, if the explanations you created was enough to match what you labeled as positive or negative.

    Valeur de correspondance

Si une incompatibilité apparaît sur les fichiers étiquetés, vous devrez sans doute créer une explication supplémentaire pour fournir au modèle des informations supplémentaires permettant d’identifier le type de document.If you receive a Mismatch on the labeled files, you may need to create an additional explanation to provide the model more information to identify the document type. Dans ce cas, cliquez sur le fichier pour obtenir plus d’informations sur la raison de l’incompatibilité.If this happens, click on the file to get more information about why the mismatch occurred.

Tester votre modèleTest your model

Si vous avez reçu une correspondance sur vos fichiers échantillons étiquetés, vous pouvez à présent tester votre modèle sur les autres exemples de fichiers non étiquetés pour vérifier que ce modèle est inconnu.If you received a match on your labeled sample files, you can now test your model on your remaining unlabeled example files that the model has not seen before. Cette étape est facultative mais utile, car elle permet d’évaluer la « pertinence » ou le degré de préparation du modèle avant utilisation, en le testant sur des fichiers pour l’instant inconnus de ce dernier.This is optional, but a useful step to evaluate the “fitness” or readiness of the model before using it, by testing it on files the model hasn’t seen before.

  1. Dans la page d’accueil du modèle, sélectionnez l’onglet Test. Le modèle est alors exécuté sur vos fichiers échantillons non étiquetés.From the model home page, select the Test tab. This runs the model on your unlabeled sample files.

  2. Dans la liste Fichiers de test, vos exemples de fichiers indiquent s’ils sont positifs ou négatifs d’après les prévisions du modèle.In the Test files list, your example files display and shows if the model predicted them to be positive or negative. Utilisez ces informations pour déterminer plus facilement l’efficacité de votre classifieur lors de l’identification de vos documents.Use this information to help determine the effectiveness of your classifier in identifying your documents.

    Test des fichiers non étiquetés

Voir aussiSee Also

Créer un extracteurCreate an extractor

Présentation de la compréhension de documentDocument Understanding overview

Types d’explicationsExplanation types

Appliquer un modèleApply a model

Mode d’accessibilité Syntex de SharePointSharePoint Syntex Accessibility Mode