Erste Schritte mit trainierbaren Klassifizierern (Vorschau)Get started with trainable classifiers (preview)

Eine Microsoft 365-schulungsable-Klassifizierung ist ein Tool, mit dem Sie verschiedene Arten von Inhalten erkennen können, indem Sie Beispiele für die Untersuchung geben.A Microsoft 365 trainable classifier is a tool you can train to recognize various types of content by giving it samples to look at. Sobald Sie geschult wurden, können Sie es verwenden, um das Element für die Anwendung von Office-Vertraulichkeits Bezeichnungen, Kommunikationsrichtlinien und Aufbewahrungs Bezeichnungsrichtlinien zu identifizieren.Once trained, you can use it to identify item for application of Office sensitivity labels, Communications compliance policies, and retention label policies.

Das Erstellen einer benutzerdefinierten Klassifizierer-Klassifizierung umfasst zunächst das Erteilen von Stichproben, die von Menschen ausgewählt werden und der Kategorie positiv entsprechen.Creating a custom trainable classifier first involves giving it samples that are human picked and positively match the category. Nachdem Sie diese verarbeitet haben, testen Sie dann die Fähigkeit der Klassifizierungen, vorherzusagen, indem Sie eine Mischung aus positiven und negativen Beispielen geben.Then, after it has processed those, you test the classifiers ability to predict by giving it a mix of positive and negative samples. In diesem Artikel erfahren Sie, wie Sie eine benutzerdefinierte Klassifizierung erstellen und trainieren und wie Sie die Leistung von benutzerdefinierten Schulungs fähigen Klassifizierungen und vorab ausgebildeten Klassifizierungen über ihre Lebensdauer durch Umschulung verbessern können.This article shows you how to create and train a custom classifier and how to improve the performance of custom trainable classifiers and pre-trained classifiers over their lifetime through retraining.

Weitere Informationen zu den verschiedenen Klassifizierungstypen finden Sie unter Learn about trainable Klassifizierers (Preview).To learn more about the different types of classifiers, see Learn about trainable classifiers (preview).

VoraussetzungenPrerequisites

LizenzierungsanforderungenLicensing requirements

Klassifizierungen sind ein Microsoft 365 E5-oder E5-Konformitäts Feature.Classifiers are a Microsoft 365 E5, or E5 Compliance feature. Sie müssen über eines dieser Abonnements verfügen, damit Sie Sie nutzen können.You must have one of these subscriptions to make use of them.

BerechtigungenPermissions

So greifen Sie auf die Klassifizierung in der Benutzeroberfläche zu:To access classifiers in the UI:

  • der globale Administrator muss sich für den Mandanten anmelden, um benutzerdefinierte Klassifizierungen zu erstellen.the Global admin needs to opt in for the tenant to create custom classifiers.
  • Compliance-Administrator oder Daten Ermittlungs Rolle ist erforderlich, um eine Klassifizierung zu trainieren.Compliance Administrator or Data Investigation role is required to train a classifier.

Sie benötigen Konten mit diesen Berechtigungen für die Verwendung von Klassifizierungen in den folgenden Szenarien:You'll need accounts with these permissions to use classifiers in these scenarios:

  • Richtlinien Szenario für Aufbewahrungs Bezeichnungen: Rollen für die Datensatzverwaltung und AufbewahrungsverwaltungRetention label policy scenario: Record Management and Retention Management roles
  • Richtlinien Szenario für die Sensitivitäts Bezeichnung: Sicherheitsadministrator, Kompatibilitäts Administrator, Kompatibilitätsdaten AdministratorSensitivity label policy scenario: Security Administrator, Compliance Administrator, Compliance Data Administrator
  • Kommunikations Konformitätsrichtlinien Szenario: Administrator für Insider Risiko Management, Aufsichts Überprüfungs AdministratorCommunication compliance policy scenario: Insider Risk Management Admin, Supervisory Review Administrator

Wichtig

Standardmäßig kann nur der Benutzer, der eine benutzerdefinierte Klassifizierung erstellt, die von dieser Klassifizierung vorgenommenen Vorhersagen trainieren und überprüfen.By default, only the user who creates a custom classifier can train and review predictions made by that classifier.

Vorbereiten auf eine benutzerdefinierte Schulungs KlassifizierungPrepare for a custom trainable classifier

Es ist hilfreich zu verstehen, was am Erstellen einer benutzerdefinierten Klassifizierer-Klassifizierung beteiligt ist, bevor Sie eintauchen.It's helpful to understand what's involved in creating a custom trainable classifier before you dive in.

ZeitachseTimeline

Diese Zeitachse reflektiert eine Beispielbereitstellung von Schulungs Klassifizierern.This timeline reflects a sample deployment of trainable classifiers.

Schulungs-und Klassifizierungs Zeitplan

Tipp

Das Anmelden ist zum ersten Mal für Schulungs orientierte Klassifizierungen erforderlich.Opt-in is required the first time for trainable classifiers. Es dauert zwölf Tage, bis Microsoft 365 eine Basisbewertung ihrer organisationsinhalte abgeschlossen hat.It takes twelve days for Microsoft 365 to complete a baseline evaluation of your organizations content. Wenden Sie sich an ihren globalen Administrator, um den Opt-in-Prozess zu starten.Contact your global administrator to kick off the opt-in process.

Allgemeiner WorkflowOverall workflow

Weitere Informationen zum Gesamtworkflow beim Erstellen von benutzerdefinierten Schulungs Klassifizierern finden Sie unter Prozessablauf zum Erstellen von Schulungs Klassifizierern für Kunden.To understand more about the overall workflow of creating custom trainable classifiers, see Process flow for creating customer trainable classifiers.

Seed-InhaltSeed content

Wenn Sie möchten, dass eine Lernende Klassifizierung ein Element in einer bestimmten Inhaltskategorie unabhängig und genau identifiziert, müssen Sie es zunächst mit vielen Beispielen des Inhaltstyps in der Kategorie präsentieren.When you want a trainable classifier to independently and accurately identify an item as being in particular category of content, you first have to present it with many samples of the type of content that are in the category. Diese Fütterung von Proben zur Klassifizierer-Schulung wird als Seeding bezeichnet.This feeding of samples to the trainable classifier is known as seeding. Seed-Inhalt wird von einem Menschen ausgewählt und wird bewertet, um die Kategorie des Inhalts darzustellen.Seed content is selected by a human and is judged to represent the category of content.

Tipp

Sie benötigen mindestens 50 positive Beispiele und bis zu 500.You need to have at least 50 positive samples and as many as 500. Die eingestufte Klassifizierung wird bis zu den 500 zuletzt erstellten Beispielen verarbeitet (nach Dateierstellungsdatum/Zeitstempel).The trainable classifier will process up to the 500 most recent created samples (by file created date/time stamp). Je mehr Beispiele Sie bereitstellen, desto genauer sind die Vorhersagen, die von der Klassifizierung vorgenommen werden.The more samples you provide, the more accurate the predictions the classifier will make.

Testen von InhaltenTesting content

Nachdem die Schulungs fähigen Klassifizierung genügend positive Beispiele zum Erstellen eines Vorhersagemodells verarbeitet hat, müssen Sie die vorher gestellten Voraussagen testen, um zu ermitteln, ob die Klassifizierung ordnungsgemäß zwischen Elementen unterscheiden kann, die der Kategorie und den Elementen entsprechen, die nicht übereinstimmen.Once the trainable classifier has processed enough positive samples to build a prediction model, you need to test the predictions it makes to see if the classifier can correctly distinguish between items that match the category and items that don't. Sie tun dies, indem Sie eine andere, hoffentlich größere Gruppe von Personen übergreifenden Inhalten auswählen, die aus Beispielen besteht, die in die Kategorie fallen sollten, und Beispiele, die dies nicht tun.You do this by selecting another, hopefully larger, set of human picked content that consists of samples that should fall into the category and samples that won't. Sie sollten mit unterschiedlichen Daten als die anfänglichen Ausgangsdaten testen, die Sie zuerst angegeben haben.You should test with different data than the initial seed data you first provided. Nachdem Sie diese verarbeitet haben, gehen Sie die Ergebnisse manuell durch und überprüfen, ob jede Vorhersage korrekt, falsch oder nicht sicher ist.Once it processes those, you manually go through the results and verify whether each prediction is correct, incorrect, or you aren't sure. Die Schulungs-Klassifizierung verwendet dieses Feedback, um das Vorhersagemodell zu verbessern.The trainable classifier uses this feedback to improve its prediction model.

Tipp

Die besten Ergebnisse erzielen Sie, wenn Ihr Test Beispiel mindestens 200 Elemente mit einer gleichmäßigen Verteilung positiver und negativer Übereinstimmungen auflistet.For best results, have at least 200 items in your test sample set with an even distribution of positive and negative matches.

Vorgehensweise Erstellen einer Schulungs KlassifiziererHow to create a trainable classifier

  1. Sammeln zwischen 50-500-Seed-Inhaltselementen.Collect between 50-500 seed content items. Hierbei muss es sich nur um Beispiele handeln, die den Typ des Inhalts, den die Lernenden Klassifizierung positiv als in der Kategorie Klassifizierung identifiziert werden soll, stark darstellen.These must be only samples that strongly represent the type of content you want the trainable classifier to positively identify as being in the classification category. Weitere Informationen finden Sie unter standardmäßig durchforstete Dateinamenerweiterungen und analysierte Dateitypen in SharePoint Server für die unterstützten Dateitypen.See, Default crawled file name extensions and parsed file types in SharePoint Server for the supported file types.

    Wichtig

    Die Ausgangs-und Test Beispielelemente dürfen nicht verschlüsselt sein und müssen in Englisch sein.The seed and test sample items must not be encrypted and they must be in English.

    Wichtig

    Stellen Sie sicher, dass die Elemente im seedsatz starke Beispiele für die Kategorie sind.Make sure the items in your seed set are strong examples of the category. Die eingestufte Klassifizierung erstellt zunächst Ihr Modell basierend auf dem, was Sie mit dem Seeding beginnen.The trainable classifier initially builds its model based on what you seed it with. Bei der Klassifizierung wird davon ausgegangen, dass alle Seed-Beispiele starke positive Ergebnisse aufweisen und keine Möglichkeit haben zu wissen, ob ein Beispiel einer schwachen oder negativen Übereinstimmung mit der Kategorie entspricht.The classifier assumes all seed samples are strong positives and has no way of knowing if a sample is a weak or negative match to the category.

  2. Platzieren Sie den Ausgangs Inhalt in einem SharePoint Online Ordner, der ausschließlich für den Inhalt des Seeds reserviert ist.Place the seed content in a SharePoint Online folder that is dedicated to holding the seed content only. Notieren Sie sich die Website-, Bibliotheks-und Ordner-URL.Make note of the site, library, and folder URL.

    Tipp

    Wenn Sie eine neue Website und einen neuen Ordner für Ihre Seed-Daten erstellen, lassen Sie mindestens eine Stunde für diesen Standort indiziert werden, bevor Sie die Schulungs Klassifizierung erstellen, die diese Startdaten verwendet.If you create a new site and folder for your seed data, allow at least an hour for that location to be indexed before creating the trainable classifier that will use that seed data.

  3. Melden Sie sich bei Microsoft 365 Compliance Center mit dem Compliance-Administrator oder der Rolle "Sicherheitsadministrator" an, und öffnen Sie Microsoft 365 Compliance Center oder die Datenklassifizierung für das Microsoft 365 Security Center > Data classification.Sign in to Microsoft 365 compliance center with compliance admin or security admin role access and open Microsoft 365 compliance center or Microsoft 365 security center > Data classification.

  4. Klicken Sie auf die Registerkarte Schulungs Klassifizierung .Choose the Trainable classifiers tab.

  5. Wählen Sie Create trainable Klassifizierer aus.Choose Create trainable classifier.

  6. Geben Sie die entsprechenden Werte für Name die Description Felder und der Kategorie der Elemente ein, die diese Lernbare Klassifizierung identifizieren soll.Fill in appropriate values for the Name and Description fields of the category of items you want this trainable classifier to identify.

  7. Wählen Sie in Schritt 2 die SharePoint Online Website, Bibliothek und Ordner-URL für die Seed-Inhaltswebsite aus.Pick the SharePoint Online site, library, and folder URL for the seed content site from step 2. Wählen Sie aus Add .Choose Add.

  8. Überprüfen Sie die Einstellungen, und wählen Sie Create trainable classifier .Review the settings and choose Create trainable classifier.

  9. Innerhalb von 24 Stunden verarbeitet die Schulungs-und Klassifizierungs Stelle die seeddaten und erstellt ein Vorhersagemodell.Within 24 hours the trainable classifier will process the seed data and build a prediction model. Der Klassifizierungsstatus ist In progress , während er die seeddaten verarbeitet.The classifier status is In progress while it processes the seed data. Wenn die Klassifizierung die Verarbeitung der seeddaten abgeschlossen hat, wird der Status in geändert Need test items .When the classifier is finished processing the seed data, the status changes to Need test items.

  10. Sie können die Seite Details jetzt anzeigen, indem Sie die Klassifizierung auswählen.You can now view the details page by choosing the classifier.

    Schulungs fähige Klassifizierung zum Testen verfügbartrainable classifier ready for testing

  11. Sammeln Sie mindestens 200 Testinhalts Elemente (10.000 max), um optimale Ergebnisse zu erzielen.Collect at least 200 test content items (10,000 max) for best results. Dabei muss es sich um eine Mischung von Elementen handeln, die starke positive Ergebnisse aufweisen, starke negative und einige, die in ihrer Natur etwas weniger offensichtlich sind.These should be a mix of items that are strong positives, strong negatives and some that are a little less obvious in their nature. Weitere Informationen finden Sie unter standardmäßig durchforstete Dateinamenerweiterungen und analysierte Dateitypen in SharePoint Server für die unterstützten Dateitypen.See, Default crawled file name extensions and parsed file types in SharePoint Server for the supported file types.

    Wichtig

    Die Beispielelemente dürfen nicht verschlüsselt werden und müssen in Englisch sein.The sample items must not be encrypted and they must be in English.

  12. Platzieren Sie den Testinhalt in einem SharePoint Online Ordner, der ausschließlich für den Testinhalt reserviert ist.Place the test content in a SharePoint Online folder that is dedicated to holding the test content only. Notieren Sie sich die SharePoint Online Website, Bibliothek und Ordner-URL.Make note of the SharePoint Online site, library, and folder URL.

    Tipp

    Wenn Sie eine neue Website und einen neuen Ordner für Ihre Testdaten erstellen, lassen Sie mindestens eine Stunde für diesen Ort indiziert werden, bevor Sie die Schulungs Klassifizierung erstellen, die diese Startdaten verwendet.If you create a new site and folder for your test data, allow at least an hour for that location to be indexed before creating the trainable classifier that will use that seed data.

  13. Wählen Sie aus Add items to test .Choose Add items to test.

  14. Wählen Sie die SharePoint Online Website, Bibliothek und Ordner-URL für die Testinhalts Website aus Schritt 12 aus.Pick the SharePoint Online site, library, and folder URL for the test content site from step 12. Wählen Sie aus Add .Choose Add.

  15. Beenden Sie den Assistenten, indem Sie auswählen Done .Finish the wizard by choosing Done. Ihre Schulungs-Klassifizierung dauert bis zu einer Stunde, um die Testdateien zu verarbeiten.Your trainable classifier will take up to an hour to process the test files.

  16. Wenn die ausbildende Klassifizierung die Verarbeitung Ihrer Testdateien abgeschlossen hat, wird der Status auf der Seite Details in geändert Ready to review .When the trainable classifier is done processing your test files, the status on the details page will change to Ready to review. Wenn Sie die Größe des testsamples vergrößern möchten, wählen Sie aus, Add items to test und lassen Sie die Schulungs-Klassifizierung die zusätzlichen Elemente verarbeiten.If you need to increase the test sample size, choose Add items to test and allow the trainable classifier to process the additional items.

    zur Überprüfung des Screenshot verfügbarready to review screenshot

  17. Klicken Sie Tested items to review auf die Registerkarte, um Elemente zu überprüfen.Choose Tested items to review tab to review items.

  18. Microsoft 365 wird 30 Elemente gleichzeitig darstellen.Microsoft 365 will present 30 items at a time. Überprüfen Sie diese, und We predict this item is "Relevant". Do you agree? Wählen Sie im Feld entweder Yes oder No oder aus Not sure, skip to next item .Review them and in the We predict this item is "Relevant". Do you agree? box choose either Yes or No or Not sure, skip to next item. Die Modellgenauigkeit wird nach jeweils 30 Elementen automatisch aktualisiert.Model accuracy is automatically updated after every 30 items.

    Feld "Elemente überprüfen"review items box

  19. Über prüfen Sie mindestens 200 Elemente.Review at least 200 items. Nachdem das Genauigkeits Ergebnis stabilisiert wurde, wird die Option veröffentlichen verfügbar sein, und der Status der Klassifizierung wird sagen Ready to use .Once the accuracy score has stabilized, the publish option will become available and the classifier status will say Ready to use.

    Genauigkeits Bewertung und Veröffentlichungs bereitaccuracy score and ready to publish

  20. Veröffentlichen Sie die Klassifizierung.Publish the classifier.

  21. Nachdem Ihre Klassifizierung veröffentlicht wurde, wird Sie als Bedingung in der automatischen Office-Bezeichnungsrichtlinie mit Vertraulichkeits Bezeichnungen, automatisch angewendeten Aufbewahrungs Bezeichnungsrichtlinien basierend auf einer Bedingung und in der Kommunikations Konformitätverfügbar sein.Once published your classifier will be available as a condition in Office auto-labeling with sensitivity labels, auto-apply retention label policy based on a condition and in Communication compliance.