Informationen zu Klassifizierungen (Vorschau)Learn about classifiers (preview)

Das klassifizieren und kennzeichnen von Inhalten, damit es geschützt und ordnungsgemäß behandelt werden kann, ist der Ausgangspunkt für die Informationsschutz Disziplin.Classifying and labeling content so it can be protected and handled properly is the starting place for the information protection discipline. Microsoft 365 verfügt über drei Möglichkeiten zum Klassifizieren von Inhalten.Microsoft 365 has three ways to classify content.

ManuellManually

Für diese Methode ist menschliches Urteilen und Handeln erforderlich.This method requires human judgment and action. Ein Administrator kann entweder die bereits vorhandenen Bezeichnungen und Typen vertraulicher Informationen verwenden oder eigene erstellen und diese dann veröffentlichen.An admin may either use the pre-existing labels and sensitive information types or create their own and then publish them. Benutzer und Administratoren wenden diese auf Inhalte an, wenn Sie darauf stoßen.Users and admins apply them to content as they encounter it. Anschließend können Sie den Inhalt schützen und seine Disposition verwalten.You can then protect the content and manage its disposition.

Automatischer MusterabgleichAutomated pattern matching

Diese Kategorie von Klassifizierungsmechanismen umfasst die Suche nach Inhalten nach folgenden Themen:This category of classification mechanisms include finding content by:

Sensitivitäts-und Aufbewahrungs Bezeichnungen können dann automatisch angewendet werden, um die Inhalte für die Verwendung in Datenverlust Verhinderung (DLP) und automatisch anwenden von Policen für Aufbewahrungs Bezeichnungenverfügbar zu machen.Sensitivity and retention labels can then be automatically applied to make the content available for use in data loss prevention (DLP) and auto-apply polices for retention labels.

KlassifizierungenClassifiers

Diese Klassifizierungsmethode eignet sich besonders gut für Inhalte, die nicht einfach durch die manuellen oder automatisierten Mustervergleichsmethoden identifiziert werden können.This classification method is particularly well suited to content that isn't easily identified by either the manual or automated pattern matching methods. Bei dieser Klassifizierungsmethode geht es eher darum, einen Klassifizierer so zu trainieren, dass er ein Element anhand dessen identifiziert, was das Element ist, und nicht anhand von Elementen, die sich im Element befinden (Musterabgleich).This method of classification is more about training a classifier to identify an item based on what the item is, not by elements that are in the item (pattern matching). Eine Klassifizierung zeigt, wie Sie einen Inhaltstyp identifizieren, indem Sie sich Hunderte Beispiele für die Inhalte ansehen, die Sie bei der Klassifizierung interessieren.A classifier learns how to identify a type of content by looking at hundreds of examples of the content you're interested in classifying. Sie beginnen mit dem Füttern von IT-Beispielen, die definitiv in der Kategorie sind.You start by feeding it examples that are definitely in the category. Nachdem diese verarbeitet wurden, testen Sie Sie, indem Sie eine Kombination aus sowohl passenden als auch nicht passenden Beispielen zuweisen.Once it processes those, you test it by giving it a mix of both matching and non-matching examples. Die Klassifizierung legt dann Vorhersagen fest, ob ein bestimmtes Element in die Kategorie fällt, die Sie erstellen.The classifier then makes predictions as to whether any given item falls into the category you're building. Anschließend bestätigen Sie die Ergebnisse, sortieren die wahren positiven Werte, true negative, falsch positive Ergebnisse und falsche Negative, um die Genauigkeit der Vorhersagen zu verbessern.You then confirm its results, sorting out the true positives, true negatives, false positives, and false negatives to help increase the accuracy of its predictions.

Wenn Sie die Klassifizierung veröffentlichen, werden Elemente an Speicherorten wie SharePoint Online, Exchange und OneDrive sortiert, und der Inhalt wird klassifiziert.When you publish the classifier, it sorts through items in locations like SharePoint Online, Exchange, and OneDrive, and classifies the content. Nachdem Sie die Klassifizierung veröffentlicht haben, können Sie Sie mit einem Feedbackprozess weiterbilden, der dem anfänglichen Schulungsprozess ähnelt.After you publish the classifier, you can continue to train it using a feedback process that is similar to the initial training process.

Wo Sie Schulungs Klassifizierer verwenden könnenWhere you can use trainable classifiers

Sowohl integrierte Klassifizierungen als auch eingestufte Klassifizierungen stehen als Bedingung für die automatische Kennzeichnung von Office mit Vertraulichkeits Bezeichnungen, automatisch angewendete Aufbewahrungs Bezeichnungsrichtlinie basierend auf einer Bedingung und in der Kommunikations Konformitätzur Verfügung.Both built-in classifiers and trainable classifiers are available as a condition for Office autolabeling with sensitivity labels, auto-apply retention label policy based on a condition and in communication compliance.

Vertraulichkeits Bezeichnungen können Klassifizierungen als Bedingungen verwenden, siehe Anwenden einer Vertraulichkeits Bezeichnung auf Inhalte automatisch.Sensitivity labels can use classifiers as conditions, see Apply a sensitivity label to content automatically.

Wichtig

Klassifizierungen funktionieren nur mit Elementen, die nicht verschlüsselt sind und sich in Englisch befinden.Classifiers only work with items that are not encrypted and are in English.

Typen von KlassifizierungenTypes of classifiers

  • vorab ausgebildete Klassifizierungen – Microsoft hat eine Reihe von Klassifizierungen erstellt und vorab geschult, die Sie verwenden können, ohne Sie zu Schulen.pre-trained classifiers - Microsoft has created and pre-trained a number of classifiers that you can start using without training them. Diese Klassifizierungen werden mit dem Status von angezeigt Ready to use .These classifiers will appear with the status of Ready to use.
  • benutzerdefinierte Klassifizierungen – wenn Klassifizierungsanforderungen über das hinausgehen, was die vorgeschulten Klassifizierungen umfassen, können Sie eigene Klassifizierungen erstellen und Schulen.custom classifiers - If you have classification needs that extend beyond what the pre-trained classifiers cover, you can create and train your own classifiers.

Vorab ausgebildete KlassifizierungenPre-trained classifiers

Microsoft 365 verfügt über fünf vorab ausgebildete Klassifizierungen:Microsoft 365 comes with five pre-trained classifiers:

Achtung

Wir verwerfen die vorab ausgebildete Klassifizierung der offensiven Sprache , da Sie eine hohe Anzahl falsch positiver Ergebnisse erzeugt.We are deprecating the Offensive Language pre-trained classifier because it has been producing a high number of false positives. Verwenden Sie es nicht, und wenn Sie es derzeit verwenden, sollten Sie Ihre Geschäftsprozesse aus dieser entfernen.Don't use it and if you are currently using it, you should move your business processes off of it. Es wird empfohlen, stattdessen die vorab ausgebildeten Klassifizierungen " Bedrohung ", " Profanität " und " Belästigung " zu verwenden.We recommend using the Threat , Profanity , and Harassment pre-trained classifiers instead.

  • Lebensläufe : erkennt Elemente, bei denen es sich um Text Konten für persönliche, pädagogische, berufliche Qualifikationen, Berufserfahrung und andere personenbezogene Informationen handelt.Resumes : detects items that are textual accounts of an applicant's personal, educational, professional qualifications, work experience, and other personally identifying information
  • Quellcode : erkennt Elemente, die eine Reihe von Anweisungen und Anweisungen enthalten, die in den Top 25 verwendeten Computer Programmiersprachen auf GitHub geschrieben wurden.Source Code : detects items that contain a set of instructions and statements written in the top 25 used computer programming languages on GitHub
    • ActionScriptActionScript
    • CC
    • C#C#
    • C++C++
    • ClojureClojure
    • CoffeeScriptCoffeeScript
    • OKGo
    • HaskellHaskell
    • JavaJava
    • JavaScriptJavaScript
    • LuaLua
    • MATLABMATLAB
    • Objective-CObjective-C
    • PerlPerl
    • PHPPHP
    • PythonPython
    • RR
    • RubyRuby
    • ScalaScala
    • ShellShell
    • SWIFTSwift
    • TexTex
    • Vim-SkriptVim Script

Hinweis

Der Quellcode wird geschult, um zu erkennen, wann der Hauptteil des Texts Quellcode ist.Source Code is trained to detect when the bulk of the text is source code. Es wird kein quellcodetext erkannt, der mit nur-Text vermischt wird.It does not detect source code text that is interspersed with plain text.

  • Belästigung : erkennt eine bestimmte Kategorie von Textelementen anstößiger Sprache im Zusammenhang mit anstößigem Verhalten, das auf eine oder mehrere Personen basierend auf den folgenden Merkmalen ausgerichtet ist: Rasse, Ethnizität, Religion, nationale Herkunft, Geschlecht, sexuelle Orientierung, Alter, BehinderungHarassment : detects a specific category of offensive language text items related to offensive conduct targeting one or multiple individuals based on the following traits: race, ethnicity, religion, national origin, gender, sexual orientation, age, disability
  • Profanität : erkennt eine bestimmte Kategorie von Textelementen anstößiger Sprache, die Ausdrücke enthalten, die die meisten Personen in Verlegenheit bringenProfanity : detects a specific category of offensive language text items that contain expressions that embarrass most people
  • Threat : erkennt eine bestimmte Kategorie von Textelementen anstößiger Sprache im Zusammenhang mit Bedrohungen, um Gewalt zu begehen oder physischen Schaden oder einer Person oder einer Eigenschaft zu SchadenThreat : detects a specific category of offensive language text items related to threats to commit violence or do physical harm or damage to a person or property

Diese werden in der Ansicht " Microsoft 365 Compliance Center > -Datenklassifizierung (Preview) " > trainable Klassifizierers "mit dem Status" angezeigt Ready to use .These appear in the Microsoft 365 compliance center > Data classification (preview) > Trainable classifiers view with the status of Ready to use.

Klassifizierungen – vorab geschulte-Klassifizierungen

Wichtig

Bitte beachten Sie, dass die beleidigende Sprache, Belästigung, Profanität und Bedrohungs Klassifizierungen nur mit durchsuchbarem Text funktionieren, die nicht erschöpfend oder vollständig sind.Please note that the offensive language, harassment, profanity, and threat classifiers only work with searchable text are not exhaustive or complete. Außerdem ändern sich die Sprach-und Kulturstandards ständig, und in Anbetracht dieser Gegebenheiten behält sich Microsoft das Recht vor, diese Klassifizierungen nach eigenem Ermessen zu aktualisieren.Further, language and cultural standards continually change, and in light of these realities, Microsoft reserves the right to update these classifiers in its discretion. Während die Klassifizierungen Ihre Organisation bei der Überwachung von anstößigen und anderen Sprachen unterstützen können, befassen sich die Klassifizierungsverfahren nicht mit den Konsequenzen dieser Sprache und dienen nicht dazu, die Verwendung dieser Sprache allein zu überwachen oder zu beantworten.While the classifiers may assist your organization in monitoring offensive and other language used, the classifiers do not address consequences of such language and are not intended to provide your organization's sole means of monitoring or responding to the use of such language. Ihre Organisation und nicht Microsoft oder ihre Niederlassungen bleiben für alle Entscheidungen im Zusammenhang mit der Überwachung, Durchsetzung, Sperrung, Entfernung und Aufbewahrung von Inhalten, die von einer vorab ausgebildeten Klassifizierung identifiziert werden, verantwortlich.Your organization, and not Microsoft or its subsidiaries, remains responsible for all decisions related to monitoring, enforcement, blocking, removal and retention of any content identified by a pre-trained classifier.

Benutzerdefinierte KlassifizierungenCustom classifiers

Wenn die vorab ausgebildeten Klassifizierungen nicht Ihren Anforderungen entsprechen, können Sie eigene Klassifizierungen erstellen und Schulen.When the pre-trained classifiers don't meet your needs, you can create and train your own classifiers. Es gibt wesentlich mehr Arbeit bei der Erstellung Ihrer eigenen, aber Sie werden viel besser auf ihre Organisationen zugeschnitten werden muss.There's significantly more work involved with creating your own, but they'll be much better tailored to your organizations needs.

Prozessablauf zum Erstellen benutzerdefinierter KlassifizierungenProcess flow for creating custom classifiers

Das Erstellen und Veröffentlichen einer Klassifizierung für die Verwendung in Compliance-Lösungen wie Aufbewahrungsrichtlinien und Kommunikationsüberwachung folgt diesem Fluss.Creating and publishing a classifier for use in compliance solutions, such as retention policies and communication supervision, follows this flow. Weitere Informationen zum Erstellen einer benutzerdefinierten Klassifizierer-Klassifizierung finden Sie unter Erstellen einer benutzerdefinierten Klassifizierung.For more detail on creating a custom trainable classifier see, Creating a custom classifier.

benutzerdefinierte Prozessablauf Klassifizierung

Umschulungs KlassifizierungenRetraining classifiers

Sie können die Genauigkeit aller benutzerdefinierten Klassifizierungen und einiger vorab ausgebildeter Klassifizierungen verbessern, indem Sie Ihnen Feedback zur Genauigkeit der von Ihnen durchgeführten Klassifizierung liefern.You can help improve the accuracy of all custom classifiers and some pre-trained classifiers by providing them with feedback on the accuracy of the classification that they perform. Dies wird als Umschulung bezeichnet und folgt diesem Workflow.This is called retraining and follow this workflow.

Klassifizierungs Umschulungs Workflow

Siehe auchSee also