Benutzerdefinierte Klassifizierungen in Microsoft Purview

In diesem Artikel wird beschrieben, wie Sie benutzerdefinierte Klassifizierungen erstellen können, um Datentypen in Ihrem Datenbestand zu definieren, die für Ihre organization eindeutig sind. Außerdem wird die Erstellung von benutzerdefinierten Klassifizierungsregeln beschrieben, mit denen Sie bestimmte Daten im gesamten Datenbestand finden können.

Wichtig

Zum Erstellen einer benutzerdefinierten Klassifizierung benötigen Sie entweder die Berechtigung Datenkurator oder Datenquellenadministrator für eine Sammlung. Berechtigungen auf jeder Sammlungsebene sind ausreichend. Weitere Informationen zu Berechtigungen finden Sie unter Microsoft Purview-Berechtigungen.

Standardsystemklassifizierungen

Die Microsoft Purview Data Catalog bietet einen großen Satz von Standardsystemklassifizierungen, die typische personenbezogene Datentypen darstellen, die möglicherweise in Ihrem Datenbestand vorhanden sind. Die gesamte Liste der verfügbaren Systemklassifizierungen finden Sie unter Unterstützte Klassifizierungen in Microsoft Purview.

Klassifizierung auswählen

Sie haben auch die Möglichkeit, benutzerdefinierte Klassifizierungen zu erstellen, wenn eine der Standardklassifizierungen Nicht Ihren Anforderungen entspricht.

Hinweis

Unsere Datenstichprobenregeln werden sowohl auf Systemklassifizierungen als auch auf benutzerdefinierte Klassifizierungen angewendet.

Hinweis

Benutzerdefinierte Microsoft Purview-Klassifizierungen werden nur auf strukturierte Datenquellen wie SQL und CosmosDB sowie auf strukturierte Dateitypen wie CSV, JSON und Parquet angewendet. Die benutzerdefinierte Klassifizierung wird nicht auf unstrukturierte Datentypen wie DOC, PDF und XLSX angewendet.

Schritte zum Erstellen einer benutzerdefinierten Klassifizierung

Führen Sie die folgenden Schritte aus, um eine benutzerdefinierte Klassifizierung zu erstellen:

  1. Sie benötigen Berechtigungen für Datenkurator oder Datenquellenadministrator für jede Sammlung , um eine benutzerdefinierte Klassifizierung erstellen zu können.

  2. Wählen Sie in Ihrem Katalog im linken Menü die Option Data Map aus.

  3. Wählen Sie unter Anmerkungsverwaltung die Option Klassifizierungen aus.

  4. Wählen Sie + Neu aus.

    Neue Klassifizierung

Der Bereich Neue Klassifizierung hinzufügen wird geöffnet, in dem Sie Ihrer Klassifizierung einen Namen und eine Beschreibung geben können. Es empfiehlt sich, eine Namensabstandskonvention your company name.classification namewie zu verwenden.

Die Microsoft-Systemklassifizierungen sind unter dem reservierten MICROSOFT. Namespace gruppiert. Ein Beispiel ist MICROSOFT. REGIERUNG. UNS. SOCIAL_SECURITY_NUMBER.

Der Name Ihrer Klassifizierung muss mit einem Buchstaben beginnen, gefolgt von einer Sequenz von Buchstaben, Zahlen und Punkt (.) oder Unterstrichen. Während der Eingabe generiert die Benutzeroberfläche automatisch einen Anzeigenamen. Dieser Anzeigename wird Benutzern angezeigt, wenn Sie ihn auf eine Ressource im Katalog anwenden.

Um den Namen kurz zu halten, erstellt das System den Anzeigenamen basierend auf der folgenden Logik:

  • Alle segmenten außer den letzten beiden Segmenten des Namespace werden gekürzt.

  • Die Groß-/Kleinschreibung wird so angepasst, dass der erste Buchstabe jedes Worts groß geschrieben wird.

  • Alle Unterstriche (_) werden durch Leerzeichen ersetzt.

Wenn Sie ihre Klassifizierung beispielsweise contoso.hr.employee_ID benannt haben, wird der Anzeigename im System als Hr.Employee ID gespeichert.

Contoso.hr.employee_id

Wählen Sie OK aus, und Ihre neue Klassifizierung wird Ihrer Klassifizierungsliste hinzugefügt.

Benutzerdefinierte Klassifizierung

Wenn Sie die Klassifizierung in der Liste auswählen, wird die Seite mit den Klassifizierungsdetails geöffnet. Hier finden Sie alle Details zur Klassifizierung.

Diese Details umfassen die Anzahl der Instanzen, den formalen Namen, die zugeordneten Klassifizierungsregeln (falls vorhanden) und den Besitzernamen.

Klassifizierung auswählen

Benutzerdefinierte Klassifizierungsregeln

Der Katalogdienst stellt eine Reihe von Standardklassifizierungsregeln bereit, die vom Scanner verwendet werden, um bestimmte Datentypen automatisch zu erkennen. Sie können auch eigene benutzerdefinierte Klassifizierungsregeln hinzufügen, um andere Datentypen zu erkennen, die Sie möglicherweise in Ihrem gesamten Datenbestand finden möchten. Diese Funktion kann sehr leistungsfähig sein, wenn Sie versuchen, Daten in Ihrem Datenbestand zu finden.

Hinweis

Benutzerdefinierte Klassifizierungsregeln werden nur in englischer Sprache unterstützt.

Angenommen, ein Unternehmen mit dem Namen Contoso verfügt über Mitarbeiter-IDs, die im gesamten Unternehmen mit dem Wort "Employee" und einer GUID zum Erstellen von EMPLOYEE{GUID} standardisiert sind. Eine instance einer Mitarbeiter-ID sieht beispielsweise wie EMPLOYEE9c55c474-9996-420c-a285-0d0fc23f1f55folgt aus.

Contoso kann das Überprüfungssystem so konfigurieren, dass Instanzen dieser IDs gefunden werden, indem eine benutzerdefinierte Klassifizierungsregel erstellt wird. Sie können einen regulären Ausdruck bereitstellen, der dem Datenmuster entspricht, in diesem Fall \^Employee\[A-Za-z0-9\]{8}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{12}\$. Wenn sich die Daten in der Regel in einer Spalte befinden, deren Name sie kennen, z. B. Employee_ID oder EmployeeID, können sie einen regulären Spaltenmusterausdruck hinzufügen, um die Überprüfung noch genauer zu gestalten. Ein Beispiel für regex ist Employee_ID|EmployeeID.

Das Überprüfungssystem kann diese Regel dann verwenden, um die tatsächlichen Daten in der Spalte und den Spaltennamen zu untersuchen, um zu versuchen, jeden instance zu identifizieren, an dem sich das Mitarbeiter-ID-Muster befindet.

Schritte zum Erstellen einer benutzerdefinierten Klassifizierungsregel

So erstellen Sie eine benutzerdefinierte Klassifizierungsregel:

  1. Erstellen Sie eine benutzerdefinierte Klassifizierung, indem Sie die Anweisungen im vorherigen Abschnitt befolgen. Sie fügen diese benutzerdefinierte Klassifizierung in der Konfiguration der Klassifizierungsregel hinzu, sodass das System sie anwendet, wenn es eine Übereinstimmung in der Spalte findet.

  2. Wählen Sie das Data Map-Symbol aus.

  3. Wählen Sie den Abschnitt Klassifizierungsregeln aus.

    Kachel

  4. Wählen Sie Neu aus.

    Hinzufügen einer neuen Klassifizierungsregel

  5. Das Dialogfeld Neue Klassifizierungsregel wird geöffnet. Füllen Sie die Felder aus, und entscheiden Sie, ob eine Regel für reguläre Ausdrücke oder eine Wörterbuchregel erstellt werden soll.

    Feld Beschreibung
    Name Erforderlich. Der Höchstwert beträgt 100 Zeichen.
    Beschreibung Optional. Der Höchstwert beträgt 256 Zeichen.
    Klassifizierungsname Erforderlich. Wählen Sie den Namen der Klassifizierung aus der Dropdownliste aus, um den Scanner anzuweisen, ihn anzuwenden, wenn eine Übereinstimmung gefunden wird.
    Status Erforderlich. Die Optionen sind aktiviert oder deaktiviert. Aktiviert ist die Standardeinstellung.

    Erstellen einer neuen Klassifizierungsregel

Erstellen einer Regel für reguläre Ausdrücke

Wichtig

Bei regulären Ausdrücken in benutzerdefinierten Klassifizierungen wird die Groß-/Kleinschreibung nicht beachtet.

  1. Wenn Sie eine Regel für reguläre Ausdrücke erstellen, wird der folgende Bildschirm angezeigt. Optional können Sie eine Datei hochladen, die verwendet wird, um vorgeschlagene RegEx-Muster für Ihre Regel zu generieren. Es werden nur englischsprachige Regeln unterstützt.

    Erstellen einer neuen RegEx-Regel

  2. Wenn Sie ein vorgeschlagenes RegEx-Muster generieren möchten, wählen Sie nach dem Hochladen einer Datei eines der vorgeschlagenen Muster aus, und wählen Sie Zu Mustern hinzufügen aus, um die vorgeschlagenen Daten- und Spaltenmuster zu verwenden. Sie können die vorgeschlagenen Muster optimieren oder auch eigene Muster eingeben, ohne eine Datei hochzuladen.

    Generieren eines vorgeschlagenen RegEx

    Feld Beschreibung
    Datenmuster Optional. Ein regulärer Ausdruck, der die im Datenfeld gespeicherten Daten darstellt. Der Grenzwert ist groß. Im vorherigen Beispiel testen die Datenmuster eine Mitarbeiter-ID, bei der es sich buchstäblich um das Wort handelt Employee{GUID}.
    Spaltenmuster Optional. Ein regulärer Ausdruck, der die Spaltennamen darstellt, die sie abgleichen möchten. Der Grenzwert ist groß.
  3. Unter Datenmuster können Sie den Mindestvergleichsschwellenwert verwenden, um den mindestprozentigen Prozentsatz der übereinstimmungen unterschiedlicher Datenwerte in einer Spalte festzulegen, die vom Scanner für die anzuwendende Klassifizierung gefunden werden muss. Der vorgeschlagene Wert ist 60 %. Wenn Sie mehrere Datenmuster angeben, ist diese Einstellung deaktiviert, und der Wert ist auf 60 % festgelegt.

    Hinweis

    Der Schwellenwert für mindeste Übereinstimmung muss mindestens 1 % betragen.

  4. Sie können jetzt Ihre Regel überprüfen und erstellen .

  5. Testen Sie die Klassifizierungsregel, bevor Sie den Erstellungsprozess abschließen, um zu überprüfen, ob Tags auf Ihre Ressourcen angewendet werden. Die Klassifizierungen in der Regel werden genau wie bei einer Überprüfung auf die hochgeladenen Beispieldaten angewendet. Dies bedeutet, dass alle Systemklassifizierungen und Ihre benutzerdefinierte Klassifizierung mit den Daten in Ihrer Datei abgeglichen werden.

    Eingabedateien können durch Trennzeichen getrennte Dateien (CSV, PSV, SSV, TSV), JSON- oder XML-Inhalt enthalten. Der Inhalt wird basierend auf der Dateierweiterung der Eingabedatei analysiert. Durch Trennzeichen getrennte Daten verfügen möglicherweise über eine Dateierweiterung, die mit einem der genannten Typen übereinstimmt. TsV-Daten können beispielsweise in einer Datei namens MySampleData.csv vorhanden sein. Durch Trennzeichen getrennte Inhalte müssen außerdem mindestens drei Spalten aufweisen.

    Testregel vor dem Erstellen

    Anzeigen angewendeter Klassifizierungen nach dem Hochladen einer Testdatei

Erstellen einer Wörterbuchregel

  1. Wenn Sie eine Wörterbuchregel erstellen, wird der folgende Bildschirm angezeigt. Laden Sie eine Datei hoch, die alle möglichen Werte für die Klassifizierung enthält, die Sie in einer einzelnen Spalte erstellen. Es werden nur englischsprachige Regeln unterstützt.

    Erstellen einer Wörterbuchregel

  2. Nachdem das Wörterbuch generiert wurde, können Sie den mindesten Übereinstimmungsschwellenwert anpassen und die Regel übermitteln.

    Erstellen Sie eine Wörterbuchregel mit Dictionary-Generated Häkchen.

Bearbeiten oder Löschen einer benutzerdefinierten Klassifizierung

Führen Sie die folgenden Schritte aus, um eine benutzerdefinierte Klassifizierung zu aktualisieren oder zu bearbeiten:

  1. Wählen Sie in Ihrem Microsoft Purview-Konto die Datenzuordnung und dann Klassifizierungen aus.

  2. Wählen Sie die Registerkarte Benutzerdefiniert aus.

  3. Wählen Sie die Klassifizierung aus, die Sie bearbeiten möchten, und wählen Sie dann die Schaltfläche Bearbeiten aus.

    Screenshot der Benutzerdefinierten Klassifizierungsseite mit ausgewählter Klassifizierung und hervorgehobener Schaltfläche

  4. Jetzt kann die Beschreibung dieser benutzerdefinierten Klassifizierung bearbeitet werden. Wählen Sie die Schaltfläche OK aus, wenn Sie fertig sind, um Ihre Änderungen zu speichern.

So löschen Sie eine benutzerdefinierte Klassifizierung:

  1. Wählen Sie nach dem Öffnen der Data Map und dann Klassifizierungen die Registerkarte Benutzerdefiniert aus.
  2. Wählen Sie die Klassifizierung aus, die Sie löschen möchten, oder mehrere Klassifizierungen, die Sie löschen möchten, und wählen Sie dann die Schaltfläche Löschen aus. Screenshot: Seite

Sie können eine Klassifizierung auch innerhalb der Klassifizierung selbst bearbeiten oder löschen. Wählen Sie einfach Ihre Klassifizierung aus, und wählen Sie dann im oberen Menü die Schaltflächen Bearbeiten oder Löschen aus.

Screenshot: Seite eines benutzerdefinierten Klassifizierungsobjekts mit hervorgehobenen Schaltflächen zum Bearbeiten und Löschen oben auf der Seite

Aktivieren oder Deaktivieren von Klassifizierungsregeln

  1. Wählen Sie in Ihrem Microsoft Purview-Konto die Datenzuordnung und dann Klassifizierungsregeln aus.

  2. Wählen Sie die Registerkarte Benutzerdefiniert aus.

  3. Sie können die aktuelle status einer Klassifizierungsregel überprüfen, indem Sie sich die Spalte Status in der Tabelle ansehen.

  4. Wählen Sie die Klassifizierungsregel oder mehrere Klassifizierungsregeln aus, die Sie aktivieren oder deaktivieren möchten.

  5. Wählen Sie im oberen Menü die Schaltflächen Aktivieren oder Deaktivieren aus.

    Screenshot der Seite

Sie können auch die status einer Regel aktualisieren, wenn Sie die Regel bearbeiten.

Bearbeiten oder Löschen einer Klassifizierungsregel

Führen Sie die folgenden Schritte aus, um eine benutzerdefinierte Klassifizierungsregel zu aktualisieren oder zu bearbeiten:

  1. Wählen Sie in Ihrem Microsoft Purview-Konto die Datenzuordnung und dann Klassifizierungsregeln aus.

  2. Wählen Sie die Registerkarte Benutzerdefiniert aus.

  3. Wählen Sie die Klassifizierungsregel aus, die Sie bearbeiten möchten, und wählen Sie dann die Schaltfläche Bearbeiten aus.

    Screenshot der Seite

  4. Jetzt können Sie den Zustand, die Beschreibung und die zugehörige Klassifizierungsregel bearbeiten.

  5. Klicken Sie auf die Schaltfläche Fortfahren.

  6. Sie können eine neue Datei für Ihren regulären Ausdruck oder ihre Wörterbuchregel hochladen, mit der sie abgleichen kann, und den Schwellenwert und die Übereinstimmung des Spaltenmusters aktualisieren.

  7. Klicken Sie auf Übernehmen, um die Änderungen zu speichern. Überprüfungen müssen mit der neuen Regel erneut ausgeführt werden, um Änderungen auf Ihre Ressourcen anzuwenden.

So löschen Sie eine benutzerdefinierte Klassifizierung:

  1. Wählen Sie nach dem Öffnen der Data Map und dann Klassifizierungsregeln die Registerkarte Benutzerdefiniert aus.

  2. Wählen Sie die Klassifizierungsregel aus, die Sie löschen möchten, und wählen Sie dann die Schaltfläche Löschen aus.

    Screenshot der Seite

Nächste Schritte

Nachdem Sie ihre Klassifizierungsregel erstellt haben, kann sie einem Überprüfungsregelsatz hinzugefügt werden, sodass ihre Überprüfung die Regel beim Scannen verwendet. Weitere Informationen finden Sie unter Erstellen eines Überprüfungsregelsatzes.