Modifier le schéma de correspondance des données exactes pour utiliser la correspondance configurableModify Exact Data Match schema to use configurable match

La classification EDM (Exact Data Match) vous permet de créer des types d’informations sensibles personnalisés qui font référence à des valeurs exactes dans une base de données d’informations sensibles.Exact Data Match (EDM) based classification enables you to create custom sensitive information types that refer to exact values in a database of sensitive information. Lorsque vous devez autoriser les variantes d’une chaîne exacte, vous pouvez utiliser une correspondance configurable pour indiquer à Microsoft 365 d’ignorer la casse et certains séparateurs.When you need to allow for variants of a exact string, you can use configurable match to tell Microsoft 365 to ignore case and some delimiters.

Important

Utilisez cette procédure pour modifier un schéma EDM et un fichier de données existants.Use this procedure to modify an existing EDM schema and data file.

  1. Désinstallez EdmUploadAgent.exe de l’ordinateur que vous utilisez pour vous connecter à Microsoft 365 afin de charger les fichiers de données et le modèle EDM.Uninstall the EdmUploadAgent.exe from the computer that you use to connect to Microsoft 365 for EDM schema and data file upload purposes.

  2. Téléchargez le fichier EdmUploadAgent.exe approprié pour votre abonnement en utilisant les liens ci-dessous :Download the appropriate EdmUploadAgent.exe file for your subscription using the links below:

    • Commercial + GCC : pour la plupart des clients commerciauxCommercial + GCC - most commercial customers should use this
    • GCC-High : conçu spécifiquement pour les abonnés cloud du secteur public haute sécuritéGCC-High - This is specifically for high security government cloud subscribers
    • DoD : conçu spécifiquement pour les clients cloud du Department of Defense américainDoD - this is specifically for United States Department of Defense cloud customers
  3. Autorisez l’agent de chargement EDM, ouvrez la fenêtre Invite de commandes (en tant qu’administrateur), puis exécutez la commande suivante :Authorize the EDM Upload Agent, open Command Prompt window (as an administrator) and run the following command:

    EdmUploadAgent.exe /Authorize

  4. Si vous n’avez pas de copie actuelle du schéma existant, vous devez en télécharger une. Exécutez la commande suivante :If you don't have a current copy of the existing schema, you'll need to download a copy of the existing schema, run this command:

    EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]

  5. Personnalisez le schéma de sorte que chaque colonne utilise « caseInsensitive » et/ou « ignoredDelimiters ».Customize the schema so each column utilizes “caseInsensitive” and / or “ignoredDelimiters”. La valeur par défaut de « caseInsensitive » est « false » et « ignoredDelimiters » est une chaîne vide.The default value for “caseInsensitive” is “false” and for “ignoredDelimiters”, it is an empty string.

Notes

Le type d’informations sensibles personnalisé sous-jacent ou le type d’informations sensibles intégré utilisé pour détecter le modèle regex général doivent prendre en charge la détection des entrées de variantes indiquées avec ignoredDelimiters.The underlying custom sensitive information type or built in sensitive information type used to detect the general regex pattern must support detection of the variations inputs listed with ignoredDelimiters. Par exemple, le type d’informations sensibles intégré Numéro de sécurité sociale (SSN) américain permet de détecter les variantes des données qui incluent des tirets, des espaces ou une absence d’espace entre les numéros groupés qui composent le numéro de sécurité sociale.For example, the built in U.S. social security number (SSN) sensitive information type can detect variations in the data that include dashes, spaces, or lack of spaces between the grouped numbers that make up the SSN. Par conséquent, les seuls délimiteurs pertinents à inclure dans ignoredDelimiters EDM pour les données SSN sont : les tirets et les espaces.As a result, the only delimiters that are relevant to include in EDM’s ignoredDelimiters for SSN data are: dash and space.

Voici un exemple de schéma qui simule la correspondance non sensible à la casse en créant les colonnes supplémentaires nécessaires pour identifier les variations de casse dans les données sensibles.Here is a sample schema that simulates case insensitive match by creating the extra columns needed to recognize case variations in the sensitive data.

<EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
  <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
           <Field name="PolicyNumber" searchable="true" />
           <Field name="PolicyNumberLowerCase" searchable="true" />
           <Field name="PolicyNumberUpperCase" searchable="true" />
           <Field name="PolicyNumberCapitalLetters" searchable="true" />
  </DataStore>
</EdmSchema>

Dans l’exemple ci-dessus, les variantes de la colonne d’origine PolicyNumber ne sont plus nécessaires si caseInsensitive et ignoredDelimiters sont ajoutés.In the above example, the variations of the original PolicyNumber column will no longer be needed if both caseInsensitive and ignoredDelimiters are added.

Pour mettre à jour ce schéma de façon à ce qu’EDM utilise la correspondance configurable, utilisez les indicateurs caseInsensitive et ignoredDelimiters.To update this schema so that EDM uses configurable match use the caseInsensitive and ignoredDelimiters flags. Cela se présente comme suit :Here's how that looks:

<EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
  <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
         <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
  </DataStore>
</EdmSchema>

L’indicateur ignoredDelimiters prend en charge tous les caractères non alphanumériques. Voici quelques exemples :The ignoredDelimiters flag supports any non-alphanumeric character, here are some examples:

  • ..
  • -
  • /
  • _
  • *
  • ^
  • #
  • !
  • ?
  • [
  • ]
  • {
  • }
  • \
  • ~
  • ;

L’indicateur ignoredDelimiters ne prend pas en charge :The ignoredDelimiters flag doesn't support:

  • Les caractères 0 à 9characters 0-9
  • A-ZA-Z
  • a-za-z
  • "
  • ,
  1. Connectez-vous au Centre de sécurité et conformité en utilisant la procédure Se connecter à l’interface PowerShell du Centre de sécurité et conformité.Connect to the Security & Compliance center using the procedures in Connect to Security & Compliance Center PowerShell.

Notes

Si votre organisation a configuré une Clé client pour Microsoft 365 au niveau du client (préversion publique), la correspondance exacte des données utilisera automatiquement sa fonctionnalité de chiffrement.If your organization has set up Customer Key for Microsoft 365 at the tenant level (public preview), Exact data match will make use of its encryption functionality automatically. Cette offre est disponible uniquement pour les clients sous licence E5 dans le cloud commercial.This is available only to E5 licensed tenants in the Commercial cloud.

  1. Mettez à jour votre schéma en exécutant ces applets de commande une par une :Update your schema by running these cmdlets one at a time:

$edmSchemaXml=Get-Content .\\edm.xml -Encoding Byte -ReadCount 0

Set-DlpEdmSchema -FileData $edmSchemaXml -Confirm:$true

  1. Si nécessaire, mettez à jour le fichier de données pour qu’il corresponde à la nouvelle version du schéma.If necessary, update the data file to match the new schema version

Conseil

Si vous le souhaitez, vous pouvez exécuter une validation par rapport à votre fichier CSV avant de charger en exécutant :Optionally, you can run a validation against your csv file before uploading by running:

EdmUploadAgent.exe /ValidateData /DataFile [data file] [schema file]

Pour plus d’informations sur tous les paramètres pris en charge par EdmUploadAgent.exeFor more information on all the EdmUploadAgent.exe >supported parameters run

EdmUploadAgent.exe /?

  1. Ouvrez la fenêtre Invite de commandes (en tant qu’administrateur), puis exécutez la commande suivante pour hacher et charger vos données sensibles :Open Command Prompt window (as an administrator) and run the following command to hash and upload your sensitive data:

    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]