Ulteriori informazioni su tipi di informazioni sensibili basati sulla corrispondenza esatta dei dati

I tipi di informazioni sensibili vengono usati per identificare gli elementi sensibili in modo da evitare che vengano condivisi inavvertitamente o in modo inappropriato, per individuare i dati rilevanti in eDiscovery e per applicare azioni di governance a determinati tipi di informazioni. Si definisce un tipo di informazioni sensibili personalizzato (SIT) in base a:

  • criteri
  • evidenza di parole chiave come dipendente, numero di previdenza sociale o ID
  • vicinanza del carattere all'evidenza in un modello specifico
  • livello di probabilità

Ma cosa succede se si desidera un tipo di informazioni sensibili personalizzato (SIT) che usa valori di dati esatti o quasi esatti, anziché uno che trova corrispondenze basate su modelli generici? Con la classificazione basata su Exact Data Match (EDM), è possibile creare un tipo di informazioni sensibili personalizzato progettato per:

  • essere dinamico e facilmente aggiornabile
  • offrire maggiore scalabilità
  • produrre meno falsi positivi
  • usare dati sensibili strutturati
  • gestire le informazioni sensibili in modo più sicuro, senza condividerle con nessuno, tra cui Microsoft
  • essere usato con più servizi cloud Microsoft

Classificazione basata su EDM.

La classificazione basata su EDM consente di creare tipi di informazioni sensibili personalizzati che fanno riferimento a valori esatti in un database di informazioni sensibili. Il database può essere aggiornato giornalmente e può contenere un massimo di 100 milioni di righe di dati. I dipendenti, i pazienti o i clienti vanno e vengono e i record cambiano, i tipi di informazioni sensibili personalizzati rimangono aggiornati e disponibili. Inoltre, è possibile usare la classificazione basata su EDM con criteri, ad esempio i criteri di prevenzione della perdita di dati di Microsoft Purview o Microsoft Cloud App Security criteri di file.

Nota

Microsoft Purview Information Protection supporta le lingue del set di caratteri a doppio byte per:

  • Cinese (semplificato)
  • Cinese (tradizionale)
  • Coreano
  • Giapponese

Il supporto è disponibile per i tipi di informazioni sensibili. Per altre informazioni, vedere Note sulla versione del supporto della protezione delle informazioni per i set di caratteri a due byte (anteprima).

Cosa c'è di diverso in un SIT EDM

Quando si usano i SIT EDM, è utile comprendere alcuni concetti specifici.

Schema

Lo schema è un file xml che definisce:

  • Nome dello schema, in seguito denominato DataStore.
  • Nomi di campo contenuti nella tabella di origine delle informazioni riservate. Esiste un mapping 1:1 del nome del campo dello schema al nome della colonna della tabella di origine delle informazioni riservate.
  • Quali campi sono ricercabili.
  • Qualsiasi parametro di modifica della ricerca, denominato corrispondenza configurabile, come ignorare i delimitatori e la distinzione tra maiuscole e minuscole nei valori ricercati.

Tabella dell'origine delle informazioni riservate

La tabella di origine sensibile contiene i valori delle informazioni riservate che verranno cercati da EDM SIT. È costituito da colonne e righe. Le intestazioni di colonna sono i nomi dei campi, le righe sono un'istanza di dati e ogni cella contiene i valori per tale istanza per tale campo.

Di seguito è riportato un semplice esempio di tabella di origine delle informazioni riservate.

Nome Cognome Date of Birth
Isaia Langer 05-05-1960
Ana Bowman 11-24-1971
Oscar Ward 02-12-1998

Pacchetto di regole

Ogni SIT ha un pacchetto di regole. Usare il pacchetto della regola in un sit EDM per definire:

  • Corrispondenze, che specificano il campo che sarà l'elemento primario da utilizzare nella ricerca esatta. Può essere un'espressione regolare con o senza convalida del checksum, un elenco di parole chiave, un dizionario di parole chiave o una funzione.
  • Classificazione, che specifica la corrispondenza del tipo sensibile che attiva la ricerca EDM.
  • Elemento di supporto che sono elementi che, se trovati, forniscono prove di supporto che consentono di aumentare la confidenza della corrispondenza. Ad esempio, parola chiave "SSN" in prossimità di un numero SSN. Può essere un'espressione regolare con o senza convalida checksum, elenco di parole chiave, dizionario di parole chiave.
  • I livelli di attendibilità (alti, medi, bassi) riflettono la quantità di prove di supporto rilevate insieme all'elemento primario. Maggiore è l'evidenza di supporto che contiene un elemento, maggiore è la probabilità che un elemento corrispondente contenga le informazioni sensibili che stai cercando. Per altre informazioni sui livelli di attendibilità, vedere Parti fondamentali di un tipo di informazioni riservate . Prossimità - Numero di caratteri tra elemento primario e elemento di supporto

Si forniscono uno schema e dati personalizzati

Microsoft Purview include più di 200 SITS con schemi predefiniti, modelli regex, parole chiave e livelli di attendibilità. Con i SIT EDM, è necessario definire lo schema e i campi primari e secondari che identificano gli elementi sensibili. Poiché lo schema e i valori dei dati primari e secondari sono altamente sensibili, verranno crittografati tramite una funzione hash che include un valore salt generato in modo casuale o fornito automaticamente. Questi valori hash vengono quindi caricati nel servizio, in modo che i dati sensibili non siano mai aperti.

Elementi di supporto primario e secondario

Quando si crea un sit EDM, si definisce un campo elemento primario nel pacchetto di regole. I campi primari sono gli elementi per i quali verrà eseguita la ricerca di tutto il contenuto e che devono seguire un modello definito per essere identificati. Quando l'elemento primario viene trovato negli elementi analizzati, EDM cercherà quindi gli elementi secondari o di supporto, che non devono seguire un modello e la relativa prossimità all'elemento primario. EDM richiede che l'elemento primario sia individuabile per la prima volta tramite un sit esistente. Per un elenco completo dei SIT disponibili, vedere Definizioni di entità del tipo di informazioni riservate . Dovrai trovare uno di quelli che rilevano la classe che vuoi che il tuo SIT EDM rilevi. Ad esempio, se lo schema SIT EDM ha il numero di previdenza sociale degli Stati Uniti come elemento principale, quando si crea lo schema EDM, è stato associato al numero di previdenza sociale (SSN) degli Stati Uniti .

Funzionamento della corrispondenza

EDM trova corrispondenze confrontando il contenuto trovato con una tabella di dati sensibili definiti dall'utente. Il test di corrispondenza viene eseguito usando una combinazione di regole e modelli tradizionali per garantire che i dati corrispondenti siano un'istanza effettiva dei dati che si desidera trovare e proteggere. Alla base, EDM funziona confrontando stringhe nei documenti e messaggi di posta elettronica con i valori in una tabella di dati sensibili forniti per scoprire se i valori nel contenuto sono presenti nella tabella confrontando gli hash crittografici unidirezionali.

Suggerimento

Una pratica comune consiste nel combinare l'uso di tipi di informazioni sensibili EDM e i normali tipi di informazioni sensibili su cui si basano in regole DLP, con soglie diverse. Ad esempio, è possibile usare un tipo di informazioni sensibili EDM che cerca i numeri di previdenza sociale e altri dati, con requisiti rigorosi e tolleranza bassa in cui una o più corrispondenze causeranno un avviso DLP e usare il tipo di informazioni sensibili normale, ad esempio il numero di previdenza sociale statunitense predefinito per conteggi più elevati.

Servizi supportati da EDM

Servizio Posizioni
Prevenzione della perdita dei dati di Microsoft Purview - SharePoint Online
- OneDrive for Business
- Chat di Teams
- Exchange Online
- Dispositivi
Microsoft Defender for Cloud Apps - SharePoint Online
- OneDrive for Business
Etichettatura automatica (lato servizio) - SharePoint Online
- OneDrive for Business
- Exchange Online
Etichettatura automatica (lato client) - Word
- Excel
- PowerPoint
- Client desktop di Exchange
Chiave gestita dal cliente - SharePoint Online
- OneDrive for Business
- Chat di Teams
- Exchange Online
- Word
- Excel
- PowerPoint
- Client desktop di Exchange
- Dispositivi
eDiscovery - SharePoint Online
- OneDrive for Business
- Chat di Teams
- Exchange Online
- Word
- Excel
- PowerPoint
- Client desktop di Exchange
Gestione dei rischi Insider - SharePoint Online
- OneDrive for Business
- Chat di Teams
- Exchange Online
- Word
- Excel
- PowerPoint
- Client desktop di Exchange

Vedere anche