Share via


Requisiti per la gestione dei dati

L'analisi su scala cloud consiglia di considerare i requisiti seguenti per la governance dei dati:

  • Definizione dell'entità dati per creare un vocabolario aziendale comune in un glossario aziendale. Le entità dati in questo contesto significa concetti come clienti, fornitori, materiali, dipendenti e altri.
  • Identificazione e individuazione delle entità dati.
  • Classificazione dei dati per gestire la sicurezza dell'accesso ai dati, la privacy dei dati e la conservazione dei dati.
  • Persone, come i proprietari dei dati con responsabilità di governance e gli amministratori dei dati responsabili della protezione e della qualità dei dati.
  • Processi di governance dei dati.
  • Gestione del ciclo di vita dei dati per gestire il tempo di conservazione dei dati
  • Criteri e regole per definire le modalità di governance di dati specifici per l'intero ciclo di vita.
  • Applicazione dei criteri su tutti gli archivi dati nel panorama dei dati distribuiti.
  • Gestione dei dati master per rendere coerenti i dati. La gestione potrebbe essere applicabile a tutti i vari sistemi operativi e di analisi, ad esempio clienti, prodotti e fornitori.
  • Derivazione dei metadati per comprendere la trasformazione e la relazione delle entità dati.
  • Tecnologia a supporto della governance di dati strutturati, multistrutturati e non strutturati. La governance può estendersi al data center, su più cloud e al perimetro.

Una sfida è che i dati vengono raccolti e archiviati in più posizioni nell'azienda. I dati possono includere i dati raccolti e archiviati in aree geografiche diverse e giurisdizioni legali diverse. Di conseguenza, potrebbero essere applicate normative diverse per la governance degli stessi dati in giurisdizioni diverse. Individuare i dati distribuiti tra più cloud e posizioni geografiche, a:

  • Comprendere quali attributi di dati, entità di dati e relazioni tra i dati esistono nel panorama dei dati distribuiti.
  • Classificare i dati per sapere come gestirne la governance
  • Definire i criteri per specificare il modo in cui i dati devono essere regolati per ogni tipo di classificazione dei dati e gestione del ciclo di vita.
  • Applicare criteri di qualità dei dati, sicurezza dell'accesso ai dati, privacy dei dati e gestione del ciclo di vita nel panorama dei dati distribuiti.

Classificazione dati

La classificazione dei dati è un modo per classificare gli asset di dati assegnando tag logici o classi univoche agli asset di dati. La classificazione si basa sul contesto aziendale dei dati.

È necessario un modo per classificare i dati per capire il livello di riservatezza e per quanto tempo mantenerli. La classificazione richiede:

  • Uno schema di classificazione della riservatezza dei dati
  • Uno schema di classificazione della conservazione dei dati

Un esempio di questi schemi è:

Schema di classificazione della riservatezza dei dati

Classificazione Descrizione
Pubblici Chiunque può accedere ai dati e può essere inviato a chiunque. Ad esempio, aprire i dati per enti pubblici.
Solo per uso interno. Solo i dipendenti possono accedere ai dati e non possono essere inviati all'esterno dell'azienda.
Riservato I dati possono essere condivisi solo se sono necessari per un'attività specifica. I dati non possono essere inviati all'esterno dell'azienda senza un contratto di divulgazione.
Sensibili (dati personali) I dati contengono informazioni private, che devono essere mascherate e condivise solo in base alle esigenze per un tempo limitato. I dati non possono essere inviati al personale non autorizzato o all'esterno dell'azienda.
Con restrizioni I dati possono essere condivisi solo con persone denominate che sono responsabili della relativa protezione. Ad esempio, documenti legali o segreti commerciali.

Schema di classificazione della conservazione del ciclo di vita dei dati

Conservazione Descrizione
nessuno I dati possono essere eliminati in qualsiasi momento.
Temporaneo Mantenere i dati per un breve periodo di tempo. Ad esempio, mantenere i dati di Twitter per una settimana.
Periodo fisso Mantenere i dati per un numero di anni impostato, dopo il quale può essere eliminato. Ad esempio, mantenere i record fiscali per sette anni per rispettare le leggi governative.
Permanente Non eliminare mai i dati. Ad esempio, corrispondenza legale.

È necessario automatizzare il processo di riservatezza dei dati e di conservazione dei dati usando le classi definite in ogni schema per etichettare in modo coerente i dati nel panorama dei dati distribuiti. L'automazione consentirà di gestire la governance dei dati in modo coerente e corretto. Definire quindi regole e criteri per ogni classe nello schema di classificazione per specificare come gestire la governance dei dati in base alla relativa classificazione.

Ruoli e responsabilità per la governance dei dati

Un altro requisito è la necessità di definire le responsabilità. In caso contrario, confusione persiste come chi è responsabile per la gestione dei dati. Se non si definiscono le responsabilità, non sarà possibile rispondere alle domande seguenti.

  • Chi stabilisce le metriche di successo e verifica regolarmente che il programma di governance dei dati funzioni in modo corretto?
  • Chi sono i proprietari dei dati?
  • Chi definisce e mantiene aggiornato un glossario aziendale?
  • Chi crea e gestisce i criteri per la sicurezza dell'accesso?
  • Chi tutela la privacy dei dati personali per la conformità?
  • Chi controlla la qualità dei dati sui prodotti in tutte le brochure e i siti Web dei partner?
  • Chi garantisce che i dati dei clienti siano coerenti in tutti i sistemi?
  • Chi mantiene monitorato l'utilizzo dei dati della sottoscrizione esterna rispetto alla licenza?
  • Chi controlla gli utenti con privilegi, come gli amministratori di database e gli scienziati dei dati?

Se ne occupa un dirigente di livello C? Ci pensa un responsabile del reparto? Se ne occupa il responsabile di governance, rischi e conformità? Qual è il ruolo dell'ufficio legale? Oppure è responsabilità del reparto IT? I ruoli e le responsabilità sono fondamentali per evitare confusione e per impostare le basi su si può concretizzare una cultura dei dati.

Processi di governance dei dati

Sono necessari processi, oltre a ruoli e responsabilità per:

  • Gestire la definizione e la manutenzione di un vocabolario aziendale comune
  • Individuare e identificare i dati di cui si dispone, ciò che significa e dove è archiviato
  • Classificare i dati per sapere come gestirne la governance
  • Gestire la definizione e la manutenzione dei criteri di sicurezza per l'accesso ai dati
  • Gestire la definizione e la manutenzione dei criteri di privacy per i dati
  • Rilevare i problemi di qualità dei dati e correggerli
  • Applicare criteri per assicurarsi che vengano prese le misure adeguate per la conformità
  • Gestire la manutenzione dei dati master

Criteri e regole di governance dei dati

Definire i criteri e le regole per la governance di:

  • Regole di integrità dei dati
  • Regole e criteri di inserimento dati
  • Regole e criteri di sicurezza per l'accesso ai dati
  • Regole e criteri di privacy dei dati
  • Regole e criteri di qualità dei dati
  • Regole e criteri di manutenzione dei dati
  • Regole e criteri di conservazione dei dati

Associare questi criteri e regole a ogni classe negli schemi di classificazione di governance dei dati.

Gestione dei dati master

Un altro requisito per la governance dei dati è la gestione dei dati master. I dati master sono i dati più condivisi in qualsiasi organizzazione e includono le entità dati principali. Le entità dati principali includono cliente, fornitore, materiali, dipendente e asset. Sono anche inclusi i dati del piano dei conti finanziario che si trovano in diverse applicazioni finanziarie. Poiché i dati master sono così ampiamente condivisi, è indipendente dall'applicazione. Sono necessari sia per le applicazioni di elaborazione delle transazioni operative che per i sistemi analitici. Mantenere questi dati sincronizzati può risolvere una grande quantità di errori dei dati ed errori di elaborazione. La soluzione ideale è quindi mantenerli aggiornati a livello centralizzato tramite un processo comune e sincronizzare ogni sistema che ne ha bisogno. Sono anche necessari criteri di governance per stabilire chi è autorizzato a mantenerli aggiornati e dove deve avvenire tale manutenzione.

Lo stesso vale per i dati di riferimento, ad esempio i set di codice e i dati dei mercati finanziari. In questo caso, la standardizzazione e la sincronizzazione dei set di codice sono note come gestione dei dati di riferimento, anch'essa un requisito.

Derivazione dei metadati

Infine, esiste un requisito per la derivazione dei metadati. È possibile usare un audit trail per sapere dove hanno avuto origine i dati e come sono stati trasformati nel percorso verso un report o un archivio dati. È possibile usare i metadati per tenere traccia di chi o cosa gestisce la manutenzione dei dati, incluse tempistica e posizione per l'esecuzione di queste operazioni.

Riepilogo dei componenti necessari per la governance completa dei dati

È necessaria una soluzione completa in grado di gestire i dati per l'intero ciclo di vita in tutti gli archivi dati nel perimetro, in più cloud e nel data center.

Diagramma del framework di governance dei dati.

La soluzione di governance dei dati deve avere diversi componenti:

  • Visione e strategia di governance dei dati
  • I dati stessi, ad esempio i dati dei clienti, dei fornitori, degli ordini e altri.
  • Ciclo di vita dei dati dalla creazione alla distruzione all'interno del quale deve essere applicata la governance dei dati.
  • Ruoli e responsabilità per la governance dei dati (persone).
  • Processi e attività di governance dei dati e modalità di applicazione al ciclo di vita dei dati.
  • Criteri e regole per la governance dei dati in punti diversi del ciclo di vita.
  • Tecnologie di governance dei dati per rendere possibile la governance dei dati.

Passaggi successivi