Progetti Data Quality (DQS)

Un progetto data quality in Data Quality ServicesData Quality Services (DQS) è uno strumento utilizzando una knowledge base per migliorare la qualità dei dati di origine eseguendo pulizia dei dati e corrispondenza dei dati attività e quindi esportare i dati risultanti in un database di SQL Server o un file CSV. È possibile creare un progetto di qualità dei dati come progetto di pulizia o come progetto di corrispondenza per eseguire le rispettive attività. È possibile eseguire progetti di pulizia e di individuazione delle corrispondenze utilizzando la stessa Knowledge Base, poiché le informazioni per la pulizia e per l'individuazione di corrispondenze possono essere inserite all'interno della stessa Knowledge Base.

Un progetto di qualità dei dati offre i vantaggi seguenti:

  • Consente di eseguire la pulizia dei dati sui dati di origine utilizzando le informazioni in una Knowledge Base DQS.

  • Consente di eseguire l'individuazione delle corrispondenze sui dati di origine utilizzando i criteri di corrispondenza in una Knowledge Base.

  • Fornisce una procedura guidata per supportare le attività di pulizia e individuazione delle corrispondenze e consente di esportare i dati selezionati in un database SQL Server o in un file csv. L'amministratore dei dati può utilizzare il progetto di qualità dei dati per eseguire e controllare i passaggi di pulizia e di individuazione delle corrispondenze sia computerizzati che interattivi.

Progetto Data Quality: attività di pulizia dei dati

I progetti Data Quality di pulizia consentono di pulire i dati di origine in base a una Knowledge Base. L'attività di pulizia dei dati in DQS è un processo in due passaggi:

  1. Oggetto computerizzato processo che analizza i dati di origine rispetto alle informazioni nella knowledge base e vengono proposte modifiche di pulizia dei dati. I dati elaborati vengono suddivisi da DQS in categorie (suggerito, nuovo, non valido, con correzione e corretto), quindi vengono presentati all'utente per ulteriore elaborazione.

  2. Un interattiva pulizia processo che consente all'amministratore dei dati da approvare, rifiutare o modificare i dati proposti dal processo di pulizia dei dati assistita da computer.

    Per informazioni dettagliate sull'attività di pulizia in un progetto di qualità dei dati, vedere Data Cleansing.

Progetto Data Quality: attività di individuazione delle corrispondenze

Un progetto Data Quality di corrispondenza tra dati consente di eseguire l'attività di individuazione di corrispondenze in base ai criteri di corrispondenza in una Knowledge Base per impedire la duplicazione dei dati mediante l'identificazione di corrispondenze esatte e approssimative e permettendo quindi la rimozione dei dati duplicati. Si consiglia di pulire i dati prima di eseguire su questi l'individuazione di corrispondenze. A tale scopo, procedere come indicato di seguito:

  1. Creare un progetto Data Quality, selezionare l'attività Pulizia , completare l'attività di pulizia sui dati di origine, quindi esportarli in una tabella di un database di SQL Server.

  2. Creare un altro progetto Data Quality utilizzando una Knowledge Base che contiene criteri di corrispondenza, selezionare l'attività Corrispondenza , quindi nella pagina Mappa , selezionare il database e la tabella dove sono stati esportati i dati puliti nel passaggio 1.

  3. Completare l'attività di individuazione delle corrispondenze sui dati puliti.

    Per informazioni dettagliate sull'attività di individuazione delle corrispondenze in un progetto Data Quality, vedere Data Matching.

Profiling di dati e notifiche

Durante l'esecuzione delle attività di pulizia e corrispondenza in un progetto Data Quality, è possibile ottenere statistiche e informazioni in tempo reale sui dati elaborati da DQS. Il profiling dati consente di valutare l'efficacia dei processi di pulizia e di corrispondenza nonché l'entità del miglioramento dei dati grazie alla pulizia o all'individuazione delle corrispondenze. Profiling DQS fornisce due dimensioni della qualità dei dati: completezza (l'entità a cui sono presenti dati) e accuratezza (l'entità cui dati possono essere utilizzati per gli scopi previsti). Inoltre, in base alle informazioni sul profiling dei dati, vengono presentate notifiche riguardanti azioni che possono essere intraprese per migliorare la pulizia dei dati e le operazioni di individuazione delle corrispondenze. Per informazioni dettagliate sul profiling dei dati e sulle notifiche, vedere Data Profiling and Notifications in DQS.

Attività correlate

Descrizione dell'attività Argomento
Viene descritto come creare un progetto Data Quality. Creare un progetto Data Quality
Viene descritto come aprire, sbloccare, rinominare ed eliminare un progetto data quality. Aprire, sbloccare, rinominare ed eliminare un progetto Data Quality
Viene descritto come aprire un progetto di Integration Services in Client Data QualityData Quality Client. Apertura di progetti di Integration Services nel client Data Quality

Vedere anche

Knowledge Base e domini DQS