Progetti Data Quality (DQS)Data Quality Projects (DQS)

Un progetto di qualità dei dati in Data Quality ServicesData Quality Services (DQS) consiste nell'utilizzo di una Knowledge Base per migliorare la qualità dei dati di origine eseguendo attività di pulizia dei dati e di individuazione di corrispondenze tra dati ed esportando quindi i dati risultanti in un database SQL Server o in un file csv.A data quality project in Data Quality ServicesData Quality Services (DQS) is a means of using a knowledge base to improve the quality of your source data by performing data cleansing and data matching activities, and then exporting the resultant data to a SQL Server database or a .csv file. È possibile creare un progetto di qualità dei dati come progetto di pulizia o come progetto di corrispondenza per eseguire le rispettive attività.You can create a data quality project as a cleansing project or a matching project to perform respective activities. È possibile eseguire progetti di pulizia e di individuazione delle corrispondenze utilizzando la stessa Knowledge Base, poiché le informazioni per la pulizia e per l'individuazione di corrispondenze possono essere inserite all'interno della stessa Knowledge Base.Cleansing and matching projects can be run using the same knowledge base, because knowledge for data cleansing and matching can be built into the same knowledge base.

Un progetto di qualità dei dati offre i vantaggi seguenti:A data quality project has the following benefits:

  • Consente di eseguire la pulizia dei dati sui dati di origine utilizzando le informazioni in una Knowledge Base DQS.Enables you to perform data cleansing on your source data by using the knowledge in a DQS knowledge base.

  • Consente di eseguire l'individuazione delle corrispondenze sui dati di origine utilizzando i criteri di corrispondenza in una Knowledge Base.Enables you to perform data matching on your source data by using the matching policy in a knowledge base.

  • Fornisce una procedura guidata per supportare le attività di pulizia e individuazione delle corrispondenze e consente di esportare i dati selezionati in un database SQL Server o in un file csv.Provides a wizard to guide you through the cleansing and matching activities, and export the data as per your selection to a SQL Server database or to a .csv file. L'amministratore dei dati può utilizzare il progetto di qualità dei dati per eseguire e controllare i passaggi di pulizia e di individuazione delle corrispondenze sia computerizzati che interattivi.The data steward can use the data quality project to run and control the computer-assisted/interactive cleansing and data matching steps.

Progetto Data Quality: attività di pulizia dei dati Data Quality Project: Cleansing Activity

I progetti Data Quality di pulizia consentono di pulire i dati di origine in base a una Knowledge Base.A cleansing data quality project enables you to cleanse your source data based on a knowledge base. L'attività di pulizia dei dati in DQS è un processo in due passaggi:The data cleansing activity in DQS is a two-step process:

  1. Un processo computerizzato di pulizia dei dati tramite cui vengono analizzati i dati di origine in base alle informazioni incluse nella Knowledge Base e vengono proposte modifiche.A computer-assisted data cleansing process that analyzes source data against the knowledge in the knowledge base, and proposes changes. I dati elaborati vengono suddivisi da DQS in categorie (suggerito, nuovo, non valido, con correzione e corretto), quindi vengono presentati all'utente per ulteriore elaborazione.The processed data is categorized (suggested, new, invalid, corrected, and correct) by DQS, and displayed to the user for further processing.

  2. Quando il processo di pulizia è interattivo , l'amministratore dei dati può approvare, rifiutare o modificare i dati proposti dal processo di pulizia computerizzato.An interactive cleansing process that enables the data steward to approve, reject, or modify the data proposed by the computer-assisted data cleansing process.

    Per informazioni dettagliate sull'attività di pulizia in un progetto di qualità dei dati, vedere Data Cleansing.For detailed information about the cleansing activity in a data quality project, see Data Cleansing.

Progetto Data Quality: attività di individuazione delle corrispondenze Data Quality Project: Matching Activity

Un progetto Data Quality di corrispondenza tra dati consente di eseguire l'attività di individuazione di corrispondenze in base ai criteri di corrispondenza in una Knowledge Base per impedire la duplicazione dei dati mediante l'identificazione di corrispondenze esatte e approssimative e permettendo quindi la rimozione dei dati duplicati.A matching data quality project enables you to perform matching activity based on matching policy in a knowledge base to prevent data duplication by identifying exact and approximate matches, and thereby enabling you to remove duplicate data. Si consiglia di pulire i dati prima di eseguire su questi l'individuazione di corrispondenze.It is recommended that you cleanse your data before running matching on it. A tale scopo, procedere come indicato di seguito:To do so:

  1. Creare un progetto Data Quality, selezionare l'attività Pulizia , completare l'attività di pulizia sui dati di origine, quindi esportarli in una tabella di un database di SQL Server.Create a data quality project, select the Cleansing activity, complete the data cleansing activity on your source data, and then export it to a table in a SQL Server database.

  2. Creare un altro progetto Data Quality utilizzando una Knowledge Base che contiene criteri di corrispondenza, selezionare l'attività Corrispondenza , quindi nella pagina Mappa , selezionare il database e la tabella dove sono stati esportati i dati puliti nel passaggio 1.Create another data quality project by using a knowledge base that contains a matching policy, select the Matching activity, and then in the Map page, select the database and the table where you exported the cleansed data in step 1.

  3. Completare l'attività di individuazione delle corrispondenze sui dati puliti.Complete the matching activity on the cleansed data.

    Per informazioni dettagliate sull'attività di individuazione delle corrispondenze in un progetto Data Quality, vedere Data Matching.For detailed information about the matching activity in a data quality project, see Data Matching.

Profiling di dati e notifiche Data Profiling and Notifications

Durante l'esecuzione delle attività di pulizia e corrispondenza in un progetto Data Quality, è possibile ottenere statistiche e informazioni in tempo reale sui dati elaborati da DQS.While running the cleansing and matching activities in a data quality project, you can see real-time statistics and information about the data that is being processed by DQS. Il profiling dati consente di valutare l'efficacia dei processi di pulizia e di corrispondenza nonché l'entità del miglioramento dei dati grazie alla pulizia o all'individuazione delle corrispondenze.Data profiling helps you assess the effectiveness of the cleansing and matching processes, and you can potentially determine the extent to which data cleansing or matching helped improve the data quality. Il profiling DQS fornisce due dimensioni della qualità dei dati: completezza (l'entità della presenza dei dati) e accuratezza (la misura entro cui i dati possono essere utilizzati per gli scopi previsti).DQS profiling provides two data-quality dimensions: completeness (the extent to which data is present) and accuracy (the extent to which data can be used for its intended use). Inoltre, in base alle informazioni sul profiling dei dati, vengono presentate notifiche riguardanti azioni che possono essere intraprese per migliorare la pulizia dei dati e le operazioni di individuazione delle corrispondenze.Further, based on the data profiling information, notifications are displayed to the user on the actions that can be taken to enhance the data cleansing and data matching operations. Per informazioni dettagliate sul profiling dei dati e sulle notifiche, vedere Data Profiling and Notifications in DQS.For detailed information about data profiling and notifications, see Data Profiling and Notifications in DQS.

Descrizione dell'attivitàTask Description ArgomentoTopic
Viene descritto come creare un progetto Data Quality.Describes how to create a data quality project. Creare un progetto Data QualityCreate a Data Quality Project
Viene descritto come aprire, sbloccare, rinominare ed eliminare un progetto Data Quality.Describes how to open, unlock, rename, and delete a data quality project. Aprire, sbloccare, rinominare ed eliminare un progetto Data QualityOpen, Unlock, Rename, and Delete a Data Quality Project
Viene descritto come aprire un progetto di Integration Services in Client Data QualityData Quality Client.Describes how to open an Integration Services project in Client Data QualityData Quality Client. Aprire progetti di Integration Services in Data Quality ClientOpen Integration Services Projects in Data Quality Client

Vedere ancheSee Also

Knowledge Base e domini DQSDQS Knowledge Bases and Domains