Pulizia dei dati mediante le informazioni interne di DQSCleanse Data Using DQS (Internal) Knowledge

In questo argomento viene descritto come eseguire la pulizia dei dati utilizzando un progetto Data Quality in Data Quality ServicesData Quality Services (DQS).This topic describes how to cleanse your data by using a data quality project in Data Quality ServicesData Quality Services (DQS). La pulizia dei dati viene eseguita sui dati di origine utilizzando una Knowledge Base incorporata in DQS e confrontando tali dati con un set di dati di alta qualità.Data cleansing is performed on your source data using a knowledge base that has been built in DQS against a high-quality data set. Per altre informazioni, vedere Compilazione di una Knowledge Base.For more information, see Building a Knowledge Base.

La pulizia dei dati viene eseguita in quattro fasi: una fase di mapping , nel corso della quale viene identificata l'origine dati da pulire e ne viene eseguito il mapping ai domini richiesti in una Knowledge Base; una fase di pulizia computerizzata , in cui DQS applica la Knowledge Base ai dati da pulire e propone/effettua modifiche ai dati di origine; una fase di pulizia interattiva , che consente agli amministratori dei dati di analizzare, accettare o rifiutare le modifiche ai dati; infine, la fase di esportazione che consente di esportare i dati puliti.Data cleansing is performed in four stages: a mapping stage in which you identify the data source to be cleansed, and map it to required domains in a knowledge base, a computer-assisted cleansing stage where DQS applies the knowledge base to the data to be cleansed, and proposes/makes changes to the source data, an interactive cleansing stage where data stewards can analyze the data changes, and accept/reject the data changes, and finally the export stage that lets you export the cleansed data. Ognuno di questi processi viene eseguito in una pagina separata della procedura guidata relativa all'attività di pulizia, consentendo all'utente di spostarsi da una pagina a un'altra al fine di rieseguire il processo, completare un processo di pulizia specifico e tornare nuovamente a una sua fase specifica.Each of these processes is performed on a separate page of the cleansing activity wizard, enabling you to move back and forth to different pages, to re-run the process, and to close out of a specific cleansing process and then return to the same stage of the process. DQS fornisce statistiche sui dati di origine e sui risultati della pulizia che consentono di prendere decisioni informate sulla pulizia dei dati.DQS provides you with statistics about the source data and the cleansing results that enable you to make informed decisions about data cleansing.

Prima di iniziareBefore You Begin

PrerequisitiPrerequisites

  • È necessario avere specificato valori soglia adatti per l'attività di pulizia.You must have specified appropriate threshold values for the cleansing activity. Per informazioni su questa operazione, vedere Configurazione dei valori soglia per le attività di pulizia e di individuazione delle corrispondenze.For information about doing so, see Configure Threshold Values for Cleansing and Matching.

  • È necessario che in Data Quality ServerData Quality Server sia disponibile una Knowledge Base DQS con cui confrontare i dati di origine ed eseguirne la pulizia.A DQS knowledge base must be available on Data Quality ServerData Quality Server against which you want to compare, and cleanse your source data. La Knowledge Base deve inoltre contenere informazioni sul tipo di dati da pulire.Additionally, the knowledge base must contain knowledge about the type of data that you want to cleanse. Se si desidera pulire dati di origine che contengono indirizzi in Italia, ad esempio, è necessario disporre di una Knowledge Base creata in base a dati di esempio di alta qualità per indirizzi italiani.For example, if you want to cleanse your source data that contains US addresses, you must have a knowledge base that was created against a “high-quality” sample data for US addresses.

  • Se i dati di origine da pulire si trovano in un file di Excel, è necessario che Microsoft Excel sia installato nel computer Client Data QualityData Quality Client .Microsoft Excel must be installed on the Client Data QualityData Quality Client computer if the source data to be cleansed is in an Excel file. In caso contrario, non sarà possibile selezionare il file di Excel nella fase di mapping.Otherwise, you will not be able to select the Excel file in the mapping stage. I file creati da Microsoft Excel potranno presentare l'estensione xlsx, xls o csv.The files created by Microsoft Excel can have an extension of .xlsx, .xls, or .csv. Se viene utilizzata la versione a 64 bit di Excel, sono supportati solo i file di Excel 2003 (xls), mentre non sono supportati file di Excel 2007 o 2010 (xlsx).If the 64-bit version of Excel is used, only Excel 2003 files (.xls) are supported; Excel 2007 or 2010 files (.xlsx) are not supported. Se si utilizza una versione a 64 bit di Excel 2007 o 2010, salvare il file come file xls o csv o installare una versione a 32 bit di Excel.If you are using 64-bit version of Excel 2007 or 2010, save the file as an .xls file or a .csv file, or install a 32-bit version of Excel instead.

SicurezzaSecurity

AutorizzazioniPermissions

Per eseguire la pulizia dei dati è necessario disporre del ruolo dqs_kb_editor o dqs_kb_operator nel database DQS_MAIN.You must have the dqs_kb_editor or dqs_kb_operator role on the DQS_MAIN database to perform data cleansing.

Creazione di un progetto Data Quality per la pulizia dei datiCreate a Cleansing Data Quality Project

Per eseguire l'operazione di pulizia dei dati è necessario utilizzare un progetto Data Quality.You must use a data quality project to perform data cleansing operation. Per creare un progetto Data Quality per la pulizia dei dati:To create a cleansing data quality project:

  1. Seguire i passaggi 1-3 nell'argomento Creare un progetto Data Quality.Follow steps 1-3 in the topic Create a Data Quality Project.

  2. Nel passaggio 3.d, selezionare l'attività Pulizia .In step 3.d, select the Cleansing activity.

  3. Fare clic su Crea per creare un progetto Data Quality per la pulizia dei dati.Click Create to create a cleansing data quality project.

    Viene creato un progetto Data Quality per la pulizia dei dati e viene aperta la pagina Mappa della procedura guidata Data Quality per la pulizia dei dati.This creates a cleansing data quality project, and opens up the Map page of the cleansing data quality wizard.

Fase di mappingMapping Stage

Nella fase di mapping è possibile specificare la connessione ai dati di origine da pulire ed eseguire il mapping delle colonne dei dati di origine ai domini appropriati nella Knowledge Base selezionata.In the mapping stage, you specify the connection to the source data to be cleansed, and map the columns in the source data with the appropriate domains in the selected knowledge base.

  1. Nella pagina Mappa della procedura guidata Data Quality per la pulizia dei dati, selezionare i dati di origine da pulire: SQL Server o File di Excel:On the Map page of the cleansing data quality wizard, select your source data to be cleansed: SQL Server or Excel File:

    1. SQL Server: scegliere DQS_STAGING_DATA come database di origine se sono stati copiati i dati di origine in questo database, quindi selezionare la tabella o vista appropriata contenente i dati di origine.SQL Server: Select DQS_STAGING_DATA as the source database if you have copied your source data to this database, and then select appropriate table/view that contains your source data. In alternativa, selezionare il database di origine e la tabella o vista appropriata.Otherwise, select your source database and appropriate table/view. Il database di origine deve essere presente nella stessa istanza di SQL Server di Data Quality ServerData Quality Server per essere visualizzato nell'elenco a discesa Database .Your source database must be present in the same SQL Server instance as Data Quality ServerData Quality Server to be available in the Database drop-down list.

    2. File di Excel: fare clic su Sfogliae selezionare il file di Excel contenente i dati da pulire.Excel File: Click Browse, and select the Excel file that contains the data to be cleansed. Per selezionare un file di Excel, è necessario che Microsoft Excel sia installato nel computer Client Data QualityData Quality Client .Microsoft Excel must be installed on the Client Data QualityData Quality Client computer to select an Excel file. In caso contrario, il pulsante Sfoglia non sarà disponibile e verrà visualizzata una notifica sotto questa casella di testo in cui si avvisa che Microsoft Excel non è installato.Otherwise, the Browse button will not be available, and you will be notified beneath this text box that Microsoft Excel is not installed. Lasciare inoltre selezionata la casella di controllo Utilizza la prima riga come intestazione se la prima riga del file di Excel contiene dati dell'intestazione.Also, leave the Use first row as header check box selected if the first row of the Excel file contains header data.

  2. In Mapping, eseguire il mapping delle colonne di dati nei dati di origine ai domini appropriati della Knowledge Base selezionando una colonna di origine dall'elenco a discesa nella Colonna di origine , quindi selezionando un dominio dall'elenco a discesa nella colonna Dominio della stessa riga.Under Mappings, map the data columns in your source data with appropriate domains in the knowledge base by selecting a source column from the drop-down list in the Source Column column, and then selecting a domain from the drop-down list in the Domain column in the same row. Ripetere questo passaggio per eseguire il mapping di tutte le colonne nei dati di origine ai domini appropriati nella Knowledge Base.Repeat this step to map all the columns in your source data with appropriate domains in the knowledge base. Se necessario, è possibile fare clic sull'icona Aggiungi un mapping colonne per aggiungere righe alla tabella di mapping.If required, you can click the Add a column mapping icon to add rows to the mapping table.

    Nota

    È possibile eseguire il mapping dei dati di origine a un dominio DQS per eseguire la pulizia dei dati solo se il tipo di dati di origine è supportato in DQS e corrisponde al tipo di dati del dominio DQS.You can map your source data to a DQS domain for performing data cleansing only if the source data type is supported in DQS, and matches with the DQS domain data type. Per informazioni sui tipi di dati di origine supportati, vedere Tipi di dati di SQL Server e SSIS supportati per i domini DQS.For information about supported source data types, see Supported SQL Server and SSIS Data Types for DQS Domains.

  3. Fare clic sull'icona Anteprima origine dati per visualizzare i dati nella tabella o vista di SQL Server selezionata o nel foglio di lavoro di Excel selezionato.Click the Preview data source icon to see the data in the SQL Server table or view that you selected, or the Excel worksheet that you selected.

  4. Fare clic su Visualizza/Seleziona domini compositi per visualizzare un elenco dei domini compositi di cui è stato eseguito il mapping a una colonna di origine.Click View/Select Composite Domains to view a list of the composite domains that are mapped to a source column. Questo pulsante è disponibile solo se si dispone di almeno di un dominio composito di cui è stato eseguito il mapping a una colonna di origine.This button is available only if you have at least one composite domain mapped to a source column.

  5. Fare clic su Avanti per procedere alla fase di pulizia computerizzata (paginaPulisci ).Click Next to proceed to the computer-assisted cleansing stage (Cleanse page).

Fase di pulizia computerizzataComputer-Assisted Cleansing Stage

In questa fase viene eseguito un processo automatico di pulizia dei dati tramite il quale i dati di origine vengono analizzati rispetto ai domini di cui è stato eseguito il mapping nella Knowledge Base e vengono apportate o proposte delle modifiche dei dati.In the computer-assisted cleansing stage, you run an automated data cleansing process that analyzes source data against the mapped domains in the knowledge base, and makes/proposes data changes.

  1. Nella pagina Pulisci della procedura guidata Data Quality, fare clic su Avvia per eseguire il processo di pulizia computerizzato.On the Cleanse page of the data quality wizard, click Start to run the computer-assisted cleansing process. DQS utilizza algoritmi e livelli di confidenza avanzati basati sui livelli di soglia specificati per l'analisi dei dati da confrontare alla Knowledge Base selezionata e procedere quindi alla loro pulizia.DQS uses advanced algorithms and confidence levels based on the threshold levels specified to analyze your data against the selected knowledge base, and then cleanse it. Per altre informazioni sulla pulizia assistita da computer in DQS, vedere Pulizia assistita da computer in Pulizia dei dati.For detailed information about how computer-assisted cleansing happens in DQS, see Computer-assisted Cleansing in Data Cleansing.

    Importante

    • Una volta completata l'analisi dei dati, il pulsante Avvia viene sostituito dal pulsante Riavvia .After the data analysis has completed, the Start button turns into a Restart button. Se i risultati dall'analisi precedente non sono stati ancora salvati, facendo clic su Riavvia si causerà la perdita di tali dati non salvati.If the results from the previous analysis have not been saved as yet, clicking Restart will cause that previous data to be lost. Durante l'esecuzione dell'analisi, non lasciare la pagina o il processo di analisi verrà interrotto.As the analysis is running, do not leave the page or the analysis process will be terminated.

      • Se la Knowledge Base utilizzata per il progetto di pulizia è stata aggiornata e pubblicata dopo l'ora di creazione del progetto di pulizia stesso, quando si fa clic su Avvia verrà richiesto se utilizzare la Knowledge Base più recente per la pulizia.If the knowledge base used for the cleansing project was updated and published after the time that the cleansing project was created, clicking Start prompts you whether to use the latest knowledge base for cleansing. Ciò può verificarsi se si è creato un progetto Data Quality utilizzando una Knowledge Base, si è chiuso il progetto di pulizia in esecuzione facendo clic su Chiudi, quindi si è riaperto il progetto Data Quality in un secondo tempo per effettuare la pulizia.This can typically happen if you created a data quality project using a knowledge base, closed the cleansing project mid-way by clicking Close, and then reopened the data quality project at a later point to perform cleansing. Nel frattempo, la Knowledge Base utilizzata nel progetto di pulizia è stata aggiornata e pubblicata.In the meantime, the knowledge base used in the cleansing project was updated and published.

      Analogamente, se la Knowledge Base utilizzata per il progetto di pulizia è stata aggiornata e pubblicata dopo l'ultima esecuzione della pulizia computerizzata, quando si fa clic su Riavvia verrà chiesto se utilizzare la Knowledge Base più recente per la pulizia.Similarly, if the knowledge base used for the cleansing project was updated and published after the last time you ran the computer-assisted cleansing, clicking Restart prompts you whether to use the latest knowledge base for cleansing.

      In entrambi i casi, fare clic su per utilizzare la Knowledge Base aggiornata per la pulizia computerizzata.In both the cases, click Yes to use the updated knowledge base for the computer-assisted cleansing. Inoltre, se è presente qualsiasi conflitto tra i mapping correnti e la Knowledge Base aggiornata (ad esempio domini eliminati o modifiche al tipo di dati del dominio) viene richiesto anche di correggere i mapping correnti per utilizzare la Knowledge Base aggiornata.Additionally, if there are any conflicts between current mappings and the updated knowledge base (such as domains were deleted or domain data type was changed), the message also prompts you to fix the current mappings to use the updated knowledge base. Facendo clic su si passa alla pagina Mappa in cui è possibile correggere i mapping prima di continuare con la pulizia computerizzata.Clicking Yes takes you to the Map page where you can fix the mappings before continuing with the computer-assisted cleansing.

  2. Durante la fase di pulizia computerizzata, è possibile attivare il profiler facendo clic sulla scheda Profiler e visualizzare i dati di profiling e le notifiche in tempo reale.During the computer-assisted cleansing stage, you can switch on the profiler by clicking the Profiler tab to view real-time data profiling and notifications. Per altre informazioni, vedere Statistiche del profiler.For more information, see Profiler Statistics.

  3. Se non si è soddisfatti dei risultati, fare clic su Indietro per tornare alla pagina Mappa , modificare uno o più mapping come desiderato, tornare alla pagina Pulisci , quindi fare clic su Riavvia.If you are not satisfied with the results, then click Back to return to the Map page, modify one or more mappings as necessary, return to the Cleanse page, and then click Restart.

  4. Una volta completato il processo di pulizia computerizzata, fare clic su Avanti per procedere alla fase di pulizia interattiva (paginaGestisci e visualizza risultati ).After the computer-assisted cleansing process is complete, click Next to proceed to the interactive cleansing stage (Manage and View Results page).

Fase di pulizia interattivaInteractive Cleansing Stage

Nella fase di pulizia interattiva, è possibile visualizzare le modifiche proposte da DQS e decidere se implementarle o meno, approvandole o rifiutandole.In the interactive cleansing stage, you can see the changes that DQS has proposed and decide whether to implement them or not by approving or rejecting the changes. Nel riquadro sinistro della pagina Gestisci e visualizza risultati , tramite DQS viene mostrato un elenco di tutti i domini di cui si è eseguito il mapping precedentemente nella fase di mapping, insieme al numero di valori analizzati nei dati di origine rispetto a ciascun dominio durante la fase di pulizia computerizzata.On the left pane of the Manage and view results page, DQS displays a list of all the domains that you mapped earlier in the mapping stage along with the number of values in the source data analyzed against each domain during the computer-assisted cleansing stage. Nel riquadro destro della pagina Gestisci e visualizza risultati , in base al rispetto delle regole di dominio, alle regole relative agli errori di sintassi e ad algoritmi avanzati, tramite DQS i dati vengono suddivisi in categorie in cinque schede, utilizzando il livello di confidenza.On the right pane of the Manage and view results page, based on adherence to the domain rules, syntax error rules, and advanced algorithms, DQS categorizes the data under five tabs using the confidence level. Il livello di confidenza indica il livello di certezza da parte di DQS in relazione a una correzione o suggerimento e si basa sui valori soglia seguenti:The confidence level indicates the extent of certainty of DQS for the correction or suggestion, and is based on the following threshold values:

  • Soglia di correzione automatica: qualsiasi valore con un livello di confidenza al di sopra di questa soglia viene corretto automaticamente da DQS.Auto Correction threshold: Any value that has a confidence level above this threshold is automatically corrected by DQS. L'amministratore dei dati può tuttavia ignorare la modifica durante la pulizia interattiva.However, the data steward can override the change during interactive cleansing. È possibile specificare il valore soglia di correzione automatica nella scheda Impostazioni generali della schermata Configurazione .You can specify the auto correction threshold value in the General Settings tab in the Configuration screen. Per altre informazioni, vedere Configurazione dei valori soglia per le attività di pulizia e di individuazione delle corrispondenze.For more information, see Configure Threshold Values for Cleansing and Matching.

  • Soglia di suggerimento automatico: qualsiasi valore con un livello di confidenza al di sopra di questa soglia, ma al di sotto della soglia di correzione automatica, viene suggerito come valore sostitutivo.Auto Suggestion threshold: Any value that has a confidence level above this threshold, but below the auto correction threshold, is suggested as a replacement value. In DQS la modifica viene apportata solo se approvata dall'amministratore dei dati.DQS will make the change only if the data steward approves it. È possibile specificare il valore soglia di suggerimento automatico nella scheda Impostazioni generali della schermata Configurazione .You can specify the auto suggestion threshold value in the General Settings tab in the Configuration screen. Per altre informazioni, vedere Configurazione dei valori soglia per le attività di pulizia e di individuazione delle corrispondenze.For more information, see Configure Threshold Values for Cleansing and Matching.

  • Altro: qualsiasi valore al di sotto del valore soglia di suggerimento automatico non viene modificato da DQS.Other: Any value below the auto suggestion threshold value is left unchanged by DQS.

    In base al livello di confidenza, i valori vengono visualizzati nelle cinque schede seguenti:Based on the confidence level, the values are displayed under the following five tabs:

SchedaTab DescrizioneDescription
SuggeritiSuggested Mostra i valori del dominio per il quale tramite DQS sono stati trovati valori suggeriti che dispongono di un livello di confidenza più elevato del valore soglia di suggerimento automatico , ma inferiore al valore soglia di correzione automatica .Displays the domain values for which DQS found the suggested values that have a confidence level higher than the auto-suggestion threshold value but lower than the auto-correction threshold value.

Nella colonna Correggi in vengono visualizzati i valori suggeriti rispetto al valore originale.The suggested values are displayed in the Correct To column against the original value. È possibile fare clic sul pulsante di opzione nella colonna Approva o Rifiuta rispetto a un valore nella griglia superiore per accettare o rifiutare il suggerimento per tutte le istanze di tale valore.You can click the radio button in the Approve or Reject column against a value in the upper grid to accept or reject the suggestion for all the instances of the value. In questo caso, il valore accettato viene spostato nella scheda Con correzione e il valore respinto viene spostato nella scheda Non validi .In this case, the accepted value moves to the Corrected tab and the rejected value moves to the Invalid tab.
NuoviNew Mostra il dominio valido per il quale DQS non dispone di informazioni sufficienti e del quale non è pertanto possibile eseguire il mapping a nessuna altra scheda. Questa scheda contiene inoltre valori che presentano un livello di confidenza inferiore al valore soglia di suggerimento automatico , ma sufficientemente elevato per essere contrassegnati come validi.Displays the valid domain for which DQS does not have enough information, and therefore cannot be mapped to any other tab. Further, this tab also contains values that have confidence level less than the auto-suggestion threshold value, but high enough to be marked as valid.

Se il valore è ritenuto corretto, fare clic sul pulsante di opzione nella colonna Approva .If you think the value is correct, click the radio button in the Approve column. Altrimenti, fare clic sul pulsante di opzione nella colonna Rifiuta .Else, click the radio button in the Reject column. Il valore accettato viene spostato nella scheda Corretti e il valore respinto viene spostato nella scheda Non validi . È anche possibile digitare il valore corretto manualmente sostituendo il valore originale nella colonna Correggi in e fare clic sul pulsante di opzione nella colonna Approva per accettare la modifica.The accepted value moves to the Correct tab and the rejected value moves to the Invalid tab. You can also manually type the correct value as a replacement for the original value in the Correct To column against the value, and then click the radio button in the Approve column to accept the change. In questo caso, il valore viene spostato nella scheda Con correzione .In this case, the value moves to the Corrected tab.
Non validiInvalid Mostra i valori del dominio contrassegnati come non validi nel dominio della Knowledge Base o i valori che non hanno superato una regola di dominio.Displays the domain values that were marked as invalid in the domain in the knowledge base or values that failed a domain rule. Questa scheda contiene inoltre i valori rifiutati dall'utente in qualsiasi delle altre quattro schede.This tab also contains values that were rejected by the user in any of the other four tabs.

Se il valore è ritenuto corretto, tuttavia, è possibile fare clic sul pulsante di opzione nella colonna Approva .However, if you think the value is correct, click the radio button in the Approve column. Il valore accettato viene spostato nella scheda Corretti . È anche possibile digitare il valore corretto manualmente sostituendo il valore originale nella colonna Correggi in e fare clic sul pulsante di opzione nella colonna Approva per accettare la modifica.The accepted value moves to the Correct tab. You can also manually type the correct value as a replacement for the original value in the Correct To column against the value, and then click the radio button in the Approve column to accept the change. In questo caso, il valore viene spostato nella scheda Con correzione .In this case, the value moves to the Corrected tab.
Con correzioneCorrected Visualizza i valori di dominio corretti da DQS durante il processo automatico di pulizia, nel caso in cui sia stata trovata una correzione per il valore con un livello di confidenza superiore al valore soglia di correzione automatica.Displays the domain values that are corrected by DQS during the automated cleansing process as DQS found a correction for the value with confidence level above the auto-correction threshold value.

Nella colonna Correggi in vengono visualizzati i valori con correzione rispetto al valore originale.The corrected values are displayed in the Correct To column against the original value. Per impostazione predefinita, il pulsante di opzione nella colonna Approva per il valore viene selezionato.By default, the radio button in the Approve column against the value is selected. Se necessario, è possibile rifiutare la correzione proposta facendo clic sul pulsante di opzione nella colonna Rifiuta per spostarlo nella scheda Non validi o digitare manualmente il valore corretto nella colonna Correggi in , quindi fare clic sul pulsante di opzione nella colonna Approva per accettare la modifica e spostare il valore nella scheda Con correzione .If required, you can reject the proposed correction by clicking the radio button in the Reject column to move it to the Invalid tab, or manually type correct value in the Correct To column, and then click the radio button in the Approve column to accept the change, and move it to the Corrected tab.
CorrettiCorrect Mostra i valori di dominio che sono risultati corretti,Displays the domain values that were found correct. Ad esempio, un valore corrispondente a un valore di dominio.For example, the value matched a domain value. Questa scheda contiene anche valori approvati dall'utente facendo clic sul pulsante di opzione nella colonna Approva nelle schede Nuovi e Non validi .This tab also contains values that were approved by the user by clicking the radio button in the Approve column in the New and Invalid tabs.

Per impostazione predefinita, il pulsante di opzione nella colonna Approva è selezionato per ciascun valore.By default, the radio button in the Approve column is selected against each value. Se tuttavia si ritiene che un valore in questa scheda sia errato, è possibile fare clic sul pulsante di opzione nella colonna Rifiuta per quel valore e spostarlo nella scheda Non validi oppure digitare manualmente il valore corretto con cui sostituirlo nella colonna Correggi in , quindi fare clic sul pulsante di opzione nella colonna Approva per accettare la modifica e spostarlo nella scheda Con correzione .However, if you think that a value in this tab is incorrect, you can either click the radio button in the Reject column against the value to move it to the Invalid tab, or manually type the correct value as a replacement for the value in the Correct To column against the value, and then click the radio button in the Approve column to accept the change, and move it to the Corrected tab.

Per pulire i dati in modo interattivo:To interactively cleanse the data:

  1. Nella pagina Gestisci e visualizza risultati della procedura guidata Data Quality per la pulizia dei dati, fare clic su un nome di dominio nel riquadro sinistro.On the Manage and view results page of the cleansing data quality wizard, click on a domain name in the left pane.

  2. Rivedere i valori di dominio nelle cinque schede e intraprendere le azioni appropriate come illustrato in precedenza.Review the domain values under the five tabs, and take appropriate action as explained earlier.

    • Nel riquadro superiore destro vengono visualizzate le informazioni seguenti per ciascun valore nel dominio selezionato: il valore originale, il numero di istanze (record), una casella per specificare un altro valore (corretto), il livello di confidenza (non disponibile per i valori nella scheda Corretti ), il motivo per l'azione DQS sul valore, l'opzione per approvare e rifiutare le correzioni e i suggerimenti per il valore.The right-upper pane displays the following information for each value in the selected domain: original value, number of instances (records), a box to specify another (correct) value, the confidence level (not available for the values under the Correct tab), the reason for the DQS action on the value, and the option to approve and reject the corrections and suggestions for the value.

      Suggerimento

      È possibile approvare o rifiutare tutti i valori nel dominio selezionato nel riquadro superiore destro facendo clic rispettivamente sull'icona Approva tutti i termini o Rifiuta tutti i termini .You can approve or reject all the values in the selected domain in the upper-right pane by clicking Approve all terms or Reject all terms icon respectively. Alternativamente, è possibile fare clic con il pulsante destro del mouse su un valore nel dominio selezionato e scegliere Accetta tutto o Rifiuta tutto dal menu di scelta rapida.Alternately, you can right-click a value in the selected domain, and click Accept all or Reject all in the shortcut menu.

    • Nel riquadro inferiore vengono visualizzate occorrenze singole del valore di dominio selezionato nel riquadro superiore destro.The lower pane displays individual occurrences of the domain value selected in the right-upper pane. Nel superiore destro vengono visualizzate le informazioni seguenti: una casella per specificare un altro valore (corretto), il livello di confidenza (non disponibile per i valori nella scheda Corretti ), il motivo per l'azione DQS sul valore, l'opzione per approvare e rifiutare le correzioni, i suggerimenti per il valore e il valore originale.The following information is displayed: a box to specify another (correct) value, the confidence level (not available for the values under the Correct tab), the reason for the DQS action on the value, option to approve and reject the corrections and suggestions for the value, and the original value.

  3. Se è stata abilitata la funzionalità Correttore ortografico per un dominio durante la sua creazione, vengono visualizzati dei caratteri di sottolineatura rossi ondulati insieme a quei valori di dominio identificati come potenziali errori.If you enabled the Speller feature for a domain while creating it, wavy red underscores are displayed against such domain values that are identified as potential error. La sottolineatura viene visualizzata per l'intero valore.The underscore is displayed for the entire value. Se ad esempio "New York" è stato erroneamente digitato "Neu York", la sottolineatura rossa verrà visualizzata sotto "Neu York" e non solo sotto "Neu."For example, if “New York” is incorrectly spelled as “Neu York”, the speller will display red underscore under “Neu York”, and not just “Neu”. Se si fa clic con il pulsante destro del mouse sul valore, verranno visualizzate le correzioni suggerite.If you right-click the value, you will see suggested corrections. Se sono presenti più di 5 suggerimenti, è possibile fare clic su Ulteriori suggerimenti nel menu di scelta rapida per visualizzare quelli rimanenti.If there are more than 5 suggestions, you can click More suggestions in the context menu to view the rest of them. Così come avviene per la visualizzazione degli errori, i suggerimenti rappresentano sostituzioni per l'intero valore.As with the error display, the suggestions are replacements for the whole value. Il suggerimento visualizzato per l'esempio precedente sarà ad esempio "New York" e non solo "New".For example, “New York” will be displayed as a suggestion in the previous example, and not just “New”. È possibile scegliere uno dei suggerimenti o aggiungere al dizionario una voce da visualizzare per quel valore.You can pick one of the suggestions or add a value to the dictionary to be displayed for that value. I valori vengono archiviati nel dizionario a livello di account utente.Values are stored in dictionary at a user account level. Quando si seleziona un suggerimento dal menu di scelta rapida del correttore ortografico, tale suggerimento viene aggiunto alla colonna Correggi in .When you select a suggestion from the speller context menu, the selected suggestion will be added to the Correct To column. Se si seleziona un suggerimento nella colonna Correggi in , tuttavia, il valore nella colonna viene sostituito dal suggerimento selezionato.However, if you select a suggestion in the Correct To column, the value in the column is replaced by the selected suggestion.

    La funzionalità di correzione ortografica è abilitata per impostazione predefinita nella fase di pulizia interattiva.The speller feature is enabled by default in the interactive cleansing stage. È possibile disabilitare il correttore ortografico nella fase di pulizia interattiva facendo clic sull'icona Abilita/Disabilita correttore ortografico o facendo clic con il pulsante destro del mouse nell'area dei valori di dominio e scegliendo Correttore ortografico dal menu di scelta rapida.You can disable speller in the interactive cleansing stage by clicking the Enable/Disable Speller icon, or right-clicking in the domain values area, and then clicking Speller in the shortcut menu. Per abilitarlo nuovamente, seguire la stessa procedura.To enable it back again, do the same.

    Nota

    La funzionalità di correzione ortografica è disponibile solo nel riquadro superiore (valori di dominio).The speller feature is only available in the upper pane (domain values). Non è inoltre possibile abilitare o disabilitare il correttore ortografico per domini compositi.Moreover, you cannot enable or disable speller for composite domains. Per i domini figlio di tipo stringa abilitati per la funzionalità di correzione ortografica in un dominio composito, tale funzionalità viene abilitata per impostazione predefinita durante la fase di pulizia interattiva.The child domains in a composite domain that are of string type, and are enabled for the speller feature, will have the speller functionality enabled in the interactive cleansing stage, by default.

  4. Durante la fase di pulizia interattiva, è possibile attivare il profiler facendo clic sulla scheda Profiler e visualizzare i dati di profiling e le notifiche in tempo reale.During the interactive cleansing stage, you can switch on the profiler by clicking the Profiler tab to view real-time data profiling and notifications. Per altre informazioni, vedere Statistiche del profiler.For more information, see Profiler Statistics.

  5. Dopo avere rivisto tutti i valori di dominio, fare clic su Avanti per procedere alla fase di esportazione.After you have reviewed all the domain values, click Next to proceed to the export stage.

Fase di esportazioneExport Stage

Nella fase di esportazione si specificano i parametri per indicare quali dati puliti esportare e in quale ubicazione.In the export stage, you specify the parameters for exporting your cleansed data: what and where to export.

  1. Nella pagina Esporta della procedura guidata Data Quality per la pulizia dei dati, selezionare il tipo di destinazione per l'esportazione dei dati puliti: SQL Server, File CSVo File di Excel.On the Export page of the cleansing data quality wizard, select the destination type for exporting your cleansed data: SQL Server, CSV File, or Excel File.

    Importante

    Se si utilizza la versione a 64 bit di Excel, non è possibile esportare i propri dati puliti in un file di Excel. È possibile eseguire l'esportazione solo in un database di SQL Server o in un file con estensione csv.If you are using 64-bit version of Excel, you cannot export your cleansed data to an Excel file; you can export only to a SQL Server database or to a .csv file.

    1. SQL Server: scegliere DQS_STAGING_DATA come database di destinazione se si desidera esportare i dati in esso, quindi specificare un nome di tabella che verrà creata per archiviare i dati esportati.SQL Server: Select DQS_STAGING_DATA as the destination database if you want to export your data here, and then specify a table name that will be created to store your exported data. Altrimenti, se si desidera esportare i dati in un database diverso, sceglierlo e specificare un nome di tabella che verrà creata per archiviare i dati esportati.Otherwise, select another database if you want to export data to a different database, and then specify a table name that will be created to store your exported data. Il database di destinazione deve essere presente nella stessa istanza di SQL Server di Data Quality ServerData Quality Server per essere visualizzato nell'elenco a discesa Database .Your destination database must be present in the same SQL Server instance as Data Quality ServerData Quality Server to be available in the Database drop-down list.

    2. File CSV: fare clic su Sfogliae specificare il nome e il percorso del file csv nel quale si desidera esportare i dati puliti.CSV File: Click Browse, and specify the name and location of the .csv file where you want to export the cleansed data. È anche possibile digitare il nome per il file csv insieme al percorso completo in cui si desidera esportare i dati puliti,You can also type the file name for the .csv file along with the full path where you want to export the cleansed data. ad esempio, "C:\ExportedData.csv".For example, “c:\ExportedData.csv”. Il file viene salvato nel computer in cui è installato Data Quality ServerData Quality Server .The file is saved on the computer where Data Quality ServerData Quality Server is installed.

    3. File di Excel: fare clic su Sfogliae specificare il nome e il percorso del file di Excel nel quale si desidera esportare i dati puliti.Excel File: Click Browse, and specify the name and location of the Excel file where you want to export the cleansed data. È anche possibile digitare il nome per il file di Excel insieme al percorso completo in cui si desidera esportare i dati puliti,You can also type the file name for the Excel file along with the full path where you want to export the cleansed data. Ad esempio, "C:\ExportedData.xlsx”.For example, “c:\ExportedData.xlsx”. Il file viene salvato nel computer in cui è installato Data Quality ServerData Quality Server .The file is saved on the computer where Data Quality ServerData Quality Server is installed.

  2. Selezionare la casella di controllo Standardizzare output per standardizzare l'output in base al formato selezionato per il dominio.Select the Standardize Output check box to standardize the output based on the output format selected for the domain. Ad esempio, modificare il valore stringa in caratteri maiuscoli o cambiare al maiuscolo l'iniziale della parola.For example, change the string value to upper case or capitalize the first letter of the word. Per informazioni sulla specifica del formato di output di un dominio, vedere l'elenco Formato output in in Imposta proprietà del dominio.For information about specifying the output format of a domain, see the Format Output to list in Set Domain Properties.

  3. Selezionare quindi l'output dei dati: esportare solo i dati puliti o i dati puliti insieme alle informazioni relative alla pulizia.Next, select the data output: export just the cleansed data or export cleansed data along with the cleansing information.

    • Solo dati: fare clic sul pulsante di opzione per esportare solo i dati puliti.Data Only: Click the radio button to export just the cleansed data.

    • Dati e informazioni pulizia: fare clic sul pulsante di opzione per esportare i dati seguenti per ogni dominio:Data and Cleansing Info: Click the radio button to export the following data for each domain:

      • <Dominio>_Source: il valore originale nel dominio.<Domain>_Source: The original value in the domain.

      • <Dominio>_Output: i valori puliti nel dominio.<Domain>_Output: The cleansed values in the domain.

      • <Dominio>_Reason: il motivo specificato per la correzione del valore.<Domain>_Reason: The reason specified for the correction of the value.

      • <Dominio>_Confidence: il livello di attendibilità per tutti i termini corretti.<Domain>_Confidence: The confidence level for all the terms that were corrected. Viene visualizzato come valore decimale equivalente al valore percentuale corrispondente.It is displayed as the decimal value equivalent to the corresponding percentage value. Un livello di confidenza del 95% viene ad esempio visualizzato come 0,9500000.For example, a confidence level of 95% will be displayed as .9500000.

      • <Dominio>_Status: lo stato del valore del dominio dopo la pulizia dei dati.<Domain>_Status: The status of the domain value after data cleansing. Ad esempio Suggeriti, Nuovi, Non validi, Con correzioneo Corretti.For example, Suggested, New, Invalid, Corrected, or Correct.

      • Stato record: oltre a includere un campo di stato per ogni dominio di cui è stato eseguito il mapping (<NomeDominio>_Status), il campo Stato record visualizza lo stato di un record.Record Status: Apart from having a status field for each mapped domain (<DomainName>_Status), the Record Status field displays the status for a record. Se uno stato del dominio nel record è Nuovi o Corretti, il valore di Stato record viene impostato su Corretti.If any of the domain’s status in the record is New or Correct, the Record Status is set to Correct. Se uno stato del dominio nel record è Suggeriti, Non validio Con correzione, il valore di Stato record viene impostato sul rispettivo valore.If any of the domain’s status in the record is Suggested, Invalid, or Corrected, the Record Status is set to the respective value. Ad esempio, se uno stato del dominio nel record è Suggeriti, il valore di Stato record viene impostato su Suggeriti.For example, if any of the domain’s status in the record is Suggested, the Record Status is set to Suggested.

        Nota

        Se si utilizza un servizio dati di riferimento per l'operazione di pulizia, sono disponibili dati aggiuntivi sui valori di dominio per l'esportazione.If you use reference data service for the cleansing operation, some additional data about the domain value is also available for exporting. Per altre informazioni, vedere Pulire i dati mediante le informazioni dei dati di riferimento (esterni).For more information, see Cleanse Data Using Reference Data (External) Knowledge.

  4. Fare clic su Esporta per esportare i dati nella destinazione selezionata.Click Export to export data to the selected data destination. Se si è selezionatoIf you selected:

    • SQL Server come destinazione dei dati, nel database selezionato verrà creata una nuova tabella con il nome specificato.SQL Server as the data destination, a new table with the specified name will be created in the selected database.

    • File CSV come destinazione dei dati, verrà creato un file csv nel percorso nel computer Data Quality ServerData Quality Server con il nome file specificato in precedenza nella casella Nome file CSV .CSV File as the data destination, a .csv file will be created at the location on the Data Quality ServerData Quality Server computer with the file name that you specified earlier in the CSV File name box.

    • File di Excel come destinazione dei dati, verrà creato un file di Excel nel percorso nel computer Data Quality ServerData Quality Server con il nome file specificato in precedenza nella casella Nome file di Excel .Excel File as the data destination, an Excel file will be created at the location on the Data Quality ServerData Quality Server computer with the file name that you specified earlier in the Excel file name box.

  5. Fare clic su Fine per chiudere il progetto Data Quality.Click Finish to close the data quality project.

Profiler StatisticsProfiler Statistics

La scheda Profiler fornisce statistiche che indicano la qualità dei dati di origine.The Profiler tab provides statistics that indicate the quality of the source data. Il profiling consente di valutare il livello di efficacia dell'attività di pulizia dei dati e potenzialmente di determinare in quale misura tale attività è stata in grado di migliorare la qualità dei dati.Profiling helps you assess the effectiveness of the data cleansing activity, and you can potentially determine the extent to which data cleansing was able to improve the quality of the data.

La scheda Profiler fornisce le statistiche seguenti per i dati di origine, per campo e dominio:The Profiler tab provides the following statistics for the source data, by field and domain:

  • Record: il numero di record nei dati di esempio analizzati per l'attività di pulizia dei datiRecords: How many records in the data sample were analyzed for the data cleansing activity

  • Record corretti: il numero di record che sono risultati correttiCorrect Records: How many records were found to be correct

  • Record con correzione: il numero di record cui sono state apportate correzioniCorrected Records: How many records were corrected

  • Record suggeriti: il numero di record che sono stati suggeritiSuggested Records: How many records were suggested

  • Record non validi: il numero di record che sono risultati non validiInvalid Records: How many records were invalid

    Le statistiche relative ai campi includono:The field statistics include the following:

  • Campo: nome del campo nei dati di origineField: Name of the field in the source data

  • Dominio: nome del dominio di cui è stato eseguito il mapping al campoDomain: Name of the domain that maps to the field

  • Valori con correzione: il numero di valori di dominio che sono stati correttiCorrected Values: The number of domain values that were corrected

  • Valori consigliati: il numero di valori di dominio che sono stati suggeritiSuggested Values: The number of domain values that were suggested

  • Completezza: la completezza di ogni campo di origine di cui è stato eseguito il mapping per l'attività di puliziaCompleteness: The completeness of each source field that is mapped for the cleansing activity

  • Accuratezza: l'accuratezza di ogni campo di origine di cui è stato eseguito il mapping per l'attività di puliziaAccuracy: The accuracy of each source field that is mapped for the cleansing activity

    Il profiling DQS fornisce due dimensioni della qualità dei dati: completezza (l'entità della presenza dei dati) e accuratezza (la misura entro cui i dati possono essere utilizzati per gli scopi previsti).DQS profiling provides two data quality dimensions: completeness (the extent to which data is present) and accuracy (the extent to which data can be used for its intended use). Se il profiling suggerisce che un campo è relativamente incompleto, è necessario rimuoverlo dalla Knowledge Base di un progetto Data Quality.If profiling is telling you that a field is relatively incomplete, you might want to remove it from the knowledge base of a data quality project. È possibile che il profiling non fornisca statistiche di completezza affidabili per i domini compositi.Profiling may not provide reliable completeness statistics for composite domains. Se sono necessarie statistiche di completezza, utilizzare domini singoli anziché domini compositi.If you need completeness statistics, use single domains instead of composite domains. Se si desidera utilizzare domini compositi, è consigliabile creare una Knowledge Base con domini singoli di cui eseguire il profiling per determinare la completezza, quindi creare un altro dominio con un dominio composito per il processo di pulizia.If you want to use composite domains, you may want to create one knowledge base with single domains for profiling, to determine completeness, and create another domain with a composite domain for the cleansing process. Ad esempio, il profiling potrebbe mostrare una completezza del 95% per record relativi a indirizzi, utilizzando un dominio composito, ma potrebbe esservi un livello di incompletezza molto più alto per una delle colonne, ad esempio una colonna relativa al codice postale (CAP).For example, profiling could show 95% completeness for address records using a composite domain, but there could be a much higher level of incompleteness for one of the columns, for example, a postal (zip) code column. In questo esempio, è necessario misurare la completezza della colonna del CAP con un solo dominio.In this example, you might want to measure the completeness of the zip code column with a single domain. Il profiling fornirà probabilmente statistiche di accuratezza affidabili per i domini compositi perché è possibile misurare l'accuratezza di più colonne allo stesso tempo.Profiling will likely provide reliable accuracy statistics for composite domains because you can measure accuracy for multiple columns together. Il valore di questi dati sta nell'aggregazione composta, pertanto è consigliabile misurarne l'accuratezza con un dominio composito.The value of this data is in the composite aggregation, so you may want to measure the accuracy with a composite domain.

    Se non si utilizza un servizio dati di riferimento, le statistiche di accuratezza richiederanno probabilmente un maggior livello di interpretazione.Accuracy statistics will likely require more interpretation if you are not using a reference data service. Se si utilizza un servizio dati di riferimento per la pulizia dei dati, si otterrà un certo livello di attendibilità nelle statistiche di accuratezza.If you are using a reference data service for data cleansing, you will have a level of trust in accuracy statistics. Per altre informazioni sulla pulizia dei dati mediante il servizio dati di riferimento, vedere Pulire i dati mediante le informazioni dei dati di riferimento ( esterni ).For more information about data cleansing using reference data service, see Cleanse Data Using Reference Data (External) Knowledge.

Notifiche relative alla puliziaCleansing Notifications

Le condizioni seguenti danno luogo a notifiche:The following conditions result in notifications:

  • Non sono presenti correzioni o suggerimenti per un campo.There are no corrections or suggestions for a field. Potrebbe essere necessario rimuovere tale campo dal mapping, eseguire prima l'individuazione delle informazioni oppure utilizzare una Knowledge Base diversa.You might want to remove it from mapping, run knowledge discovery first, or use another knowledge base.

  • È presente un numero relativamente basso di correzioni o suggerimenti per un campo.There are relatively few corrections or suggestions for a field. Potrebbe essere necessario rimuovere tale campo dal mapping, eseguire prima l'individuazione delle informazioni oppure utilizzare una Knowledge Base diversa.You might want to remove it from mapping, run knowledge discovery first, or use another knowledge base.

  • Il livello di accuratezza del campo è molto basso.The accuracy level of the field is very low. Potrebbe essere necessario verificare il mapping o considerare l'esecuzione dell'individuazione delle informazioni.You might want to verify the mapping, or consider running knowledge discovery first.

    Per ulteriori informazioni sul profiling, vedere Profiling di dati e notifiche in DQS.For more information about profiling, see Data Profiling and Notifications in DQS.