Trasformazione DQS CleansingDQS Cleansing Transformation

La trasformazione DQS Cleansing utilizza Data Quality Services (DQS) per correggere i dati da un'origine dati connessa, applicando le regole approvate create per l'origine dati connessa o un'origine dati simile.The DQS Cleansing transformation uses Data Quality Services (DQS) to correct data from a connected data source, by applying approved rules that were created for the connected data source or a similar data source. Per ulteriori informazioni sulle regole di correzione dei dati, vedere DQS Knowledge Bases and Domains.For more information about data correction rules, see DQS Knowledge Bases and Domains. Per ulteriori informazioni su DQS, vedere Data Quality Services Concepts.For more information DQS, see Data Quality Services Concepts.

Per determinare se è necessario correggere i dati, la trasformazione DQS Cleansing elabora i dati da una colonna di input quando le condizioni seguenti sono vere:To determine whether the data has to be corrected, the DQS Cleansing transformation processes data from an input column when the following conditions are true:

  • La colonna è selezionata per la correzione dei dati.The column is selected for data correction.

  • Il tipo di dati della colonna è supportato per la correzione dei dati.The column data type is supported for data correction.

  • È stato eseguito il mapping della colonna a un dominio con un tipo di dati compatibile.The column is mapped a domain that has a compatible data type.

    La trasformazione include inoltre un output degli errori da configurare per gestire gli errori a livello di riga.The transformation also includes an error output that you configure to handle row-level errors. Per configurare l'output degli errori, utilizzare Editor trasformazione DQS Cleansing.To configure the error output, use the DQS Cleansing Transformation Editor.

    È possibile includere Fuzzy Grouping Transformation nel flusso di dati per identificare righe di dati che probabilmente sono duplicati.You can include the Fuzzy Grouping Transformation in the data flow to identify rows of data that are likely to be duplicates.

Progetti Data Quality e valoriData Quality Projects and Values

Quando si elaborano i dati con la trasformazione DQS Cleansing, viene creato un progetto di pulizia nel server Data Quality.When you process data with the DQS Cleansing transformation, a cleansing project is created on the Data Quality Server. È possibile utilizzare il client Data Quality per gestire il progetto.You use the Data Quality Client to manage the project. Inoltre, è possibile utilizzare il client Data Quality per importare i valori del progetto in un dominio di una Knowledge Base in DQS.In addition, you can use the Data Quality Client to import the project values into a DQS knowledge base domain. È possibile importare i valori solo in un dominio (o dominio collegato) configurato per l'utilizzo dalla trasformazione DQS Cleansing.You can import the values only to a domain (or linked domain) that the DQS Cleansing transformation was configured to use.

Finestra di dialogo Editor trasformazione DQS CleansingDQS Cleansing Transformation Editor Dialog Box

Usare la finestra di dialogo Editor trasformazione DQS Cleansing per correggere dati usando Data Quality Services (DQS).Use the DQS Cleansing Transformation Editor dialog box to correct data using Data Quality Services (DQS). Per altre informazioni, vedere Concetti di Data Quality Services.For more information, see Data Quality Services Concepts.

Per saperne di piùWhat do you want to do?

Aprire Editor trasformazione DQS Cleansing Open the DQS Cleansing Transformation Editor

  1. Aggiungere la trasformazione DQS Cleansing al pacchetto Integration ServicesIntegration Services in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT).Add the DQS Cleansing Transformation to Integration ServicesIntegration Services package, in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT).

  2. Fare clic con il pulsante destro del mouse sul componente e quindi scegliere Modifica.Right-click the component and then click Edit.

Impostare le opzioni nella scheda Gestione connessione Set options on the Connection Manager tab

Gestione connessione Data QualityData quality connection manager
Consente di selezionare una gestione connessione DQS esistente nell'elenco oppure di crearne una facendo clic sul pulsante Nuova.Select an existing DQS connection manager from the list, or create a new connection by clicking New.

NuovaNew
Consente di creare una nuova gestione connessione usando la finestra di dialogo Gestione connessione DQS Cleansing .Create a new connection manager by using the DQS Cleansing Connection Manager dialog box. Per altre informazioni, vedere Impostare le opzioni nella finestra di dialogo Gestione connessione DQS Cleansing.See Set the options in the DQS Cleansing Connection Manager dialog box

Data Quality Knowledge BaseData Quality Knowledge Base
Selezionare una Knowledge Base DQS esistente per l'origine dati connessa.Select an existing DQS knowledge base for the connected data source. Per altre informazioni sulla Knowledge Base DQS, vedere Knowledge Base e domini DQS.For more information about the DQS knowledge base, see DQS Knowledge Bases and Domains.

Crittografia connessioneEncrypt connection
Consente di specificare se crittografare la connessione, per crittografare il trasferimento dei dati tra il Server DQS e Integration ServicesIntegration Services.Specifiy whether to encrypt the connection, in order to encrypt the data transfer between the DQS Server and Integration ServicesIntegration Services.

Domini disponibiliAvailable domains
Consente di elencare i domini disponibili per la Knowledge Base selezionata.Lists the available domains for the selected knowledge base. Esistono due tipi di domini, cioè singoli e composti. In questi ultimi sono contenuti due o più domini singoli.There are two types of domains: single domains, and composite domains that contain two or more single domains.

Per informazioni su come eseguire il mapping di colonne a domini composti, vedere Eseguire il mapping delle colonne ai domini compositi.For information on how to map columns to composite domains, see Map Columns to Composite Domains.

Per altre informazioni sui domini, vedere Knowledge Base e domini DQS.For more information about domains, see DQS Knowledge Bases and Domains.

Configura output erroriConfigure Error Output
Consente di specificare come gestire gli errori a livello di riga.Specify how to handle row-level errors. Possono verificarsi degli errori quando la trasformazione corregge i dati dall'origine dati connessa, a causa di valori di dati o vincoli di convalida non previsti.Errors can occur when the transformation corrects data from the connected data source, due to unexpected data values or validation constraints.

Di seguito sono riportati i valori validi:The following are the valid values:

  • Interrompi componente: indica che la trasformazione ha esito negativo e che i dati di input non vengono inseriti nel database Data Quality Services.Fail Component, which indicates that the transformation fails and the input data is not inserted into the Data Quality Services database. Si tratta del valore predefinito.This is the default value.

  • Reindirizza riga: indica che i dati di input non vengono inseriti nel database di Data Quality Services e che vengono reindirizzati all'output degli errori.Redirect Row, which indicates that the input data is not inserted into the Data Quality Services database and is redirected to the error output.

Impostare le opzioni nella scheda Mapping Set options on the Mapping tab

Per informazioni su come eseguire il mapping di colonne a domini composti, vedere Eseguire il mapping delle colonne ai domini compositi.For information on how to map columns to composite domains, see Map Columns to Composite Domains.

Colonne di input disponibiliAvailable Input Columns
Elenca le colonne dall'origine dati connessa.Lists the columns from the connected data source. Selezionare una o più colonne contenenti i dati che si desidera correggere.Select one or more columns that contain data that you want to correct.

Colonna di inputInput Column
Elenca una colonna di input selezionata nell'area Colonne di input disponibili .Lists an input column that you selected in the Available Input Columns area.

DominioDomain
Consente di selezionare un dominio di cui si desidera eseguire il mapping alle colonne di input.Select a domain to map to the input column.

Alias di origineSource Alias
Consente di visualizzare la colonna di origine contenente il valore della colonna originale.Lists the source column that contains the original column value.

Fare clic all'interno del campo per modificare il nome della colonna.Click in the field to modify the column name.

Alias di outputOutput Alias
Consente di visualizzare la colonna che viene restituita da Trasformazione DQS Cleansing.Lists the column that is outputted by the DQS Cleansing Transformation. La colonna contiene il valore della colonna originale o il valore corretto.The column contains the original column value or the corrected value.

Fare clic all'interno del campo per modificare il nome della colonna.Click in the field to modify the column name.

Alias di statoStatus Alias
Consente di visualizzare la colonna contenente le informazioni sullo stato per i dati corretti.Lists the column that contains status information for the corrected data. Fare clic all'interno del campo per modificare il nome della colonna.Click in the field to modify the column name.

Impostare le opzioni nella scheda Avanzate Set options on the Advanced tab

Standardizzare outputStandardize output
Consente di specificare se restituire i dati nel formato standardizzato basato sul formato di output definito per i domini.Indicate whether to output the data in the standardized format based on the output format defined for domains. Per altre informazioni sul formato standardizzato, vedere Pulizia dei dati.For more information about standardized format, see Data Cleansing.

ConfidenzaConfidence
Consente di specificare se includere il livello di confidenza per i dati corretti.Indicate whether to include the confidence level for corrected data. Il livello di confidenza indica il livello di certezza di DQS in relazione a correzione o suggerimento.The confidence level indicates the extend of certainty of DQS for the correction or suggestion. Per altre informazioni sui livelli di confidenza, vedere Pulizia dei dati.For more information about confidence levels, see Data Cleansing.

MotivoReason
Consente di specificare se includere il motivo per la correzione dei dati.Indicate whether to include the reason for the data correction.

Dati accodatiAppended Data
Consente di specificare se restituire dati aggiuntivi ricevuti da un provider di dati di riferimento esistente.Indicate whether to output additional data that is received from an existing reference data provider. Per altre informazioni, vedere Reference Data Services in DQS.For more information, see Reference Data Services in DQS.

Schema dati accodatiAppended Data Schema
Consente di specificare se restituire lo schema dati.Indicate whether to output the data schema. Per altre informazioni, vedere Collegare un dominio o un dominio composito ai dati di riferimento.For more information, see Attach Domain or Composite Domain to Reference Data.

Impostare le opzioni nella finestra di dialogo Gestione connessione DQS Cleansing Set the options in the DQS Cleansing Connection Manager dialog box

Nome serverServer name
Selezionare o digitare il nome del server DQS a cui si desidera connettersi.Select or type the name of the DQS server that you want to connect to. Per altre informazioni sul server, vedere Amministrazione DQS.For more information about the server, see DQS Administration.

Test connessioneTest Connection
Fare clic per verificare che la connessione specificata sia disponibile.Click to confirm that the connection that you specified is viable.

È anche possibile aprire la finestra di dialogo Gestione connessione DQS Cleansing dall'area relativa alle connessioni eseguendo queste operazioni:You can also open the DQS Cleansing Connection Manager dialog box from the connections area, by doing the following:

  1. In SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT), aprire un progetto di Integration ServicesIntegration Services esistente o crearne uno nuovo.In SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT), open an existing Integration ServicesIntegration Services project or create a new one.

  2. Fare clic con il pulsante destro sull'area relativa alle connessioni, scegliere Nuova connessionee quindi fare clic su DQS.Right-click in the connections area, click New Connection, and then click DQS.

  3. Scegliere Aggiungi.Click Add.