Trasformazione DQS Cleansing

Si applica a:SQL Server SSIS Integration Runtime in Azure Data Factory

La trasformazione DQS Cleansing utilizza Data Quality Services (DQS) per correggere i dati da un'origine dati connessa, applicando le regole approvate create per l'origine dati connessa o un'origine dati simile. Per ulteriori informazioni sulle regole di correzione dei dati, vedere DQS Knowledge Bases and Domains. Per ulteriori informazioni su DQS, vedere Data Quality Services Concepts.

Per determinare se è necessario correggere i dati, la trasformazione DQS Cleansing elabora i dati da una colonna di input quando le condizioni seguenti sono vere:

  • La colonna è selezionata per la correzione dei dati.

  • Il tipo di dati della colonna è supportato per la correzione dei dati.

  • È stato eseguito il mapping della colonna a un dominio con un tipo di dati compatibile.

La trasformazione include inoltre un output degli errori da configurare per gestire gli errori a livello di riga. Per configurare l'output degli errori, utilizzare Editor trasformazione DQS Cleansing.

È possibile includere Fuzzy Grouping Transformation nel flusso di dati per identificare righe di dati che probabilmente sono duplicati.

Progetti Data Quality e valori

Quando si elaborano i dati con la trasformazione DQS Cleansing, viene creato un progetto di pulizia nel server Data Quality. È possibile utilizzare il client Data Quality per gestire il progetto. Inoltre, è possibile utilizzare il client Data Quality per importare i valori del progetto in un dominio di una Knowledge Base in DQS. È possibile importare i valori solo in un dominio (o dominio collegato) configurato per l'utilizzo dalla trasformazione DQS Cleansing.

Finestra di dialogo Editor trasformazione DQS Cleansing

Usare la finestra di dialogo Editor trasformazione DQS Cleansing per correggere dati usando Data Quality Services (DQS). Per altre informazioni, vedere Concetti di Data Quality Services.

Per saperne di più

Aprire Editor trasformazione DQS Cleansing

  1. Aggiungere la trasformazione DQS Cleansing al pacchetto Integration Services in SQL Server Data Tools (SSDT).

  2. Fare clic con il pulsante destro del mouse sul componente e quindi scegliere Modifica.

Impostare le opzioni nella scheda Gestione connessione

Gestione connessione Data Quality
Consente di selezionare una gestione connessione DQS esistente nell'elenco oppure di crearne una facendo clic sul pulsante Nuova.

New
Consente di creare una nuova gestione connessione usando la finestra di dialogo Gestione connessione DQS Cleansing . Per altre informazioni, vedere Impostare le opzioni nella finestra di dialogo Gestione connessione DQS Cleansing.

Data Quality Knowledge Base
Selezionare una Knowledge Base DQS esistente per l'origine dati connessa. Per altre informazioni sulla Knowledge Base DQS, vedere Knowledge Base e domini DQS.

Crittografa connessione
Consente di specificare se crittografare la connessione, per crittografare il trasferimento dei dati tra il Server DQS e Integration Services.

Domini disponibili
Consente di elencare i domini disponibili per la Knowledge Base selezionata. Esistono due tipi di domini, cioè singoli e composti. In questi ultimi sono contenuti due o più domini singoli.

Per informazioni su come eseguire il mapping di colonne a domini composti, vedere Eseguire il mapping delle colonne ai domini compositi.

Per altre informazioni sui domini, vedere Knowledge Base e domini DQS.

Configura output errori
Consente di specificare come gestire gli errori a livello di riga. Possono verificarsi degli errori quando la trasformazione corregge i dati dall'origine dati connessa, a causa di valori di dati o vincoli di convalida non previsti.

Di seguito sono riportati i valori validi:

  • Interrompi componente: indica che la trasformazione ha esito negativo e che i dati di input non vengono inseriti nel database Data Quality Services. Questo è il valore predefinito.

  • Reindirizza riga: indica che i dati di input non vengono inseriti nel database di Data Quality Services e che vengono reindirizzati all'output degli errori.

Impostare le opzioni nella scheda Mapping

Per informazioni su come eseguire il mapping di colonne a domini composti, vedere Eseguire il mapping delle colonne ai domini compositi.

Colonne di input disponibili
Elenca le colonne dall'origine dati connessa. Selezionare una o più colonne contenenti i dati che si desidera correggere.

Colonna di input
Elenca una colonna di input selezionata nell'area Colonne di input disponibili .

Dominio
Consente di selezionare un dominio di cui si desidera eseguire il mapping alle colonne di input.

Alias di origine
Consente di visualizzare la colonna di origine contenente il valore della colonna originale.

Fare clic all'interno del campo per modificare il nome della colonna.

Alias di output
Consente di visualizzare la colonna che viene restituita da Trasformazione DQS Cleansing. La colonna contiene il valore della colonna originale o il valore corretto.

Fare clic all'interno del campo per modificare il nome della colonna.

Alias di stato
Consente di visualizzare la colonna contenente le informazioni sullo stato per i dati corretti. Fare clic all'interno del campo per modificare il nome della colonna.

Impostare le opzioni nella scheda Avanzate

Standardizzare output
Consente di specificare se restituire i dati nel formato standardizzato basato sul formato di output definito per i domini. Per altre informazioni sul formato standardizzato, vedere Pulizia dei dati.

Attendibilità
Consente di specificare se includere il livello di confidenza per i dati corretti. Il livello di confidenza indica il livello di certezza di DQS in relazione a correzione o suggerimento. Per altre informazioni sui livelli di confidenza, vedere Pulizia dei dati.

Motivo
Consente di specificare se includere il motivo per la correzione dei dati.

Dati accodati
Consente di specificare se restituire dati aggiuntivi ricevuti da un provider di dati di riferimento esistente. Per altre informazioni, vedere Reference Data Services in DQS.

Schema dati accodati
Consente di specificare se restituire lo schema dati. Per altre informazioni, vedere Collegare un dominio o un dominio composito ai dati di riferimento.

Impostare le opzioni nella finestra di dialogo Gestione connessione DQS Cleansing

Nome server
Selezionare o digitare il nome del server DQS a cui si desidera connettersi. Per altre informazioni sul server, vedere Amministrazione DQS.

Test connessione
Fare clic per verificare che la connessione specificata sia disponibile.

È anche possibile aprire la finestra di dialogo Gestione connessione DQS Cleansing dall'area relativa alle connessioni eseguendo queste operazioni:

  1. In SQL Server Data Tools (SSDT) aprire un progetto di Integration Services esistente o crearne uno nuovo.

  2. Fare clic con il pulsante destro sull'area relativa alle connessioni, scegliere Nuova connessionee quindi fare clic su DQS.

  3. Fare clic su Aggiungi.