DQS-BereinigungstransformationDQS Cleansing Transformation

Die DQS-Bereinigungstransformation korrigiert Daten aus einer verbundenen Datenquelle mithilfe von Data Quality Services (DQS), indem sie genehmigte Regeln anwendet, die für die verbundene Datenquelle oder eine ähnliche Datenquelle erstellt wurden.The DQS Cleansing transformation uses Data Quality Services (DQS) to correct data from a connected data source, by applying approved rules that were created for the connected data source or a similar data source. Weitere Informationen zu Datenkorrekturregeln finden Sie unter DQS Knowledge Bases and Domains.For more information about data correction rules, see DQS Knowledge Bases and Domains. Weitere Informationen zu DQS finden Sie unter Data Quality Services Concepts.For more information DQS, see Data Quality Services Concepts.

Die DQS-Bereinigungstransformation bestimmt, ob die Daten korrigiert werden müssen, indem sie die Daten in einer Eingabespalte verarbeitet. Dabei gelten folgende Bedingungen:To determine whether the data has to be corrected, the DQS Cleansing transformation processes data from an input column when the following conditions are true:

  • Die Spalte ist für die Datenkorrektur ausgewählt.The column is selected for data correction.

  • Der Datentyp der Spalte wird in der Datenkorrektur unterstützt.The column data type is supported for data correction.

  • Der Spalte ist eine Domäne mit einem kompatiblen Datentyp zugeordnet.The column is mapped a domain that has a compatible data type.

    Die Transformation umfasst auch eine Fehlerausgabe, die Sie zur Behandlung von Fehlern auf Zeilenebene konfigurieren können.The transformation also includes an error output that you configure to handle row-level errors. Die Fehlerausgabe wird mit dem Transformations-Editor für die DQS-Bereinigungkonfiguriert.To configure the error output, use the DQS Cleansing Transformation Editor.

    Sie können die Fuzzy Grouping Transformation in den Datenfluss einschließen, um Zeilen mit Daten zu ermitteln, bei denen es sich wahrscheinlich um Duplikate handelt.You can include the Fuzzy Grouping Transformation in the data flow to identify rows of data that are likely to be duplicates.

Data Quality-Projekte und -WerteData Quality Projects and Values

Wenn Sie Daten mit der DQS-Bereinigungstransformation verarbeiten, wird ein Bereinigungsprojekt auf dem Data Quality-Server erstellt.When you process data with the DQS Cleansing transformation, a cleansing project is created on the Data Quality Server. Das Projekt wird mit dem Data Quality Client verwaltet.You use the Data Quality Client to manage the project. Mit dem Data Quality Client können Sie außerdem die Projektwerte in eine DQS-Wissensdatenbankdomäne importieren.In addition, you can use the Data Quality Client to import the project values into a DQS knowledge base domain. Sie können die Werte nur in eine Domäne (oder verknüpfte Domäne) importieren, für deren Verwendung die DQS-Bereinigungstransformation konfiguriert wurde.You can import the values only to a domain (or linked domain) that the DQS Cleansing transformation was configured to use.

Transformations-Editor für die DQS-Bereinigung (Dialogfeld)DQS Cleansing Transformation Editor Dialog Box

Im Dialogfeld Transformations-Editor für die DQS-Bereinigung können Sie Daten mithilfe von Data Quality Services (DQS) korrigieren.Use the DQS Cleansing Transformation Editor dialog box to correct data using Data Quality Services (DQS). Weitere Informationen finden Sie unter Data Quality Services Concepts.For more information, see Data Quality Services Concepts.

Was möchten Sie tun?What do you want to do?

Öffnen des Transformations-Editors für die DQS-Bereinigung Open the DQS Cleansing Transformation Editor

  1. Fügen Sie die DQS-Bereinigungstransformation dem Integration ServicesIntegration Services -Paket in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT)hinzu.Add the DQS Cleansing Transformation to Integration ServicesIntegration Services package, in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT).

  2. Klicken Sie mit der rechten Maustaste auf die Komponente, und klicken Sie anschließend auf Bearbeiten.Right-click the component and then click Edit.

Festlegen der Optionen auf der Registerkarte "Verbindungs-Manager" Set options on the Connection Manager tab

Data Quality Services-Verbindungs-ManagerData quality connection manager
Wählen Sie in der Liste einen vorhandenen DQS-Verbindungs-Manager aus, oder erstellen Sie eine neue Verbindung, indem Sie auf Neuklicken.Select an existing DQS connection manager from the list, or create a new connection by clicking New.

NeuNew
Erstellen Sie mithilfe des Dialogfelds Verbindungs-Manager für DQS-Bereinigung einen neuen Verbindungs-Manager.Create a new connection manager by using the DQS Cleansing Connection Manager dialog box. Siehe Festlegen der Optionen im Dialogfeld „Verbindungs-Manager für DQS-Bereinigung“See Set the options in the DQS Cleansing Connection Manager dialog box

Data Quality-WissensdatenbankData Quality Knowledge Base
Wählen Sie eine vorhandene DQS-Wissensdatenbank für die verbundene Datenquelle aus.Select an existing DQS knowledge base for the connected data source. Weitere Informationen zur DQS-Wissensdatenbank finden Sie unter DQS Knowledge Bases and Domains.For more information about the DQS knowledge base, see DQS Knowledge Bases and Domains.

Verschlüsseln der VerbindungEncrypt connection
Gibt an, ob die Verbindung verschlüsselt wird, um die Datenübertragung zwischen dem DQS-Server und Integration ServicesIntegration Serviceszu verschlüsseln.Specifiy whether to encrypt the connection, in order to encrypt the data transfer between the DQS Server and Integration ServicesIntegration Services.

Verfügbare DomänenAvailable domains
Listet die verfügbaren Domänen für die ausgewählte Wissensdatenbank auf.Lists the available domains for the selected knowledge base. Es gibt zwei Typen von Domänen: einzelne Domänen und Verbunddomänen, die aus mindestens zwei einzelnen Domänen bestehen.There are two types of domains: single domains, and composite domains that contain two or more single domains.

Weitere Informationen zum Zuordnen von Spalten zu Verbunddomänen finden Sie unter Map Columns to Composite Domains.For information on how to map columns to composite domains, see Map Columns to Composite Domains.

Weitere Informationen zu Domänen finden Sie unter DQS Knowledge Bases and Domains.For more information about domains, see DQS Knowledge Bases and Domains.

Fehlerausgabe konfigurierenConfigure Error Output
Gibt an, wie Fehler auf Zeilenebene verarbeitet werden.Specify how to handle row-level errors. Wenn durch die Transformation Daten aus der verbundenen Datenquelle korrigiert werden, können aufgrund unerwarteter Datenwerte oder Überprüfungseinschränkungen Fehler auftreten.Errors can occur when the transformation corrects data from the connected data source, due to unexpected data values or validation constraints.

Folgende Werte sind gültig:The following are the valid values:

  • Fehler bei Komponentegibt an, dass die Transformation fehlgeschlagen ist und dass die Eingabedaten nicht in die Data Quality Services-Datenbank eingefügt werden.Fail Component, which indicates that the transformation fails and the input data is not inserted into the Data Quality Services database. Dies ist der Standardwert.This is the default value.

  • Zeile umleitengibt an, dass die Eingabedaten nicht in die Data Quality Services-Datenbank eingefügt und an die Fehlerausgabe umgeleitet werden.Redirect Row, which indicates that the input data is not inserted into the Data Quality Services database and is redirected to the error output.

Festlegen der Optionen auf der Registerkarte "Zuordnung" Set options on the Mapping tab

Weitere Informationen zum Zuordnen von Spalten zu Verbunddomänen finden Sie unter Map Columns to Composite Domains.For information on how to map columns to composite domains, see Map Columns to Composite Domains.

Verfügbare EingabespaltenAvailable Input Columns
Listet die Spalten aus der verbundenen Datenquelle auf.Lists the columns from the connected data source. Wählen Sie Spalten aus, die zu korrigierende Daten enthalten.Select one or more columns that contain data that you want to correct.

EingabespalteInput Column
Zeigt eine im Bereich Verfügbare Eingabespalten ausgewählte Eingabespalte an.Lists an input column that you selected in the Available Input Columns area.

DomäneDomain
Wählen Sie eine Domäne aus, die der Eingabespalte zugeordnet werden soll.Select a domain to map to the input column.

Alias – QuelleSource Alias
Zeigt die Quellspalte an, die den ursprünglichen Spaltenwert enthält.Lists the source column that contains the original column value.

Klicken Sie in das Feld, um den Spaltennamen zu ändern.Click in the field to modify the column name.

AusgabealiasOutput Alias
Zeigt die Spalte an, die vom Transformations-Editor für die DQS-Bereinigungausgegeben wird.Lists the column that is outputted by the DQS Cleansing Transformation. Die Spalte enthält den ursprünglichen Spaltenwert oder den korrigierten Wert.The column contains the original column value or the corrected value.

Klicken Sie in das Feld, um den Spaltennamen zu ändern.Click in the field to modify the column name.

Alias – StatusStatus Alias
Zeigt die Spalte an, die Statusinformationen für die korrigierten Daten enthält.Lists the column that contains status information for the corrected data. Klicken Sie in das Feld, um den Spaltennamen zu ändern.Click in the field to modify the column name.

Festlegen der Optionen auf der Registerkarte "Erweitert" Set options on the Advanced tab

Ausgabe standardisierenStandardize output
Gibt an, ob die Daten im standardisierten Format auf Grundlage des für Domänen definierten Ausgabeformats ausgegeben werden.Indicate whether to output the data in the standardized format based on the output format defined for domains. Weitere Informationen zum standardisierten Format finden Sie unter Datenbereinigung.For more information about standardized format, see Data Cleansing.

VertrauenConfidence
Gibt an, ob der Vertrauensgrad für korrigierte Daten eingeschlossen wird.Indicate whether to include the confidence level for corrected data. Der Vertrauensgrad gibt die DQS-Sicherheitsstufe der Korrektur oder des Vorschlags an.The confidence level indicates the extend of certainty of DQS for the correction or suggestion. Weitere Informationen zu Vertrauensgraden finden Sie unter Datenbereinigung.For more information about confidence levels, see Data Cleansing.

ReasonReason
Gibt an, ob der Grund für die Datenkorrektur eingeschlossen wird.Indicate whether to include the reason for the data correction.

Angefügte DatenAppended Data
Gibt an, ob weitere, von einem vorhandenen Verweisdatenanbieter empfangene Daten ausgegeben werden.Indicate whether to output additional data that is received from an existing reference data provider. Weitere Informationen finden Sie unter Reference Data Services in DQS.For more information, see Reference Data Services in DQS.

Angefügtes DatenschemaAppended Data Schema
Gibt an, ob das Datenschema ausgegeben wird.Indicate whether to output the data schema. Weitere Informationen finden Sie unter Anfügen einer Domäne oder Verbunddomäne an Verweisdaten.For more information, see Attach Domain or Composite Domain to Reference Data.

Festlegen der Optionen im Dialogfeld "Verbindungs-Manager für DQS-Bereinigung" Set the options in the DQS Cleansing Connection Manager dialog box

ServernameServer name
Wählen Sie den Namen des DQS-Servers aus, mit dem Sie eine Verbindung herstellen möchten, oder geben Sie ihn ein.Select or type the name of the DQS server that you want to connect to. Weitere Informationen zum Server finden Sie unter DQS Administration.For more information about the server, see DQS Administration.

Verbindung testenTest Connection
Klicken Sie auf diese Schaltfläche, um zu überprüfen, ob die angegebene Verbindung gültig ist.Click to confirm that the connection that you specified is viable.

Sie können das Dialogfeld Verbindungs-Manager für DQS-Bereinigung auch wie folgt über den Verbindungsbereich öffnen:You can also open the DQS Cleansing Connection Manager dialog box from the connections area, by doing the following:

  1. Öffnen Sie in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT)ein vorhandenes Integration ServicesIntegration Services -Projekt, oder erstellen Sie ein neues Projekt.In SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT), open an existing Integration ServicesIntegration Services project or create a new one.

  2. Klicken Sie im Verbindungsbereich mit der rechten Maustaste auf Neue Verbindung, und klicken Sie anschließend auf DQS.Right-click in the connections area, click New Connection, and then click DQS.

  3. Klicken Sie auf Hinzufügen.Click Add.