Bereinigen von Daten in einer Verbunddomäne

Gilt für:SQL Server

Dieses Thema enthält Informationen zur Reinigung zusammengesetzter Domänen in Data Quality Services (DQS). Eine Verbunddomäne besteht aus einer oder mehreren Einzeldomänen und ist einem Datenfeld zugeordnet, das sich aus mehreren verwandten Begriffen zusammensetzt. Die einzelnen Domänen in einer Verbunddomäne müssen einen gemeinsamen Wissensbereich haben. Ausführliche Informationen zu Verbunddomänen finden Sie unter Managing a Composite Domain.

Zuordnen einer Verbunddomäne zu den Quelldaten

Es gibt zwei Methoden, mit denen Sie die Quelldaten einer Verbunddomäne zuordnen können:

  • Bei den Quelldaten handelt es sich um ein einzelnes Feld (beispielsweise „Vollständiger Name“), das einer Verbunddomäne zugeordnet wird.

    • Wenn die Verbunddomäne einem Verweisdatendienst zugeordnet wird, werden die Quelldaten zur Korrektur und Analyse unverändert an den Verweisdatendienst gesendet.

    • Wenn die Verbunddomäne keinem Verweisdatendienst zugeordnet wird, werden die Quelldaten basierend auf der für die Verbunddomäne definierten Methode analysiert. Weitere Informationen zum Angeben einer Analysemethode für Verbunddomänen finden Sie unter Create a Composite Domain

  • Die Quelldaten bestehen aus mehreren Feldern (z. B. „Vorname“, „Weitere Vornamen“ und „Nachname“), die einzelnen Domänen innerhalb einer Verbunddomäne zugeordnet werden.

Ein Beispiel zum Zuordnen von Verbunddomänen zu Quelldaten finden Sie unter Anfügen einer Domäne oder Verbunddomäne an Verweisdaten.

Datenkorrektur mit definitiven domänenübergreifenden Regeln

Domänenübergreifende Regeln in Verbunddomänen ermöglichen es Ihnen, Regeln zu erstellen, die die Beziehung zwischen einzelnen Domänen in einer Verbunddomäne angeben. Domänenübergreifende Regeln werden berücksichtigt, wenn Sie die Bereinigungsaktivität für die Quelldaten von Verbunddomänen ausführen. Abgesehen davon, dass Sie erfahren, ob eine domänenübergreifenden Regel gültig ist, korrigiert die definitive domänenübergreifende Then -Regel Wert ist gleichauch die Daten während der Datenbereinigungsaktivität.

Beachten Sie das folgende Beispiel: Es gibt eine Verbunddomäne namens „Product“ mit drei einzelnen Domänen: ProductName, CompanyName und ProductVersion. Erstellen Sie die folgende definitive domänenübergreifende Regel:

Wenn der Domänenwert „CompanyName“ Microsoft enthält und der Domänenwert „ProductName“ gleich Office und „ProductVersion“ gleich 2010 ist, dann ist der Domänenwert „ProductName“ gleich Microsoft Office 2010.

Wenn diese domänenübergreifende Regel ausgeführt wird, werden die Quelldaten (ProductName) nach der Bereinigungsaktivität wie folgt korrigiert:

Quelldaten

ProductName CompanyName ProductVersion
Office Microsoft Inc. 2010

Ausgabedaten

ProductName CompanyName ProductVersion
Microsoft Office 2010 Microsoft Inc. 2010

Wenn Sie die definitive domänenübergreifende Then -Regel Wert ist gleichtesten, enthält das Dialogfeld Verbunddomänenregel testen eine neue Spalte namens Korrigieren in, in der die korrigierten Daten angezeigt werden. In einem Bereinigungsprojekt zur Datenqualität ändert diese endgültige domänenübergreifende Regel die Daten mit 100 % Konfidenz, und in der Spalte "Grund " wird die folgende Meldung angezeigt: Korrigiert durch Regel "<Domänenübergreifender Regelname>". Weitere Informationen zu domänenübergreifenden Regeln finden Sie unter Create a Cross-Domain Rule.

Hinweis

Die definitive domänenübergreifende Regel funktioniert nicht für Verbunddomänen, die an einen Verweisdatendienst angefügt wurden.

Datenprofilerstellung für Verbunddomänen

Die Profilerstellung in DQS bietet während der Bereinigungsaktivität zwei Data Quality-Dimensionen: Vollständigkeit (das Ausmaß des Vorhandenseins von Daten) und Genauigkeit (das Ausmaß, in dem Daten für den beabsichtigten Zweck verwendet werden können). Die Profilerstellung kann keine zuverlässigen Vollständigkeitsstatistiken für Verbunddomänen bereitstellen. Wenn Sie Vollständigkeitsstatistiken benötigen, verwenden Sie Einzeldomänen anstatt Verbunddomänen. Wenn Sie Verbunddomänen verwenden möchten, sollten Sie eine Wissensdatenbank mit Einzeldomänen für die Profilerstellung erstellen, um die Vollständigkeit zu bestimmen, und eine weitere Domäne mit einer Verbunddomäne für die Bereinigungsaktivität erstellen. Die Profilerstellung kann z. B. 95 % Vollständigkeit für Adressendatensätze anzeigen, die eine Verbunddomäne verwenden, aber es kann einen viel höheren Grad der Unvollständigkeit für eine der Spalten geben, z. B. für eine Postleitzahlspalte. In diesem Beispiel möchten Sie die Vollständigkeit der Postleitzahlspalte mit einer Einzeldomäne messen.

Die Profilerstellung stellt wahrscheinlich zuverlässige Genauigkeitsstatistiken für Verbunddomänen bereit, da Sie die Genauigkeit für mehrere Spalten gemeinsam messen können. Der Wert dieser Daten liegt in der zusammengesetzten Aggregation, daher sollten Sie die Genauigkeit mit einer Verbunddomäne messen.

Ausführliche Informationen zur Datenprofilerstellung während der Reinigungsaktivität finden Sie unter Profiler Statistics in Cleanse Data Using DQS (Internal) Knowledge.