Erstellen einer AbgleichsrichtlinieCreate a Matching Policy

In diesem Thema wird beschrieben, wie eine Abgleichsrichtlinie eine Wissensdatenbank in Data Quality ServicesData Quality Services (DQS) erstellt wird.This topic describes how to build a matching policy in a knowledge base in Data Quality ServicesData Quality Services (DQS). Sie bereiten den Abgleichsprozess in DQS vor, indem Sie die Abgleichsrichtlinienaktivität für Beispieldaten ausführen.You prepare for the matching process in DQS by running the Matching Policy activity on sample data. In dieser Aktivität erstellen und testen Sie eine oder mehrere Abgleichsregeln in der Richtlinie und veröffentlichen dann die Wissensdatenbank, um die Abgleichsregeln zur Verwendung öffentlich verfügbar zu machen.In this activity you create and test one or more matching rules in the policy, and then publish the knowledge base to make the matching rules publically available for use. Es kann nur eine Abgleichsrichtlinie in einer Wissensdatenbank geben, aber diese Richtlinie kann mehrere Abgleichsregeln enthalten.There can be only one matching policy in a knowledge base, but that policy can contain multiple matching rules.

Die Abgleichsrichtlinienerstellung wird in drei Phasen ausgeführt: ein Zuordnungsprozess, in dem Sie die Datenquelle identifizieren und Domänen zu Spalten zuordnen, ein Abgleichsrichtlinienprozess, in dem Sie eine oder mehrere Abgleichsregeln erstellen und jede Abgleichsregel separat testen, und ein Abgleichsergebnisseprozess, in dem Sie alle Abgleichsregeln zusammen ausführen und die Richtlinie der Wissensdatenbank hinzufügen, wenn Sie mit ihr zufrieden sind.Matching policy creation is performed in three stages: a mapping process in which you identify the data source and map domains to columns, a matching policy process in which you create one or more matching rules and test each matching rule separately, and a matching results process in which you run all matching rules together, and if satisfied with them, add the policy to the knowledge base. Jeder dieser Prozesse wird auf einer separaten Seite des Abgleichsrichtlinienaktivitäts-Assistenten ausgeführt, sodass Sie zwischen den Seiten hin und her wechseln, den Prozess erneut auszuführen, einen bestimmten Abgleichsrichtlinienprozess schließen und dann zur gleichen Phase des Prozesses zurückkehren können.Each of these processes is performed on a separate page of the Matching Policy activity wizard, enabling you to move back and forth to different pages, to re-run the process, and to close out of a specific matching policy process and return to the same stage of the process. Nach dem gemeinsamen Testen aller Regeln können Sie, falls erforderlich, zur Seite Abgleichsrichtlinie zurückkehren, eine einzelne Regel ändern, sie wieder separat testen und zur Seite Abgleichsergebnisse zurückkehren, um alle Regeln erneut gemeinsam auszuführen.After testing all rules together, if desired you can return to the Matching Policy page, tweak an individual rule, test it again separately, and then return to the Matching Results page to run all rules together once again. DQS stellt Ihnen Statistiken zu den Quelldaten, den Abgleichsregeln und den Abgleichsergebnissen bereit, die es Ihnen ermöglichen, informierte Entscheidungen zur Abgleichsrichtlinie zu treffen, damit Sie sie optimieren können.DQS provides you with statistics about the source data, the matching rules, and the matching results that enable you to make informed decisions about the matching policy, so you can refine it.

VorbereitungenBefore You Begin

Erforderliche KomponentenPrerequisites

Microsoft Excel muss auf dem Data Quality ClientData Quality Client -Computer installiert sein, wenn sich die Quelldaten in einer Excel-Datei befinden.Microsoft Excel must be installed on the Data Quality ClientData Quality Client computer if the source data is in an Excel file. Andernfalls sind Sie nicht in der Lage, die Excel-Datei in der Zuordnungsphase auszuwählen.Otherwise, you will not be able to select the Excel file in the mapping stage. Die von Microsoft Excel erstellten Dateien können die Erweiterung .xlsx, .xls oder .csv haben.The files created by Microsoft Excel can have an extension of .xlsx, .xls, or .csv. Wenn die 64-Bit-Version von Excel verwendet wird, werden nur Excel 2003-Dateien (.xls) unterstützt; Excel 2007- oder 2010-Dateien (.xlsx) werden nicht unterstützt.If the 64-bit version of Excel is used, only Excel 2003 files (.xls) are supported; Excel 2007 or 2010 files (.xlsx) are not supported. Wenn Sie die 64-Bit-Version von Excel 2007 oder 2010 verwenden, speichern Sie die Datei als XLS-Datei oder CSV-Datei, oder installieren Sie stattdessen eine 32-Bit-Version von Excel.If you are using 64-bit version of Excel 2007 or 2010, save the file as an .xls file or a .csv file, or install a 32-bit version of Excel instead.

SicherheitSecurity

BerechtigungenPermissions

Sie müssen über die Rolle „dqs_kb_editor“ oder „dqs_administrator“ in der DQS_MAIN-Datenbank verfügen, um eine Abgleichsrichtlinie zu erstellen.You must have the dqs_kb_editor or the dqs_administrator role on the DQS_MAIN database to create a matching policy.

So legen Sie Abgleichsregelparameter festHow to Set Matching Rule Parameters

Das Erstellen einer Abgleichsregel ist ein iterativer Prozess, in dem Sie die Faktoren eingeben, der verwendet werden, um zu bestimmen, ob ein Datensatz mit einem anderen übereinstimmt.Creating a matching rule is an iterative process in which you enter the factors used to determine if one record is a match for another. Sie können Bedingungen für eine beliebige Domäne in einer Tabelle eingeben.You can enter conditions for any domain in a table. Wenn DQS zwei Datensätzen gegeneinander abgleicht, werden die Werte in den Feldern, die den Domänen zugeordnet sind, die in der Abgleichsregel enthalten sind, verglichen.When DQS performs matching on two records, it will compare the values in the fields mapped to the domains that are included in the matching rule. DQS analysiert die Werte in jedem Feld der Regel, und verwendet dann die in der Regel eingegebenen Faktoren für jede Domäne, um eine abschließende Treffergenauigkeit zu berechnen.DQS analyzes the values in each field in the rule, and then uses the factors entered in the rule for each domain to calculate a final matching score. Wenn die Treffergenauigkeit für die zwei verglichenen Datensätze größer als die minimale Treffergenauigkeit ist, werden die zwei Felder als übereinstimmend angesehen.If the matching score for the two records compared is greater than the minimum matching score, then the two fields are considered matches.

Die Faktoren, die Sie in einer Abgleichsregel eingeben, schließen Folgendes ein:The factors that you enter in a matching rule include the following:

  • Gewichtung: Geben Sie für jede Domäne in der Regel eine numerische Gewichtung ein, die bestimmt, wie die Abgleichsanalyse für die Domäne mit der für jede andere Domäne in der Regel verglichen wird.Weight: For each domain in the rule, enter a numerical weight that determines how the matching analysis for the domain will be compared to that for each other domain in the rule. Die Gewichtung gibt den Beitrag des Feldergebnisses zur Gesamttreffergenauigkeit zwischen zwei Datensätzen an.The weight indicates the contribution of the field’s score to the overall matching score between two records. Die jedem Quellfeld zugewiesenen berechneten Ergebnisse werden für eine zusammengesetzte Treffergenauigkeit für die zwei Datensätze zusammengezählt.The calculated scores assigned to each source field are summed together for a composite matching score for the two records. Legen Sie die Gewichtung zwischen 10 und 100 für jedes Feld fest, das keine erforderliche Komponente (mit einer genauen oder ähnlichen Entsprechung) ist.For each field that is not a prerequisite (with a similarity of exact or similar), set the weight between 10 and 100. Die Summe der Gewichtungen der Domänen, die keine Voraussetzungen sind, muss gleich 100 sein.The sum of the weights of the domains that are not prerequisites must be equal to 100. Wenn der Wert eine Voraussetzung ist, wird die Gewichtung auf 0 festgelegt und kann nicht geändert werden.If the value is a prerequisite, the weight is set to 0 and cannot be changed.

  • Ähnlichkeit von Genau: Wählen Sie Genau aus, wenn die Werte im gleichen Feld von zwei verschiedenen Datensätzen für die Werte, die betrachtet werden sollen, identisch sein müssen, um als übereinstimmend angesehen zu werden.Similarity of Exact: Select Exact if the values in the same field of two different records must be identical for the values to be considered to be a match. Falls die Werte identisch sind, wird die Treffergenauigkeit für diese Domäne auf „100“ festgelegt, und DQS verwendet dieses Ergebnis und die Ergebnisse für die anderen Domänen in der Regel, um die gesamte Treffergenauigkeit zu bestimmen.If identical, the matching score for that domain will be set to “100”, and DQS will use that score and the scores for the other domains in the rule to determine the aggregate matching score. Falls die Werte nicht identisch sind, wird die Treffergenauigkeit für diese Domäne auf „0“ festgelegt, und die Verarbeitung der Regel schreitet zur nächsten Bedingung voran.If not identical, the matching score for that domain will be set to “0”, and processing of the rule will proceed to the next condition. Wenn Sie eine Abgleichsregel für eine numerische Domäne einrichten und Ähnlichauswählen, können Sie eine Toleranz als Prozentsatz oder als ganze Zahl eingeben.If you set up a matching rule for a numeric domain and you select Similar, you can enter a tolerance either as a percentage or an integer. Für eine Domäne vom Typ Datum können Sie eine Toleranz als Tag, Monat oder Jahr (ganze Zahl) eingeben, wenn Sie Ähnlichauswählen; für eine Datumsdomäne gibt es keine Prozenttoleranz.For a domain of type date, you can enter a tolerance as a day, month, or year (integer) if you select Similar; there is no percentage tolerance for a date domain. Wenn Sie Genauauswählen, haben Sie diese Option nicht.If you select Exact, you do not have this option.

  • Ähnlichkeit von Ähnlich: Wählen Sie Ähnlich aus, wenn zwei Werte im gleichen Feld von zwei verschiedenen Datensätzen auch dann als übereinstimmend angesehen werden können, wenn die Werte nicht identisch sind.Similarity of Similar: Select Similar if two values in the same field of two different records can be considered a match even if the values are not identical. Wenn DQS die Regel ausführt, wird eine Treffergenauigkeit für diese Domäne berechnet dieses Ergebnis und die Ergebnisse für die anderen Domänen in der Regel verwendet, um die gesamte Treffergenauigkeit zu bestimmen.When DQS runs the rule, it will calculate a matching score for that domain, and will use that score and the scores for the other domains in the rule to determine the aggregate matching score. Die minimale Ähnlichkeit zwischen den Werten eines Felds ist 60 %.The minimum similarity between the values of a field is 60%. Wenn die berechnete Treffergenauigkeit für ein Feld von zwei Datensätzen kleiner als 60 ist, wird das Ähnlichkeitsergebnis automatisch auf 0 festgelegt.If the calculated matching score for a field of two records is less than 60, the similarity score is automatically set to 0. Wenn Sie eine Abgleichsregel für ein numerisches Feld einrichten und Ähnlichauswählen, können Sie eine Toleranz als Prozentsatz oder als ganze Zahl eingeben.If you are setting up a matching rule for a numeric field, and you select Similar, you can enter a tolerance as a percentage or integer. Wenn Sie eine Abgleichsregel für ein Datumsfeld einrichten und Ähnlichauswählen, können Sie eine numerische Toleranz eingeben.If you are setting up a matching rule for a date field, and you select Similar, you can enter a numerical tolerance.

  • Voraussetzung: Wählen Sie Voraussetzung aus, um anzugeben, dass die Werte im gleichen Feld in zwei verschiedenen Datensätzen eine 100 %-Übereinstimmung zurückgeben müssen. Andernfalls werden die Datensätze nicht als Übereinstimmung angesehen, und die anderen Klauseln in der Regel werden ignoriert.Prerequisite: Select Prerequisite to specify that the values in the same field in two different records must return a 100% match, or the records are not considered a match and the other clauses in the rule are disregarded. Wenn Voraussetzung ausgewählt wird, wird das Gewichtungsfeld für die Domäne entfernt, sodass Sie keine Gewichtung für die Domäne definieren können.When Prerequisite is selected, the weight field for the domain is removed so that you cannot define a weight for the domain. Sie müssen mindestens eine Domänengewichtung zurücksetzen, sodass die Summe der Gewichtungen gleich 100 ist.You must reset one or more domain weights so that the sum of weights is equal to 100. Voraussetzungsdomänen tragen nicht zur Datensatztreffergenauigkeit bei.Prerequisite domains do not contribute to the record matching score. Die Datensatztreffergenauigkeit wird durch das Vergleichen der Werte in Feldern, für die die Ähnlichkeit auf „Ähnlich“ oder „Genau“ festgelegt wurde, bestimmt.The record matching score is determined by comparing the values in fields for which the Similarity is set to Similar or Exact. Wenn Sie ein Feld zu einer Voraussetzung machen, wird die Ähnlichkeit für diese Domäne automatisch auf „Genau“ festgelegt.When you make a field a prerequisite, the Similarity for that domain is automatically set to Exact.

    Die minimale Treffergenauigkeit ist der Schwellenwert ab dem zwei Datensätze als Übereinstimmung angesehen werden (der Status für die Datensätze wird auf „Matched“ festgelegt).The minimum matching score is the threshold at or above which two records are considered to be a match (and the status for the records is set to “Matched”). Geben Sie einen ganzzahligen Wert in Schritten von „1“ ein, oder klicken Sie auf den Pfeil nach oben oder nach unten, um den Wert in Schritten von "10" zu vergrößern oder zu verringern.Enter an integer value in increments of “1” or click the up or down arrow to increase or decrease the value in increments of “10”. Der Mindestwert beträgt 80.The minimum value is 80. Wenn die Treffergenauigkeit unter 80 liegt, werden die zwei Datensätze nicht als übereinstimmend angesehen.If the matching score is below 80, the two records are not considered a match. Sie können den Bereich der minimalen Treffergenauigkeit auf dieser Seite nicht ändern.You cannot change the range of the minimum matching score in this page. Die niedrigste minimale Treffergenauigkeit ist 80.The lowest min. matching score is 80. Sie können allerdings die niedrigste minimale Treffergenauigkeit auf der Verwaltungsseite ändern (wenn Sie DQS-Administrator sind).You can, however, change the lowest minimum matching score within the Administration page (if you are a DQS administrator).

    Das Erstellen einer Abgleichsregel ist ein iterativer Prozess, da Sie möglicherweise die relativen Gewichtungen der Domänen in der Regel oder die Ähnlichkeit oder die erforderliche Eigenschaft für eine Domäne oder die minimale Treffergenauigkeit für die Regel ändern müssen, um die gewünschten Ergebnisse zu erzielen.Creating a matching rule is an iterative process because you may need to change the relative weights of the domains in the rule, or the similarity or the prerequisite property for a domain, or the min. matching score for the rule, in order to achieve the results that you need. Möglicherweise stellen Sie auch fest, dass Sie mehrere Regeln erstellen müssen, von denen jede ausgeführt wird, um die Treffergenauigkeit zu erstellen.You may also find that you need to create multiple rules, each of which will be run to create the matching score. Es ist möglicherweise schwierig, das benötigte Ergebnis mit nur einer Regel zu erzielen.It may be difficult to achieve the result you need with only one rule. Mehrere Regeln stellen andere Sichten einer erforderlichen Übereinstimmung bereit.Multiple rules will provide different views of a required match. Mit mehreren Regeln sind Sie möglicherweise in der Lage, weniger Domänen in die einzelnen Regeln einzuschließen, höhere Gewichtungen für die einzelnen Domänen zu verwenden und bessere Ergebnisse zu erzielen.With multiple rules, you may be able to include fewer domains in each rule, use higher weights for each domain, and achieve better results. Wenn die Daten weniger genau und weniger vollständig sind, benötigen Sie möglicherweise mehr Regeln, um erforderliche Übereinstimmungen zu finden.If the data is less accurate and less complete, you may need more rules to find required matches. Wenn die Daten genauer und vollständiger sind, benötigen Sie weniger Regeln.If the data is more accurate and complete, you need fewer rules.

    Die Profilerstellung gibt Einblicke in Vollständigkeit und Eindeutigkeit.Profiling gives insights on completeness and uniqueness. Berücksichtigen Sie Vollständigkeit und Eindeutigkeit zusammen.Consider completeness and uniqueness in tandem. Verwenden Sie Vollständigkeits- und Eindeutigkeitsdaten, um zu bestimmen, welche Gewichtung ein Feld im Abgleichsprozess erhalten soll.Use completeness and uniqueness data to determine what weight to give a field in the matching process. Wenn es einen hohen Eindeutigkeitsgrad in einem Feld gibt, können durch Verwenden des Felds in einer Abgleichsrichtlinie die Abgleichsergebnisse verringert werden. Daher sollten Sie die Gewichtung für dieses Feld auf einen relativ kleinen Wert festlegen.If there is a high level of uniqueness in a field, using the field in a matching policy can decrease the matching results, so you may want to set the weight for that field to a relatively small value. Wenn Sie für eine Spalte eine niedrige Eindeutigkeit, aber auch eine niedrige Vollständigkeit haben, sollten Sie keine Domäne für diese Spalte einschließen.If you have a low level of uniqueness for a column, but low completeness, you may not want to include a domain for that column. Bei einer niedrigen Eindeutigkeit aber einer hohen Vollständigkeit sollten Sie die Domäne einschließen.With a low level of uniqueness, but a high level of completeness, you may want to include the domain. Einige Spalten, z. B. Geschlecht, haben normalerweise einen niedrigen Eindeutigkeitsgrad.Some columns, such as gender, may naturally have a low level of uniqueness. Weitere Informationen finden Sie unter Profiler and Results Tabs.For more information, see Profiler and Results Tabs.

Erster Schritt: Starten einer AbgleichsrichtlinieFirst Step: Starting a Matching Policy

Sie führen die Abgleichsrichtlinienaktivität im Wissensdatenbank-Verwaltungsbereich der Anwendung Data Quality ClientData Quality Client aus.You perform the matching policy activity in the knowledge base management area of the Data Quality ClientData Quality Client application.

  1. Starten Sie Data Quality Client.Start Data Quality Client. Weitere Informationen dazu finden Sie unterFor information about doing so, see Ausführen der Data Quality-Clientanwendung. Run the Data Quality Client Application.

  2. Klicken Sie auf dem Data Quality ClientData Quality Client -Startbildschirm auf Neue Wissensdatenbank , um in einer neuen Wissensdatenbank eine Abgleichsrichtlinie zu erstellen.In the Data Quality ClientData Quality Client home screen, click New knowledge base to create a matching policy in a new knowledge base. Geben Sie einen Namen für die Wissensdatenbank ein, geben Sie eine Beschreibung ein, und legen Sie Wissensdatenbank erstellen aus wie gewünscht fest.Enter a name for the knowledge base, enter a description, and set Create knowledge base from as desired. Klicken Sie für die Aktivität auf Abgleichsrichtlinie .Click Matching Policy for the activity. Klicken Sie auf Weiter , um den Vorgang fortzusetzen.Click Next to proceed.

  3. Klicken Sie auf Wissensdatenbank öffnen , um die Abgleichsrichtlinie in einer vorhandenen Wissensdatenbank zu erstellen oder zu ändern.Click Open knowledge base to create or modify the matching policy in an existing knowledge base. Wählen Sie die Wissensdatenbank aus, wählen Sie Abgleichsrichtlinieaus, und klicken Sie dann auf Weiter.Select the knowledge base, select Matching Policy, and then click Next. Sie können auch unter Zuletzt verwendete Wissensdatenbankauf eine Wissensdatenbank klicken.You can also click a knowledge base under Recent Knowledge Base. Wenn Sie eine Wissensdatenbank öffnen, die geschlossen wurde, während an einer Abgleichsrichtlinie gearbeitet wurde, fahren Sie mit der Phase fort, in der die Abgleichsrichtlinienaktivität geschlossen wurde (wie von der Spalte Status für die Wissensdatenbank in der Wissensdatenbanktabelle oder im Wissensdatenbanknamen unter Zuletzt verwendete Wissensdatenbankangegeben).If you open a knowledge base that was closed while a matching policy was being worked on, you will proceed to the stage that the matching policy activity was closed in (as indicated by the State column for the knowledge base in the knowledge base table or in the knowledge base name under Recent Knowledge Base). Wenn Sie eine Wissensdatenbank öffnen, die eine Abgleichsrichtlinie enthält und abgeschlossen wurde, wechseln Sie zur Seite Abgleichsrichtlinie .If you open a knowledge base that includes a matching policy and was finished, you will go to the Matching Policy page. Wenn Sie eine Wissensdatenbank öffnen, die keine Abgleichsrichtlinie enthält und abgeschlossen wurde, wechseln Sie zur Seite Zuordnung .If you open a knowledge base that does not include a matching policy and was finished, you will go to the Mapping Page.

ZuordnungsphaseMapping Stage

In der Zuordnungsphase identifizieren Sie die Quelle der Daten, für die Sie die Abgleichsrichtlinie erstellen, und ordnen Domänen Quellspalten zu, um die Domänen für die Abgleichsrichtlinienaktivität verfügbar zu machen.In the mapping stage you identify the source of the data that you will create the matching policy for, and you map source columns to domains to make the domains available for the matching policy activity.

  1. Behalten Sie auf der Seite Struktur zum Erstellen einer Richtlinie für eine Datenbank für Datenquelle die Option SQL Serverbei, wählen Sie die Datenbank aus, für die Sie die Richtlinie in Datenbankerstellen möchten, und wählen Sie dann die Tabelle oder Sicht in Tabelle/Sichtaus.On the Map page, to create a policy for a database, leave Data Source as SQL Server, select the database that you want to create the policy for in Database, and then select the table or view in Table/View. Die Quelldatenbank muss sich in der gleichen SQL Server-Instanz wie Data Quality ServerData Quality Serverbefinden.The source database must be present in the same SQL Server instance as Data Quality ServerData Quality Server. Andernfalls wird sie nicht in der Dropdownliste angezeigt.Otherwise, it will not appear in the drop-down list.

  2. Um eine Richtlinie für die Daten in einem Excel-Arbeitsblatt zu erstellen, wählen Sie Excel-Datei für Datenquelleaus, klicken Sie auf Durchsuchen , und wählen Sie die Excel-Datei aus. Lassen Sie Erste Zeile als Header verwenden ggf. aktiviert.To create a policy for the data in an Excel spreadsheet, select Excel File for Data Source, click Browse and select the Excel file, and leave Use first row as header selected if appropriate. Wählen Sie in Arbeitsblattdas Arbeitsblatt in der Excel-Datei aus, das die Quelle der Daten ist.In Worksheet, select the worksheet in the Excel file that will be the source of the data. Microsoft Excel muss auf dem Data Quality-Clientcomputer installiert sein, um eine Excel-Datei auswählen zu können.Microsoft Excel must be installed on the Data Quality Client computer to select an Excel file. Andernfalls ist die Schaltfläche „Durchsuchen“ nicht verfügbar, und Sie werden unter diesem Textfeld benachrichtigt, dass Microsoft Excel nicht installiert ist.Otherwise, the Browse button will not be available, and you will be notified beneath this text box that Microsoft Excel is not installed.

  3. Wählen Sie unter Zuordnungenein Feld für Quellspalteaus, und klicken Sie dann auf das Symbol Domäne erstellen .Under Mappings, select a field for Source Column, and then click the Create Domain icon.

  4. Wählen Sie unter Zuordnungenein Feld in der Datenquelle für Quellspalteaus, und wählen Sie dann die entsprechende Domäne aus.Under Mappings, select a field in the data source for Source Column, and then select the corresponding domain. Wiederholen Sie den Vorgang für alle Domänen, die Sie im Abgleichsprozess verwenden.Repeat for all domains that you use in the matching process. Erstellen Sie Domänen bei Bedarf durch Klicken auf Domäne erstellen oder Verbunddomäne erstellen.Create domains as necessary by clicking Create a Domain or Create a Composite Domain.

    Hinweis

    Sie können beim Erstellen einer Abgleichsrichtlinie Ihren Quelldaten nur dann einer DQS-Domäne zuordnen, wenn der Quelldatentyp in DQS unterstützt wird und mit dem DQS-Domänendatentyp übereinstimmt.You can map your source data to a DQS domain while creating a matching policy only if the source data type is supported in DQS, and matches with the DQS domain data type. Informationen zu in DQS unterstützten Datentypen finden Sie unter Unterstützte SQL Server- und SSIS-Datentypen für DQS-Domänen.For information about supported data types in DQS, see Supported SQL Server and SSIS Data Types for DQS Domains.

  5. Klicken Sie auf das Plussteuerelement (+) , um der Zuordnungstabellen eine Zeile hinzuzufügen, oder auf das Minussteuerelement (-) , um eine Zeile zu entfernen.Click the plus (+) control to add a row to the Mappings table or the minus (–) control to remove a row.

  6. Klicken Sie auf Vorschau der Datenquelle , um die Daten in der ausgewählten SQL Server-Tabelle oder -Sicht oder im ausgewählten Excel-Arbeitsblatt anzuzeigen.Click Preview data source to see the data in the SQL Server table or view that you selected, or the Excel worksheet that you selected.

  7. Klicken Sie auf Verbunddomänen anzeigen/auswählen , um eine Liste der in der Wissensdatenbank verfügbaren Verbunddomänen anzuzeigen und entsprechend für die Zuordnung auszuwählen.Click View/Select Composite Domains to view a list of the composite domains available in the knowledge base and select as appropriate for mapping.

  8. Klicken Sie auf Weiter , um zur Abgleichsrichtlinienphase zu wechseln.Click Next to proceed to the matching policy stage.

    Hinweis

    Klicken Sie auf Schließen , um die Phase des Abgleichsprojekts zu speichern und zur DQS-Startseite zurückzukehren.Click Close to save the stage of the matching project, and return to the DQS home page. Wenn Sie dieses Projekt das nächste Mal öffnen, befindet es sich in derselben Phase.The next time you open this project, it will start from the same stage. Klicken Sie auf Abbrechen , um die Abgleichsaktivität zu beenden, ohne Ihre Arbeit zu speichern, und kehren Sie zur DQS-Startseite zurück.Click Cancel to end the matching activity, losing your work, and return to the DQS home page.

AbgleichsrichtlinienphaseMatching Policy Stage

Sie erstellen Abgleichsregeln und testen sie einzeln auf der Abgleichsrichtlinienseite.You create matching rules and test them individually in the Matching Policy page. Wenn Sie eine Abgleichsregel auf der Seite Abgleichsrichtlinie testen, sehen Sie eine Abgleichsergebnistabelle, die die Cluster anzeigt, die DQS für die ausgewählte Regel identifiziert hat.When you test a matching rule on the Matching Policy page, you will see a matching results table that shows the clusters that DQS has identified for the selected rule. In der Tabelle wird jeder Datensatz im Cluster mit den Zuordnungsdomänenwerten und der Treffergenauigkeit sowie der ursprüngliche Pivotdatensatz für den Cluster angezeigt.The table shows each record in the cluster with the mapping domain values and matching score, and the initial pivot record for the cluster. Sie können auch alle Profilerstellungsdaten für den Abgleichsprozess gemeinsam, die Bedingungen in den einzelnen Abgleichsregeln und die Statistiken zu den Ergebnissen für die einzelnen Abgleichsregeln separat anzeigen.You can also display profiling data for the matching process as a whole, the conditions in each matching rule, and statistics on the results for each matching rule separately. Sie können nach den gewünschten Masterregeldaten filtern.You can filter on the master rule data that you want.

Weitere Informationen zur Funktionsweise von Abgleichsregeln finden Sie unter So legen Sie Abgleichsregelparameter fest.For more information on how matching rules work, see How to Set Matching Rule Parameters.

  1. Klicken Sie auf der Seite Abgleichsrichtlinie auf das Symbol Abgleichsregel erstellen .On the Matching Policy page, click the Create a matching rule icon.

  2. Geben Sie einen Namen und eine Beschreibung für die Regel ein.Enter a name and description for the rule.

  3. Vergrößern Sie den Wert für Minimale Treffergenauigkeit , wenn Sie die Abgleichsanforderungen strenger machen möchten.Increase the value of the Min. matching score if you want to make the matching requirements more stringent. Weitere Informationen zur minimalen Treffergenauigkeit finden Sie unter So legen Sie Abgleichsregelparameter fest.For more information about the minimum matching score, see How to Set Matching Rule Parameters.

  4. Klicken Sie auf das Symbol Neues Domänenelement hinzufügen .Click the Add a new domain element icon.

  5. Wählen Sie eine Domäne oder Verbunddomäne aus, für die Sie Regelwerte eingeben möchten.Select a domain or composite domain to enter rule values for.

    Hinweis

    Sie können nur dann eine Verbunddomäne auswählen, wenn jede Einzeldomäne in der Verbunddomäne einer Quellspalte zugeordnet wurde.You can select a composite domain only if each single domain in the composite domain has been mapped to a source column.

  6. Wählen Sie für Ähnlichkeitdie Option Ähnlich aus, wenn zwei Werte im gleichen Feld von zwei verschiedenen Datensätzen auch dann als übereinstimmend angesehen werden können, wenn sie nicht identisch sind.For Similarity, select Similar if two values in the same field of two different records can be considered a match even if not identical. Wählen Sie Genau aus, wenn zwei Werte im gleichen Feld von zwei verschiedenen Datensätzen identisch sein müssen, um als übereinstimmend angesehen zu werden.Select Exact if two values in the same field of two different records must be identical to be considered to be a match. (Weitere Informationen finden Sie unter So legen Sie Abgleichsregelparameter fest.)(For more information, see How to Set Matching Rule Parameters.)

  7. Geben Sie für Gewichtungeinen Wert ein, der den Beitrag der Treffergenauigkeit einer Domäne zur Gesamttreffergenauigkeit für zwei Datensätze bestimmt.For Weight, enter a value that determines the contribution of a domain’s matching score to the overall matching score for two records.

    Hinweis

    Wenn Sie eine Gewichtung für eine Verbunddomäne definieren, können Sie eine andere Gewichtung für jede Einzeldomäne in der Verbunddomäne eingeben. In diesem Fall erhält die Verbunddomäne keine separate Gewichtung. Sie können auch eine einzelne Gewichtung für die Verbunddomäne eingeben, in der die Einzeldomänen keine separaten Gewichtungen erhalten.When you define a weight for a composite domain, you can enter a different weight for each single domain in the composite domain, in which case the composite domain is not given a separate weight, or you can enter a single weight for the composite domain, in which the single domains in the composite domain are not given separate weights.

  8. Wählen Sie Voraussetzung aus, um anzugeben, dass die Werte für das Feld in den zwei Datensätzen eine 100 %-Übereinstimmung zurückgeben müssen. Andernfalls werden die Datensätze nicht als Übereinstimmung angesehen, und die anderen Klauseln in der Regel werden ignoriert.Select Prerequisite to specify that the values for the field in the two records must return a 100% match, else the records are not considered a match and the other clauses in the rule are disregarded. Wenn die Ähnlichkeit auf Ähnlichfestgelegt wurde, wird sie zu Genaugeändert, und die Gewichtung wird entfernt, da die Übereinstimmung 100 % betragen muss.If the Similarity is Similar, it will change to Exact, and the weight will be removed because the match must be 100%.

  9. Wiederholen Sie die Schritte 4 bis 8 für alle anderen Domänen, die Teil der Abgleichsregel sind.Repeat steps 4 through 8 for all other domains that will be part of the matching rule. Stellen Sie sicher, dass die Summe der Gewichtungen für alle Domänen in der Regel 100 entspricht.Ensure that the sum of the weights for all domains in the rule equals 100.

  10. Wählen Sie Überlappende Cluster aus der Dropdownliste aus, um die Pivotdatensätze und die folgenden Datensätze für alle Cluster anzuzeigen, wenn der Abgleich ausgeführt wird, auch wenn Gruppen von Clustern gemeinsame Datensätze aufweisen.Select Overlapping clusters from the drop-down list to display the pivot records and following records for all clusters when matching is executed, even if groups of clusters have records in common. Wählen Sie Nicht überlappende Cluster aus, um Cluster anzuzeigen, die als einzelne Cluster gemeinsame Datensätze aufweisen, wenn der Abgleich ausgeführt wird.Select Non overlapping clusters to display clusters that have records in common as a single cluster when matching is executed.

  11. Klicken Sie auf Erneut aus Datenquelle laden , um Daten aus der Datenquelle in die Stagingtabelle zu laden und neu zu indizieren, wenn Sie die Abgleichsrichtlinie ausführen.Click Reload data from source to copy data from the data source into the staging table and re-index it when you run the matching policy. Klicken Sie auf Für vorherige Daten ausführen , um eine Abgleichsrichtlinie auszuführen, ohne die Daten in die Stagingtabelle zu kopieren und neu zu indizieren.Click Execute on previous data to run a matching policy without copying the data into the staging table and re-indexing the data. Für vorherige Daten ausführen ist für die erste Ausführung der Abgleichsrichtlinie deaktiviert. Dies gilt auch, wenn Sie die Zuordnung auf der Seite Struktur ändern und in der folgenden Meldung auf Ja klicken.Execute on previous data is disabled for the first run of the matching policy, or if you change mapping in the Map page, and then press Yes in the following popup. In beiden Fällen müssen Sie die Daten erneut indizieren.In both of those cases, you must re-index. Die Neuindizierung ist nicht erforderlich, wenn die Abgleichsrichtlinie nicht geändert wurde.It is not necessary to re-index if the matching policy has not changed. Durch die Ausführung für vorherige Daten kann die Leistung verbessert werden.Executing on previous data can help performance.

  12. Klicken Sie auf Start , um den Abgleichsprozess für die ausgewählte Regel auszuführen.Click Start to run the matching process for the selected rule. Wenn der Prozess abgeschlossen wurde, werden in der Tabelle die Datensatz-ID, Clusternummer und Datenspalten (einschließlich derer, die sich nicht in der Abgleichsregel befinden) für jeden Datensatz in einem Cluster angezeigt.When the process is complete, the table displays the Record ID, Cluster number, and data columns (including those not in the matching rule) for each record in a cluster. Die Pivotzeile im Cluster wird als erstklassiger Kandidat zum Verbleiben nach dem Deduplizierungsprozess angesehen.The pivot row in the cluster is considered to be the prime candidate for surviving the de-duplication process. Jede zusätzliche Zeile in einem Cluster wird als Duplikat angesehen; seine Treffergenauigkeit (im Vergleich zum Pivotdatensatz) wird in der Ergebnistabelle bereitgestellt.Each additional row in a cluster is considered a duplicate; its matching score (compared to the pivot record) is provided in the results table. Die Clusternummer ist mit der Datensatz-ID für den Pivotdatensatz im Cluster identisch.The cluster number is that same as the record ID for the pivot record in the cluster.

  13. Sie können in der Tabelle Abgleichsergebnisse wie folgt mit den Daten arbeiten:You can work with the data in the Matching Results table as follows:

    • Wählen Sie unter Filterdie Option Matched aus, um alle übereinstimmenden Zeilen und ihre Ergebnisse anzuzeigen.In Filter, select Matched to show all matched rows and their score. Zeilen, die nicht als übereinstimmend angesehen werden (die eine Treffergenauigkeit unterhalb der minimalen Treffergenauigkeit aufweisen), werden nicht in der Abgleichsergebnistabelle angezeigt.Rows that are not considered matches (that have a matching score less than the minimum matching score) are not shown in the matching results table. Wählen Sie Keine Übereinstimmung aus, um alle Zeilen ohne Übereinstimmung anzuzeigen, nicht die übereinstimmenden Zeilen.Select Unmatched to show all unmatched rows, not matched rows.

    • Wählen Sie im Dropdownfeld Prozenteinen Prozentwert (in Schritten von „5“) aus der Dropdownliste aus.In the Percent Drop Down Box, select a percentage from the drop-down list, in increments of “5”. Alle Zeilen mit einer Treffergenauigkeit, die größer oder gleich diesem Prozentwert ist, werden in der Abgleichsergebnistabelle angezeigt.All rows with a matching score that is greater than or equal to that percentage will be displayed in the matching results table.

    • Wenn Sie auf einen Datensatz in der Abgleichsergebnistabelle doppelklicken, zeigt DQS das Popupfenster Details zur Treffergenauigkeit an, das den Pivotdatensatz und den Quelldatensatz anzeigt (und die Werte in allen ihren Feldern), das Ergebnis zwischen ihnen und einen Drilldown des Datensatzabgleichs.If you double-click a record in the matching results table, DQS displays a Matching Score Details popup that displays the pivot record and source record (and the values in all their fields), the score between them, and a drill-down of the record matching. Der Drilldown zeigt die Werte in jedem Feld des Pivotdatensatzes und Quelldatensatzes an, damit Sie sie vergleichen können, und zeigt die Treffergenauigkeit an, die jedes Feld zur Gesamttreffergenauigkeit für die zwei Datensätze beiträgt.The drill-down displays the values in each field of the pivot record and source record so you can compare them, and shows the matching score that each field contributes to the overall matching score for the two records.

  14. Zeigen Sie die Statistiken auf den Registerkarten Profiler und Abgleichsergebnisse an, um sicherzustellen, dass Sie die benötigten Ergebnisse erzielen.View the statistics in the Profiler and Matching Results tabs to ensure that you are achieving the results that you need. Weitere Informationen finden Sie unter Profiler and Results Tabs.For more information, see Profiler and Results Tabs.

  15. Wenn die Regel geändert werden muss, ändern Sie sie im Regel-Editor, und klicken Sie auf Neustart.If the rule needs to be changed, change it in the Rule Editor, and click Restart.

    Hinweis

    Nachdem die erste Analyse abgeschlossen wurde, wird die Schaltfläche Start zur Schaltfläche Neustart .After the first analysis has completed, the Start button turns into a Restart button. Wenn die Ergebnisse der vorherigen Analyse noch nicht gespeichert wurden, gehen beim Klicken auf Neustart die vorherigen Daten verloren.If the results from the previous analysis have not been saved as yet, clicking Restart will cause that previous data to be lost. Verlassen Sie während der Ausführung der Analyse nicht die Seite, da ansonsten der Analyseprozess abgebrochen wird.As the analysis is running, do not leave the page or the analysis process will be terminated.

  16. Auf der Registerkarte Abgleichsergebnisse werden Statistiken für die letzten zwei Ausführungen der Regel angezeigt.The Matching Results tab displays statistics for the last two runs of the rule. Wenn Sie die Abgleichsregel mehr als einmal mit anderen Einstellungen ausgeführt haben, vergleichen Sie die Statistiken auf die aktuelle Regel und die vorherige Regel.If you have run the matching rule more than once with different settings, compare the statistics for the current rule and the previous rule. Wenn Sie feststellen, dass die Ergebnisse der vorherigen Regel besser waren, klicken Sie auf Vorherige Regel wiederherstellen , um die Bedingungen der vorherigen Regel wiederherzustellen und die Regel auf den Status vor der Bearbeitung zurückzusetzen.If you find that the results from the previous rule were better, click Restore Previous rule to restore the conditions of the previous rule, returning the rule to its previous state before editing. Die aktuellen Regelbedingungen gehen verloren.The current rule conditions will be lost. Dies ermöglicht es Ihnen, die Richtlinie auf Grundlage der letzten zwei Abgleichsausführungen zu optimieren und die Zeit, die Sie zum Optimieren der Abgleichsrichtlinie aufgewendet haben, zu verringern.This enables you to tune the policy based on the last two matching runs, decreasing the time that you spend tuning the matching policy.

  17. Wenn Sie der Abgleichsrichtlinie eine andere Regel hinzufügen möchten, wiederholen Sie den Vorgang ab Schritt 1.If you want another rule to be added to the matching policy, repeat from step 1.

  18. Klicken Sie auf Weiter , um zur Abgleichsergebnisphase zu wechseln.Click Next to proceed to the matching results stage.

AbgleichsergebnisphaseMatching Results Stage

Sie testen alle Abgleichsregeln sofort auf der Seite Abgleichsergebnisse .You test all your matching rules at once in the Matching Results page. Davor können Sie angeben, dass der Regeltestlauf überlappende oder nicht überlappende Cluster identifizieren soll.Before you do so, you can specify that the rule test run identify overlapping or non-overlapping clusters. Wenn Sie die Regeln mehrfach ausführen, können Sie die Regel auf von der Quelle erneut geladenen Daten oder auf vorherigen Daten ausführen.If you are running the rules multiple times, you can execute the rule on data reloaded from the source or on previous data.

Wenn Sie die Abgleichsregeln auf der Seite Abgleichsergebnisse testen, sehen Sie eine Abgleichsergebnistabelle, die die Cluster anzeigt, die DQS für alle Regeln identifiziert hat.When you test the matching rules on the Matching Results page, you will see a matching results table that shows the clusters that DQS has identified for all rules. In der Tabelle wird jeder Datensatz im Cluster mit den Zuordnungsdomänenwerten und der Treffergenauigkeit sowie der ursprüngliche Pivotdatensatz für den Cluster angezeigt.The table shows each record in the cluster with the mapping domain values and matching score, and the initial pivot record for the cluster. Sie können auch alle Profilerstellungsdaten für die Abgleichsregeln gemeinsam, die Bedingungen in den einzelnen Abgleichsregeln und die Statistiken zu den Ergebnissen für alle Abgleichsregeln anzeigen.You can also display profiling data for the matching rules as a whole, the conditions in each matching rule, and statistics on the results for all matching rules.

  1. Wählen Sie auf der Seite Abgleichsergebnisse aus der Dropdownliste die Option Überlappende Cluster aus, um die Pivotdatensätze und die folgenden Datensätze für alle Cluster anzuzeigen, wenn der Abgleich ausgeführt wird, auch wenn Gruppen von Clustern gemeinsame Datensätze aufweisen.On the Matching Results page, select Overlapping clusters from the drop-down list to display the pivot records and following records for all clusters when matching is executed, even if groups of clusters have records in common. Wählen Sie Nicht überlappende Cluster aus, um Cluster anzuzeigen, die als einzelne Cluster gemeinsame Datensätze aufweisen, wenn der Abgleich ausgeführt wird.Select Non overlapping clusters to display clusters that have records in common as a single cluster when matching is executed.

  2. Klicken Sie auf Erneut aus Datenquelle laden , um Daten aus der Datenquelle in die Stagingtabelle zu laden und neu zu indizieren, wenn Sie die Abgleichsrichtlinie ausführen.Click Reload data from source to copy data from the data source into the staging table and re-index it when you run the matching policy. Klicken Sie auf Für vorherige Daten ausführen , um eine Abgleichsrichtlinie auszuführen, ohne die Daten in die Stagingtabelle zu kopieren und neu zu indizieren.Click Execute on previous data to run a matching policy without copying the data into the staging table and re-indexing the data. Für vorherige Daten ausführen ist für die erste Ausführung der Abgleichsrichtlinie deaktiviert. Dies gilt auch, wenn Sie die Zuordnung auf der Seite Struktur ändern und in der folgenden Meldung auf Ja klicken.Execute on previous data is disabled for the first run of the matching policy, or if you change mapping in the Map page, and then press Yes in the following popup. In beiden Fällen müssen Sie die Daten erneut indizieren.In both of those cases, you must re-index. Die Neuindizierung ist nicht erforderlich, wenn die Abgleichsrichtlinie nicht geändert wurde.It is not necessary to re-index if the matching policy has not changed. Durch die Ausführung für vorherige Daten kann die Leistung verbessert werden.Executing on previous data can help performance.

  3. Klicken Sie auf Start , um den Abgleichsprozess für alle von Ihnen definierten Regeln auszuführen.Click Start to run the matching process for all rules that you have defined. In der Tabelle Abgleichsergebnisse werden die Datensatz-ID, Clusternummer und Datenspalten (einschließlich derer, die sich nicht in der Abgleichsregel befinden) für jeden Datensatz in einem Cluster angezeigt.The Matching Results table displays the record ID, cluster number, and data columns (including those not in the matching rule) for each record in a cluster. Der führende Datensatz im Cluster wird zufällig ausgewählt.The leading record in the cluster is selected randomly. (Sie bestimmen den überdauernden Datensatz durch Auswählen der Survivorship-Regel auf der Seite Exportieren, wenn Sie das Abgleichsprojekt ausführen.) Jede zusätzliche Zeile in einem Cluster wird als Duplikat angesehen; seine Treffergenauigkeit (im Vergleich zum Pivotdatensatz) wird in der Ergebnistabelle bereitgestellt.(You determine the surviving record by selected the survivorship rule on the Export page when you run the matching project.) Each additional row in a cluster is considered a duplicate; its matching score (compared to the pivot record) is provided in the results table.

  4. Sie können in der Tabelle Abgleichsergebnisse wie folgt mit den Daten arbeiten:You can work with the data in the Matching Results table as follows:

    • Wählen Sie unter Filterdie Option Matched aus, um alle übereinstimmenden Zeilen und ihre Ergebnisse anzuzeigen.In Filter, select Matched to show all matched rows and their score. Zeilen, die nicht als übereinstimmend angesehen werden (die eine Treffergenauigkeit unterhalb der minimalen Treffergenauigkeit aufweisen), werden nicht in der Abgleichsergebnistabelle angezeigt.Rows that are not considered matches (that have a matching score less than the minimum matching score) are not shown in the matching results table. Wählen Sie Keine Übereinstimmung aus, um alle Zeilen ohne Übereinstimmung anzuzeigen, nicht die übereinstimmenden Zeilen.Select Unmatched to show all unmatched rows, not matched rows.

    • Wählen Sie im Dropdownfeld Prozenteinen Prozentwert (in Schritten von „5“) aus der Dropdownliste aus.In the Percent Drop Down Box, select a percentage from the drop-down list, in increments of “5”. Alle Zeilen mit einer Treffergenauigkeit, die größer oder gleich diesem Prozentwert ist, werden in der Abgleichsergebnistabelle angezeigt.All rows with a matching score that is greater than or equal to that percentage will be displayed in the matching results table.

    • Wenn Sie auf einen Datensatz in der Abgleichsergebnistabelle doppelklicken, zeigt DQS das Popupfenster Details zur Treffergenauigkeit an, das den Pivotdatensatz und den Quelldatensatz anzeigt (und die Werte in allen ihren Feldern), das Ergebnis zwischen ihnen und einen Drilldown des Datensatzabgleichs.If you double-click a record in the matching results table, DQS displays a Matching Score Details popup that displays the pivot record and source record (and the values in all their fields), the score between them, and a drill-down of the record matching. Der Drilldown zeigt die Werte in jedem Feld des Pivotdatensatzes und Quelldatensatzes an, damit Sie sie vergleichen können, und zeigt die Treffergenauigkeit an, die jedes Feld zur Gesamttreffergenauigkeit für die zwei Datensätze beiträgt.The drill-down displays the values in each field of the pivot record and source record so you can compare them, and shows the matching score that each field contributes to the overall matching score for the two records.

  5. Zeigen Sie die Statistiken auf den Registerkarten Profiler und Abgleichsergebnisse an, um sicherzustellen, dass Sie die benötigten Ergebnisse erzielen.View the statistics in the Profiler and Matching Results tabs to ensure that you are achieving the results that you need. Klicken Sie auf die Registerkarte Abgleichsregeln , um die Domäneneinstellungen für die einzelnen Regeln anzuzeigen.Click the Matching Rules tab to see what the domain settings for each rule are. Weitere Informationen finden Sie unter Profiler and Results Tabs.For more information, see Profiler and Results Tabs.

  6. Wenn Sie mit den Ergebnissen aller Regeln nicht zufrieden sind, klicken Sie auf Zurück , um zur Seite Abgleichsrichtlinie zurückzukehren, ändern Sie ggf. eine oder mehrere Regeln, kehren Sie zur Seite Abgleichsergebnisse zurück, und klicken Sie dann auf Neustart.If you are not satisfied with the results of all rules, then click Back to return to the Matching Policy page, modify one or more rules as necessary, return to the Matching Results page, and then click Restart.

    Hinweis

    Nachdem die Analyse abgeschlossen wurde, wird die Schaltfläche Start zur Schaltfläche Neustart .After the analysis has completed, the Start button turns into a Restart button. Wenn die Ergebnisse der vorherigen Analyse noch nicht gespeichert wurden, gehen beim Klicken auf Neustart die vorherigen Daten verloren.If the results from the previous analysis have not been saved as yet, clicking Restart will cause that previous data to be lost.

  7. Wenn Sie mit den Ergebnissen aller Regeln zufrieden sind, klicken Sie auf Fertig stellen , um den Abgleichsrichtlinienprozess abzuschließen, und klicken Sie auf eine der folgenden Optionen:If you are satisfied with the results of all rules, click Finish to complete the matching policy process, and then click one of the following:

    • Ja – Wissensdatenbank veröffentlichen und beenden: Die Wissensdatenbank wird veröffentlicht und kann vom aktuellen Benutzer oder von anderen Benutzern verwendet werden.Yes – Publish the knowledge base and exit: The knowledge base will be published for the current user or others to use. Die Wissensdatenbank wird nicht gesperrt, der Status der Wissensdatenbank (in der Wissensdatenbanktabelle) wird auf leer festgelegt, und die Aktivitäten für die Domänenverwaltung sowie die Wissensermittlung sind verfügbar.The knowledge base will not be locked, the state of the knowledge base (in the knowledge base table) will be set to empty, and both the Domain Management and Knowledge Discovery activities will be available. Sie kehren zur Seite „Wissensdatenbank öffnen“ zurück.You will be returned to the Open Knowledge Base screen.

    • Nein – Arbeit in der Wissensdatenbank speichern und beenden: Ihre Arbeit wird gespeichert, die Wissensdatenbank bleibt gesperrt, und der Status der Wissensdatenbank wird auf In Arbeitfestgelegt.No – Save the work on the knowledge base and exit: Your work will be saved, the knowledge base will remained locked, and the state of the knowledge base will be set to In work. Sowohl die Domänenverwaltungs- als auch die Wissensermittlungsaktivitäten sind verfügbar.Both the Domain Management and Knowledge Discovery activities will be available. Sie kehren zur Startseite zurück.You will be returned to the home page.

    • Abbrechen – Im aktuellen Fenster bleiben: Das Popupfenster wird geschlossen, und Sie kehren zum Fenster „Domänenverwaltung“ zurück.Cancel – Stay on the current screen: The popup will be closed and you will be returned to the Domain Management screen.

  8. Klicken Sie auf Schließen , um die Arbeit zu speichern, und kehren Sie zur DQS-Startseite zurück.Click Close to save your work, and return to the DQS home page. Der Status der Wissensdatenbank zeigt die Zeichenfolge „Abgleichsrichtlinie - “ und den aktuellen Status an.The state of the knowledge base will show the string “Matching Policy – “, and the current state. Wenn Sie auf Schließen klicken, während Sie auf dem Bildschirm Abgleichsergebnis sind, zeigt der Status Folgendes an: „Abgleichsrichtlinie - Ergebnisse“.If you clicked Close while you are in the Matching Result screen, the state will show: "Matching Policy - Results". Wenn Sie auf „Schließen“ klicken, während Sie auf dem Bildschirm Abgleichsrichtlinie sind, zeigt der Status Folgendes an: „Abgleichsrichtlinie - Abgleichsrichtlinie“.If you clicked close while you are in the Matching Policy screen, the state will show: “Matching Policy - Matching Policy”. Nachdem Sie auf Schließengeklickt haben, um die Wissensermittlungsaktivität auszuführen, müssen Sie zur Aktivität Abgleichsrichtlinie zurückkehren, auf Fertig stellenklicken und dann auf Ja klicken, um die Wissensdatenbank zu veröffentlichen, oder auf Nein , um die Arbeit an der Wissensdatenbank zu speichern und zu beenden.After clicking Close, to perform the Knowledge Discovery activity, you would have to return to the Matching policy activity, click Finish, and then click either Yes to publish the knowledge base or No to save the work on the knowledge base and exit.

    Hinweis

    Wenn Sie auf Schließen klicken, während ein Abgleichsprozess ausgeführt wird, wird der Abgleichsprozess nicht beendet, wenn Sie auf Schließenklicken.If you click Close while a matching process is running, the matching process will not terminate when you click Close. Sie können die Wissensdatenbank erneut öffnen und sehen, dass der Prozess immer noch ausgeführt wird oder dass die Ergebnisse angezeigt werden, falls er abgeschlossen wurde.You can reopen the knowledge base and see either that the process is still running, or if completed, that the results are displayed. Wenn der Prozess nicht abgeschlossen wurde, wird der Fortschritt auf dem Bildschirm angezeigt.If the process has not completed, the screen will display the progress.

  9. Klicken Sie auf Abbrechen , um die Abgleichsrichtlinienaktivität abzubrechen, ohne die Ergebnisse zu speichern, und um zur DQS-Startseite zurückzukehren.Click Cancel to terminate the Matching Policy activity, losing your work, and return to the DQS home page.

Nachverfolgung: Nach dem Erstellen einer AbgleichsrichtlinieFollow Up: After Creating a Matching Policy

Nachdem Sie eine Abgleichsrichtlinie erstellt haben, können Sie ein Abgleichsprojekt basierend auf der Wissensdatenbank, die die Abgleichsrichtlinie enthält, ausführen.After you create a matching policy, you can run a matching project based upon the knowledge base that contains the matching policy. Weitere Informationen finden Sie unter Ausführen eines Abgleichsprojekts.For more information, see Run a Matching Project.

Profiler and Results TabsProfiler and Results Tabs

Die Registerkarten „Profiler“ und „Ergebnisse“ enthalten Statistiken für die Abgleichsrichtlinie und die Abgleichsergebnisseiten.The Profiler and Results tab contain statistics for both the Matching Policy and the Matching Results pages.

Registerkarte „Profiler“Profiler Tab

Klicken Sie auf die Registerkarte Profiler , um Statistiken für die Quelldatenbank und für alle in der Richtlinienregel enthaltenen Felder anzuzeigen.Click the Profiler tab to display statistics for the source database and for each field included in the policy rule. Die Statistiken werden aktualisiert, wenn die Richtlinienregel ausgeführt wird.The statistics will be updated as the policy rule is run.

Weitere Informationen zum Interpretieren der folgenden Statistiken finden Sie unter So legen Sie Abgleichsregelparameter fest.For more information on how to interpret the following statistics, see How to Set Matching Rule Parameters.

Die Quelldatenbankstatistiken umfassen Folgendes:The source database statistics include the following:

  • Datensätze: Die Gesamtzahl der Datensätze in der QuelldatenbankRecords: The total number of records in the source database

  • Gesamtwerte: Die Gesamtzahl der Werte in den Feldern der DatenquelleTotal Values: The total number of values in the fields of the data source

  • Neue Werte: Die Gesamtzahl der Werte, die seit der vorherigen Ausführung neu sind, und ihr prozentualer Anteil am GanzenNew Values: The total number of values that are new since the previous run, and their percentage of the whole

  • Eindeutige Werte: Die Gesamtzahl der eindeutigen Werte in den Feldern und ihr prozentualer Anteil am GanzenUnique Values: The total number of unique values in the fields, and their percentage of the whole

  • Neue eindeutige Werte: Die Gesamtzahl der eindeutigen Werte, die neu in den Feldern sind, und ihr prozentualer Anteil am GanzenNew Unique Values: The total number of unique values that are new in the fields, and their percentage of the whole

    Die Feldstatistiken umfassen Folgendes:The field statistics include the following:

  • FeldnameField name

  • DomänennameDomain name

  • Neu: Die Anzahl der neuen Werte und die Prozentzahlen neuer Werte im Vergleich zu vorhandenen Werten in der DomäneNew: The number of new values and the percent of new values compared to existing values in the domain

  • Eindeutig: Die Gesamtzahl der eindeutigen Datensätze in den Feldern und ihr prozentualer Anteil am GanzenUnique: The number of unique records in the field and their percentage of the total

  • Vollständigkeit: Die Vollständigkeit jedes Quellfelds, das für den Abgleich zugeordnet istCompleteness: The completeness of each source field that is mapped for the matching exercise

AbgleichsrichtlinienbenachrichtigungenMatching Policy Notifications

Für die Abgleichsrichtlinienaktivität führen die folgenden Bedingungen zu Benachrichtigungen:For the matching policy activity, the following conditions result in notifications:

  • Das Feld ist in allen Datensätzen leer; Sie sollten es aus der Zuordnung entfernen.The field is empty in all records; it is recommended that you eliminate it from mapping.

  • Das Feldvollständigkeitsergebnis ist sehr niedrig; Sie sollten es aus der Zuordnung entfernen.The field completeness score is very low; you may want to eliminate it from mapping.

  • Alle Werte in einem Feld sind ungültig; Sie sollten die Zuordnung und die Relevanz von Domänenregeln für den Feldinhalt überprüfen.All values in a field are invalid; you should verify the mapping and the relevancy of domain rules to the field contents.

  • Es gibt nur wenige gültige Werte im Feld; Sie sollten die Zuordnung und die Relevanz von Domänenregeln für den Feldinhalt überprüfen.There is a low level of valid values in the field; you should verify the mapping and the relevancy of domain rules to the field contents.

  • Es gibt einen hohen Eindeutigkeitsgrad in diesem Feld.There is a high level of uniqueness in this field. Das Verwenden dieses Felds in Abgleichsrichtlinien kann die Abgleichsergebnisse reduzieren.Using this field in matching policy can decrease the matching results.

Registerkarte „Abgleichsergebnisse“Matching Results Tab

Klicken Sie auf die Registerkarte Abgleichsergebnisse , um Statistiken für die Ausführung der Abgleichsrichtlinienregel und der vorherigen Regel anzuzeigen.Click the Matching Results tab to display statistics for the matching policy rule run, and the previous rule run. Wenn Sie die gleiche Regel mehrmals mit anderen Parametern ausgeführt haben, werden in der Abgleichsergebnistabelle Statistiken für beide Ausführungen angezeigt, sodass Sie sie miteinander vergleichen können.If you have run the same rule more than once with different parameters, the matching results table will display statistics for both runs, enabling you to compare them. Sie können die vorherige Regel bei Bedarf auch wiederherstellen.You can also restore the previous rule if you would like.

Die Statistiken umfassen Folgendes:The statistics include the following:

  • Die Gesamtzahl der Datensätze in der DatenbankThe total number of records in the database

  • Die Gesamtzahl der übereinstimmenden Datensätze in der DatenbankThe total number of matching records in the database

  • Die Anzahl von Datensätzen in der Datenbank, die nicht als Duplikate angesehen werdenThe number of records in the database that are not considered to be duplicates

  • Die Anzahl der ermittelten ClusterThe number of clusters discovered

  • Die durchschnittliche Clustergröße (die Anzahl doppelter Datensätze geteilt durch die Anzahl der Cluster)The average cluster size (number of duplicate records divided by number of clusters)

  • Die geringste Anzahl von Duplikaten in einem ClusterThe fewest number of duplicates in a cluster

  • Die größte Anzahl von Duplikaten in einem ClusterThe greatest number of duplicates in a cluster