Pulire i dati in un dominio compositoCleanse Data in a Composite Domain

In questo argomento vengono fornite informazioni sulla pulizia dei domini compositi in Data Quality ServicesData Quality Services (DQS).This topic provides information about cleansing of composite domains in Data Quality ServicesData Quality Services (DQS). Un dominio composito è costituito da due o più singoli domini di cui viene eseguito il mapping a un campo dati costituito da più termini correlati.A composite domain consists of two or more single domains, and maps to a data field that consists of multiple related terms. I singoli domini in un dominio composito devono contenere un'area delle informazioni in comune.The individual domains in a composite domain must have a common area of knowledge. Per informazioni dettagliate sui domini compositi, vedere Managing a Composite Domain.For detailed information about composite domains, see Managing a Composite Domain.

Esecuzione del mapping di un dominio composito ai dati di origineMapping a Composite Domain to the Source Data

Sono disponibili due modalità per eseguire il mapping dei dati di origine a un dominio composito:There are two ways in which you can map your source data to a composite domain:

  • Dati di origine costituiti da un singolo campo, ad esempio Nome e cognome, di cui viene eseguito il mapping a un dominio composito.The source data is a single field (let’s say Full Name), which is mapped to a composite domain.

    • Se il mapping del dominio composito viene eseguito a un servizio dati di riferimento, i dati di origine verranno inviati così come sono al servizio dati di riferimento per la correzione e l'analisi.If the composite domain is mapped to a reference data service, the source data will be sent as is to the reference data service for correction and parsing.

    • Se il mapping del dominio composito non viene eseguito a un servizio dati di riferimento, i dati di origine verranno analizzati in base al metodo di analisi definito per il dominio composito.If the composite domain is not mapped to a reference data service, will be parsed based on the parsing method defined for the composite domain. Per ulteriori informazioni sulla specifica di un metodo di analisi per i domini compositi, vedere Create a Composite Domain.For more information about specifying a parsing method for composite domains, see Create a Composite Domain

  • Dati di origine costituiti da più campi, ad esempio Nome, Secondo nome e Cognome, di cui viene eseguito il mapping ai singoli domini all'interno di un dominio composito.The source data consists of multiple fields (let’s say First Name, Middle Name, and Last Name), which are mapped to individual domains within a composite domain.

    Per un esempio di come eseguire il mapping di domini compositi sui dati di origine, vedere Collegare un dominio o un dominio composito ai dati di riferimento.For an example of how to map composite domains to source data, see Attach Domain or Composite Domain to Reference Data.

Correzione dei dati mediante le regole definitive tra dominiData Correction using Definitive Cross-Domain Rules

Le regole tra domini in un dominio composito consentono di creare regole che indicano la relazione tra i singoli domini in un dominio composito.Cross-domain rules in composite domain enable you to create rules that indicate relationship between individual domains in a composite domain. Le regole tra domini vengono prese in considerazione quando si esegue l'attività di pulizia sui dati di origine relativi ai domini compositi.Cross-domain rules are taken into account when you run the cleansing activity on your source data involving composite domains. Oltre a indicare la validità di una regola tra domini, la regola definitiva tra domini Then , Il valore è uguale a, corregge anche i dati durante l'attività di pulizia dei dati.Apart from just letting you know about the validity of a cross-domain rule, the definitive Then cross-domain rule, Value is equal to, also corrects the data during the data-cleansing activity.

Considerare l'esempio seguente. Si supponga di avere un dominio composito, Product, con tre singoli domini: ProductName, CompanyName e ProductVersion.Consider the following example: there is a composite domain, Product, with three individual domains: ProductName, CompanyName, and ProductVersion. Creare la regola definitiva tra domini seguente:Create the following definitive cross-domain rule:

Se il valore ‘CompanyName’ del dominio contiene Microsoft e il valore ‘ProductName’ del dominio è uguale a Office e il valore ‘ProductVersion’ è uguale a 2010 THEN il valore ‘ProductName’ del dominio è uguale a Microsoft Office 2010.IF Domain ‘CompanyName’ Value contains Microsoft and Domain ‘ProductName’ Value is equal to Office and ‘ProductVersion’ Value is equal to 2010 THEN Domain ‘ProductName’ Value is equal to Microsoft Office 2010.

Quando questa regola tra domini viene eseguita, i dati di origine (ProductName) verranno corretti come segue dopo l'attività di pulizia:When this cross-domain rule runs, the source data (ProductName) gets corrected to the following after the cleansing activity:

Origine datiSource Data

ProductNameProductName CompanyNameCompanyName ProductVersionProductVersion
OfficeOffice Microsoft Inc.Microsoft Inc. 20102010

Dati di outputOutput Data

ProductNameProductName CompanyNameCompanyName ProductVersionProductVersion
Microsoft Office 2010Microsoft Office 2010 Microsoft Inc.Microsoft Inc. 20102010

Quando viene eseguito il test della regola definitiva tra domini Then , Il valore è uguale a, la finestra di dialogo Test regola dominio composito conterrà una nuova colonna, Correggi in, in cui vengono visualizzati i dati corretti.When you test the definitive Then cross-domain rule, Value is equal to, the Test Composite Domain Rule dialog box contains a new column, Correct To, which displays the correct data. In un progetto Data Quality per la pulizia dei dati, questa regola definitiva tra domini modifica i dati con livello di attendibilità del 100% e nella colonna Motivo viene visualizzato il messaggio seguente: Con correzione in base alla regola <.In a cleansing data quality project, this definitive cross-domain rule changes the data with 100% confidence, and the Reason column displays the following message: Corrected by Rule ‘<Cross-Domain Rule Name>’. Per ulteriori informazioni sulle regole tra domini, vedere Create a Cross-Domain Rule.For more information about cross domain rules, see Create a Cross-Domain Rule.

Nota

La regola definitiva tra domini non funziona per i domini compositi associati al servizio dati di riferimento.The definitive cross-domain rule will not work for composite domains that are attached to reference data service.

Profiling dei dati per i domini compositiData Profiling for Composite Domains

Il profiling DQS fornisce due dimensioni della qualità dei dati: completezza (l'entità della presenza dei dati) e accuratezza (la misura entro cui i dati possono essere utilizzati per gli scopi previsti) durante l'attività di pulizia.DQS profiling provides two data quality dimensions: completeness (the extent to which data is present) and accuracy (the extent to which data can be used for its intended use) during the cleansing activity. È possibile che il profiling non fornisca statistiche di completezza affidabili per i domini compositi.Profiling may not provide reliable completeness statistics for composite domains. Se sono necessarie statistiche di completezza, utilizzare domini singoli anziché domini compositi.If you need completeness statistics, use single domains instead of composite domains. Se si desidera utilizzare domini compositi, è consigliabile creare una Knowledge Base con domini singoli di cui eseguire il profiling per determinare la completezza, quindi creare un altro dominio con un dominio composito per l'attività di pulizia.If you want to use composite domains, you may want to create one knowledge base with single domains for profiling, to determine completeness, and create another domain with a composite domain for the cleansing activity. Ad esempio, il profiling potrebbe mostrare una completezza del 95% per record relativi a indirizzi, utilizzando un dominio composito, ma potrebbe esservi un livello di incompletezza molto più alto per una delle colonne, ad esempio una colonna relativa al codice postale (CAP).For example, profiling could show 95% completeness for address records using a composite domain, but there could be a much higher level of incompleteness for one of the columns, for example, a postal (zip) code column. In questo esempio, è necessario misurare la completezza della colonna del CAP con un solo dominio.In this example, you might want to measure the completeness of the zip code column with a single domain.

Il profiling fornirà probabilmente statistiche di accuratezza affidabili per i domini compositi perché è possibile misurare l'accuratezza di più colonne allo stesso tempo.Profiling will likely provide reliable accuracy statistics for composite domains because you can measure accuracy for multiple columns together. Il valore di questi dati sta nell'aggregazione composta, pertanto è consigliabile misurarne l'accuratezza con un dominio composito.The value of this data is in the composite aggregation, so you may want to measure the accuracy with a composite domain.

Per altre informazioni sul profiling di dati durante l'attività di pulizia, vedere Statistiche del profiler in Pulire i dati mediante DQS (informazioni interne).For detailed information about data profiling during the cleansing activity, see Profiler Statistics in Cleanse Data Using DQS (Internal) Knowledge.