Eseguire un progetto corrispondenteRun a Matching Project

In questo argomento viene descritto come eseguire la corrispondenza dei dati in Data Quality ServicesData Quality Services (DQS).This topic describes how to perform data matching in Data Quality ServicesData Quality Services (DQS). Il processo di corrispondenza identifica i cluster di record corrispondenti in base alle regole di corrispondenza nei criteri di corrispondenza, definisce un record da ogni cluster come superstite in base a una regola di sopravvivenza ed esporta i risultati.The matching process identifies clusters of matching records based upon matching rules in the matching policy, designates one record from each cluster as the survivor based upon a survivorship rule, and exports the results. In DQS il processo di corrispondenza, definito anche deduplicazione, è computerizzato ma è possibile creare alcune regole di corrispondenza in modo interattivo e selezionare la regola di sopravvivenza tra diverse opzioni, in modo da controllare comunque il processo.DQS performs the matching process, also called de-duplication, in a computer-assisted process, but you create matching rules interactively, and you select the survivorship rule from several choices, so you control the matching process.

La corrispondenza viene eseguita in tre fasi: un processo di mapping in cui si identifica l'origine dati e si esegue il mapping dei domini all'origine dati; un processo di corrispondenza in cui si esegue l'analisi di corrispondenza; un processo di sopravvivenza ed esportazione in cui si definisce la regola di sopravvivenza e si esportano i risultati di corrispondenza.Matching is performed in three stages: a mapping process in which you identify the data source and map domains to the data source, a matching process in which you run the matching analysis, and a survivorship and export process in which you designate the survivorship rule and export the matching results. Ognuno di questi processi viene eseguito in una pagina separata della procedura guidata relativa all'attività di corrispondenza, consentendo all'utente di spostarsi da una pagina a un'altra al fine di rieseguire il processo, completare un processo di corrispondenza specifico e tornare nuovamente a una fase specifica.Each of these processes is performed on a separate page of the Matching activity wizard, enabling you to move back and forth to different pages, to re-run the process, and to close out of a specific matching process and then return to the same stage of the process. DQS fornisce statistiche relative ai dati di origine, alle regole e ai risultati di corrispondenza. Tali statistiche consentono di prendere decisioni informate sulla corrispondenza e di ridefinire il processo di corrispondenza.DQS provides you with statistics about the source data, the matching rules, and the matching results that enable you to make informed decisions about matching, and refine the matching process.

La preparazione del processo di corrispondenza prevede la creazione dei criteri di corrispondenza con uno o più regole di corrispondenza e l'esecuzione dei criteri sui dati di esempio.You must prepare for matching by creating a matching policy with one or more matching rules, and running the policy on sample data. Il processo del progetto corrispondente è diverso dal processo per i criteri di corrispondenza in quanto la Knowledge Base non viene popolata con le informazioni di corrispondenza ottenute dal progetto corrispondente.The matching project process is separate from the matching policy process, and a knowledge base is not populated with matching knowledge gained from the matching project. Per ulteriori informazioni sulla creazione dei criteri di corrispondenza, vedere Create a Matching Policy.For more information about creating a matching policy, see Create a Matching Policy.

Prima di iniziare Before You Begin

Prerequisiti Prerequisites

  • È necessario avere creato una Knowledge Base con criteri di corrispondenza composti da una o più regole di corrispondenza.You must have created a knowledge base with a matching policy consisting of one or more matching rules.

  • Se i dati di origine per la corrispondenza si trovano in un file di Excel, è necessario che Microsoft Excel sia installato nel computer del Client Data QualityData Quality Client .Microsoft Excel must be installed on the Client Data QualityData Quality Client computer if the source data to be matched is in an Excel file. In caso contrario, non sarà possibile selezionare il file di Excel nella fase di mapping.Otherwise, you will not be able to select the Excel file in the mapping stage. I file creati da Microsoft Excel potranno presentare l'estensione xlsx, xls o csv.The files created by Microsoft Excel can have an extension of .xlsx, .xls, or .csv. Se viene utilizzata la versione a 64 bit di Excel, sono supportati solo i file di Excel 2003 (xls), mentre non sono supportati file di Excel 2007 o 2010 (xlsx).If the 64-bit version of Excel is used, only Excel 2003 files (.xls) are supported; Excel 2007 or 2010 files (.xlsx) are not supported. Se si utilizza una versione a 64 bit di Excel 2007 o 2010, salvare il file come file xls o csv o installare una versione a 32 bit di Excel.If you are using 64-bit version of Excel 2007 or 2010, save the file as an .xls file or a .csv file, or install a 32-bit version of Excel instead.

Sicurezza Security

Autorizzazioni Permissions

Per eseguire un progetto corrispondente, è necessario disporre del ruolo dqs_kb_editor o dqs_administrator nel database DQS_MAIN.You must have the dqs_kb_editor or the dqs_administrator role on the DQS_MAIN database to run a matching project.

Primo passaggio: avvio di un progetto corrispondente First Step: Starting a Matching Project

L'attività di corrispondenza viene eseguita in un progetto Data Quality creato nell'applicazione client DQS.You perform the matching activity in a data quality project that you create in the DQS client application.

  1. Avviare client Data Quality.Start Data Quality Client. Per informazioni su questa operazione, vedereFor information about doing so, see Eseguire l'applicazione Data Quality Client. Run the Data Quality Client Application.

  2. Nella schermata iniziale del Client Data QualityData Quality Client fare clic su Nuovo progetto Data Quality per eseguire la corrispondenza in un nuovo progetto Data Quality.In the Client Data QualityData Quality Client home screen, click New Data Quality Project to perform matching in a new data quality project. Immettere un nome per il progetto Data Quality, immettere una descrizione e selezionare la Knowledge Base che si desidera utilizzare per la corrispondenza in Usa Knowledge Base.Enter a name for the data quality project, enter a description, and select the knowledge base that you want to use for matching in Use knowledge base. Fare clic su Corrispondenza per l'attività.Click Matching for the activity. Fare clic su Avanti per passare alla fase di mapping.Click Next to proceed to the mapping stage.

  3. Fare clic su Apri progetto Data Quality per eseguire la corrispondenza in un progetto Data Quality esistente.Click Open data quality project to perform matching in an existing data quality project. Selezionare il progetto, quindi fare clic su Avanti.Select the project and then click Next. In alternativa, è possibile fare clic su un progetto in Progetto Data Quality recente. Se si apre un progetto corrispondente chiuso, si procederà con la fase in cui tale attività è stata chiusa, come indicato dalla colonna Stato nella tabella o nel nome del progetto in Progetto Data Quality recente.(Or you can click a project under Recent Data Quality Project.) If you open a matching project that was closed, you will proceed to the stage that the matching project activity was closed in (as indicated by the State column in the project table or in the project name under Recent Data Quality Project). Se si apre un progetto corrispondente completato, si passerà alla pagina Esporta e non sarà più possibile tornare alle schermate precedenti.If you open a matching project that was finished, you will go to the Export page (and you cannot go back to previous screens).

Fase di mapping Mapping Stage

Nella fase di mapping si identifica l'origine dei dati in cui verrà eseguita l'analisi di corrispondenza e si esegue il mapping delle colonne di origine ai domini per rendere tali domini disponibili per l'attività di corrispondenza.In the mapping stage you identify the source of the data that you will run the matching analysis on, and you map source columns to domains to make the domains available for the matching activity.

  1. Nella pagina Mappa , per eseguire la corrispondenza su un database, lasciare selezionato SQL Server come Origine dati, selezionare il database su cui si desidera eseguire la corrispondenza, quindi selezionare la tabella.On the Map page, to run matching on a database, leave Data Source as SQL Server, select the database that you want to run matching on, and then select the table. Il database di origine deve trovarsi nella stessa istanza di SQL Server del server DQS.The source database must be present in the same SQL Server instance as the DQS server. in caso contrario, non verrà visualizzato nell'elenco a discesa.Otherwise, it will not appear in the drop-down list.

  2. Per eseguire la corrispondenza sui dati in un foglio di calcolo di Excel, selezionare File di Excel come Origine dati, fare clic su Sfoglia e selezionare il file di Excel, quindi lasciare selezionato Utilizza la prima riga come intestazione , se appropriato.To run matching on the data in an Excel spreadsheet, select Excel File for Data Source, click Browse and select the Excel file, and leave Use first row as header selected if appropriate. In Foglio di lavoroselezionare il foglio di lavoro nel file di Excel che fungerà da origine dei dati.In Worksheet, select the worksheet in the Excel file that will be the source of the data. Per selezionare un file di Excel, è necessario che Excel sia installato nel computer del Client Data QualityData Quality Client .Excel must be installed on the Client Data QualityData Quality Client computer to select an Excel file. Se Excel non è installato nel computer del Client Data QualityData Quality Client , il pulsante Sfoglia non sarà disponibile e verrà visualizzata una notifica sotto questa casella di testo in cui si avvisa che Excel non è installato.If Excel is not installed on the Client Data QualityData Quality Client computer, the Browse button will not be available, and you will be notified beneath this text box that Excel is not installed.

  3. In Mapping, selezionare un campo nell'origine dati per Colonna di origine, quindi selezionare il dominio corrispondente.Under Mappings, select a field in the data source for Source Column, and then select the corresponding domain. Ripetere l'operazione per tutti i domini da utilizzare per il processo di corrispondenza.Repeat for all domains that you use in the matching process. È necessario che per ogni dominio definito nei criteri di corrispondenza venga eseguito il mapping alla colonna di origine appropriata.Each domain that is defined in the matching policy must be mapped to the appropriate source column. Nel riquadro destro della pagina Mappa vengono visualizzati i domini definiti nei criteri di corrispondenza e le relative regole.The Map page displays the domains that have been defined in the matching policy and the rules in the matching policy in the right-hand pane.

    Nota

    È possibile eseguire il mapping dei dati di origine a un dominio DQS solo se il tipo di dati di origine è supportato in DQS e corrisponde al tipo di dati del dominio DQS.You can map your source data to a DQS domain only if the source data type is supported in DQS, and matches with the DQS domain data type. Per ulteriori informazioni sui tipi di dati supportati in DQS, vedere Supported SQL Server and SSIS Data Types for DQS Domains.For information about supported data types in DQS, see Supported SQL Server and SSIS Data Types for DQS Domains.

  4. Fare clic sul controllo Più (+) per aggiungere una riga alla tabella Mapping o sul controllo Meno (-) per rimuovere una riga.Click the plus (+) control to add a row to the Mappings table or the minus (–) control to remove a row.

  5. Fare clic su Anteprima origine dati per visualizzare i dati nella tabella o vista di SQL Server selezionata o nel foglio di lavoro di Excel selezionato.Click Preview data source to see the data in the SQL Server table or view that you selected, or the Excel worksheet that you selected.

  6. Fare clic su Visualizza/Seleziona domini compositi per visualizzare un elenco dei domini compositi disponibili nella Knowledge Base e selezionarli in base alle esigenze per l'esecuzione del mapping.Click View/Select Composite Domains to view a list of the composite domains available in the knowledge base and select as appropriate for mapping.

  7. Fare clic su Avanti per passare alla fase di corrispondenza.Click Next to proceed to the matching stage.

    Nota

    Fare clic su Chiudi per salvare la fase del progetto di corrispondenza e tornare alla home page di DQS.Click Close to save the stage of the matching project, and return to the DQS home page. Alla successiva apertura, il progetto verrà avviato dalla stessa fase.The next time you open this project, it will start from the same stage. Fare clic su Annulla per terminare l'attività di corrispondenza e tornare alla home page di DQS.Click Cancel to end the matching activity, losing your work, and return to the DQS home page.

Fase di corrispondenza Matching Stage

In questa fase si esegue un processo di corrispondenza computerizzato che indica il numero di corrispondenze presenti nei dati di origine in base alle regole di corrispondenza.In this stage, you perform a computer-assisted matching process that shows you how many matches there are in the source data based upon the matching rules. Questo processo genererà una tabella dei risultati di corrispondenza in cui vengono mostrati i cluster identificati da DQS, ogni record presente nel cluster con il relativo ID e il punteggio corrispondente nonché il record iniziale per il cluster.This process will generate a matching results table that shows the clusters that DQS has identified, each record in the cluster with its record ID and its matching score, and the initial leading record for the cluster. Il record iniziale nel cluster viene selezionato casualmente.The leading record in the cluster is selected randomly. Il record superstite viene determinato selezionando la regola di sopravvivenza nella pagina Esporta quando si esegue il progetto corrispondente.You determine the surviving record by selecting the survivorship rule on the Export page when you run the matching project. Ogni riga aggiuntiva in un cluster viene considerata una corrispondenza; il punteggio corrispondente, rispetto al record iniziale, viene riportato nella tabella dei risultati.Each additional row in a cluster is considered a match; its matching score (compared to the leading record) is provided in the results table. Il numero del cluster corrisponde all'ID record relativo al record iniziale del cluster.The cluster number is that same as the record ID for the leading record in the cluster.

Nei risultati di corrispondenza è possibile applicare un filtro per i dati desiderati e rifiutare le corrispondenze non desiderate.In the matching results, you can filter on the data that you want, and reject matches that you do not want. È possibile visualizzare i dati di profiling per il processo di corrispondenza nel loro insieme, le specifiche sulle regole di corrispondenza applicate e le statistiche sui risultati di corrispondenza nel loro insieme.You can display profiling data for the matching process as a whole, specifics about the matching rules that are applied, and statistics about the matching results as a whole. Il processo di corrispondenza può identificare i cluster sovrapposti e quelli non sovrapposti e in caso di più esecuzioni può essere eseguito sui dati appena copiati dall'origine e reindicizzati o sui dati precedenti.The matching process can identify overlapping or non-overlapping clusters, and if being run multiple times, can be executed on data newly copied from the source and re-indexed, or on previous data.

  1. Nella pagina Corrispondenzaselezionare Cluster sovrapposti dall'elenco a discesa per visualizzare i record pivot e i record successivi per tutti i cluster quando viene eseguita la corrispondenza, anche qualora i gruppi di cluster presentino record in comune.On the Matching page, select Overlapping clusters from the drop-down list to display the pivot records and following records for all clusters when matching is executed, even if groups of clusters have records in common. Selezionare Cluster non sovrapposti per visualizzare i cluster che presentano record in comune come cluster singolo all'esecuzione della corrispondenza.Select Non overlapping clusters to display clusters that have records in common as a single cluster when matching is executed.

  2. Fare clic su Ricarica dati di origine (valore predefinito) per copiare i dati dall'origine dati nella tabella di gestione temporanea e reindicizzarli quando si esegue il progetto corrispondente.Click Reload data from source (the default) to copy data from the data source into the staging table and re-index it when you run the matching project. Fare clic su Esegui sui dati precedenti per eseguire il progetto corrispondente senza copiare i dati nella tabella di gestione temporanea e senza reindicizzare i dati.Click Execute on previous data to run a matching project without copying the data into the staging table and re-indexing the data. L'opzioneEsegui sui dati precedenti è disabilitata per la prima esecuzione del progetto corrispondente o quando si modifica il mapping nella pagina Mappa e si preme nella finestra popup successiva.Execute on previous data is disabled for the first run of the matching project, or if you change mapping in the Map page, and then press Yes in the following popup. In entrambi tali casi, è necessario effettuare la reindicizzazione.In both of those cases, you must re-index. Se il progetto corrispondente non viene modificato, non è necessaria alcuna reindicizzazione.It is not necessary to re-index if the matching project has not changed. L'esecuzione sui dati precedenti può migliorare le prestazioni.Executing on previous data can help performance.

  3. Fare clic su Avvia per avviare la corrispondenza sull'origine dati selezionata.Click Start to run matching on the selected data source.

  4. Fare clic su Arresta se si desidera arrestare il progetto corrispondente ed eliminare i risultati.Click Stop if you want to stop the matching project and discard the results.

  5. Al termine del processo di corrispondenza verificare che i cluster nella tabella Risultati corrispondenza siano appropriati e visualizzare le statistiche nelle schede Profiler e Risultati corrispondenza per assicurarsi di avere ottenuto i risultati desiderati.After the matching process has completed, verify that the clusters in the Matching Results table are appropriate, and view the statistics in the Profiler and Matching Results tabs to ensure that you are achieving the results that you need. Visualizzare i record corrispondenti selezionando Con corrispondenza per Filtro oppure visualizzare i record non corrispondenti selezionando Senza corrispondenza.View the matched records by selecting Matched for Filter or view unmatched records by selecting Unmatched.

  6. Se si dispone di più regole di corrispondenza nei criteri di corrispondenza, fare clic sulla scheda Regole di corrispondenza per identificare l'icona per ogni regola, quindi verificare quale regola ha identificato un record come corrispondenza identificando la regola nella colonna Regola della tabella Risultati corrispondenza .If you have multiple matching rules in the matching policy, click the Matching Rules tab to identify the icon for each rule, and then verify which rule identified a record as a match by identifying the rule in the Rule column of the Matching Results table.

  7. Se si seleziona un record non pivot nella tabella e si fa clic sull'icona Visualizza dettagli , o si fa doppio clic sul record, in DQS viene visualizzata la finestra popup Dettagli punteggio corrispondente in cui sono visibili il record su cui si è fatto doppio clic e il relativo record pivot, nonché i valori in tutti i relativi campi, il punteggio tra tali record e un drill-down dei contributi del punteggio corrispondente di ciascun campo.If you select a non-pivot record in the table and click the View Details icon (or double-click the record), DQS will display a Matching Score Details popup that displays the record double-clicked and its pivot record (and the values in all their fields), the score between them, and a drill-down of the matching score contributions of each field. Se si fa doppio clic su un record pivot, non verrà visualizzata alcuna finestra popup.Double-clicking a pivot record will not display the popup.

  8. Fare clic sull'icona Comprimi tutto per comprimere i record visualizzati nella tabella Risultati corrispondenza per includere solo i record pivot e non i record duplicati.Click the Collapse All icon to collapse the records displayed in the Matching Results table to include only pivot record, not the duplicate records. Fare clic sull'icona Espandi tutto per espandere i record visualizzati nella tabella Risultati corrispondenza per includere tutti i record duplicati.Click Expand All to expand the records displayed in the Matching Results table to include all duplicate records.

  9. Per rifiutare un record dai risultati corrispondenti, fare clic sulla casella di controllo Rifiutato del record.To reject a record from the matching results, click the Rejected checkbox for the record.

  10. Per modificare il punteggio corrispondente minimo che determina il livello di corrispondenza da applicare a un record perché questo venga visualizzato, selezionare l'icona Punteggio corrispondente minimo sul lato destro della tabella e immettere un numero maggiore.To change the minimum matching score that determines the level of matching that a record must have to be displayed, select the Min. Matching Score icon above the right-hand side of the table, and enter a higher number. Il punteggio corrispondente minimo è impostato su 80% per impostazione predefinita.The minimum matching score is set to 80% by default. Fare clic su Aggiorna per modificare il contenuto della tabella.Click Refresh to change the contents of the table.

  11. Una volta completata l'analisi, il pulsante Avvia viene sostituito dal pulsante Riavvia .After the analysis has completed, the Start button turns into a Restart button. Fare clic su Riavvia per eseguire di nuovo il progetto di analisi.Click Restart to run the analysis project again. Se i risultati dall'analisi precedente non sono stati ancora salvati, facendo clic su Riavvia si causerà la perdita di tali dati non salvati.However, the results from the previous analysis have not been saved as yet, so clicking Restart will cause that previous data to be lost. Per continuare, fare clic su nella finestra popup.To continue, click Yes in the popup. Durante l'esecuzione dell'analisi, non lasciare la pagina o il processo di analisi verrà interrotto.As the analysis is running, do not leave the page or the analysis process will be terminated.

  12. Fare clic su Avanti per passare alla fase di sopravvivenza e di esportazione.Click Next to proceed to the survivorship and export stage.

Fase di sopravvivenza e di esportazione Survivorship and Exporting Stage

Nel processo di sopravvivenza Data Quality Services consente di determinare un record superstite per ogni cluster, che sostituirà gli altri record corrispondenti nel cluster.In the survivorship process Data Quality Services determines a survivor record for each cluster, which will replace the other records that match it in the cluster. I risultati di sopravvivenza e/o di corrispondenza vengono quindi esportati in una tabella del database di SQL Server, in un file CSV o in un file di Excel.It then exports the matching and/or survivorship results to a table in the SQL Server database, a .csv file, or an Excel file.

La sopravvivenza è facoltativa.Survivorship is optional. È possibile esportare i risultati senza eseguire la sopravvivenza. In tal caso viene utilizzato il record pivot definito nell'analisi di corrispondenza.You can export the results without running survivorship, in which case DQS would use the pivot record that was designated in the matching analysis. Se due o più record in un cluster soddisfano la regola di sopravvivenza, il processo di sopravvivenza selezionerà l'ID record minore tra i record in conflitto come superstite.If two or more records in a cluster comply with the survivorship rule, the survivorship process will select the lowest record ID among the conflicting records to be the survivor. È possibile esportare i superstiti in diversi file o tabelle utilizzando regole di sopravvivenza diverse.You can export survivors to different files or tables using different survivorship rules.

  1. Nella pagina Esporta selezionare la destinazione in cui si desidera esportare i dati corrispondenti in Tipo destinazione, scegliendo tra SQL Server, File CSVo File di Excel.On the Export page, select the destination where you want to export the matching data to in Destination Type: SQL Server, CSV File, or Excel File.

    Importante

    Se si utilizza la versione a 64 bit di Excel, non è possibile esportare i dati corrispondenti in un file di Excel. È possibile eseguire l'esportazione solo in un database di SQL Server o in un file con estensione csv.If you are using 64-bit version of Excel, you cannot export the matching data to an Excel file; you can export only to a SQL Server database or to a .csv file.

  2. Se è stato selezionato SQL Server per Tipo destinazione, selezionare il database in cui esportare i risultati in Nome database.If you selected SQL Server for Destination Type, select the database to export the results to in Database Name.

    Importante

    Il database di destinazione deve trovarsi nella stessa istanza di SQL Server del server DQS.The destination database must be present in the same SQL Server instance as the DQS server. in caso contrario, non verrà visualizzato nell'elenco a discesa.Otherwise, it will not appear in the drop-down list.

  3. Selezionare la casella di controllo per Risultati corrispondenza per esportare i risultati corrispondenti (vedere la descrizione riportata in precedenza) nella tabella definita in un database di SQL Server o nel file CSV o di Excel specificato.Select the check box for Matching Results to export matching results (see above for an explanation) to the designated table in a SQL Server database or to the designated .csv or Excel file. Selezionare la casella di controllo per Risultati sopravvivenza per esportare i risultati di sopravvivenza (vedere la descrizione riportata in precedenza) nella tabella definita in un database di SQL Server o nel file CSV o di Excel specificato.Select the check box for Survivorship Results to export survivorship results (see above for an explanation) to the designated table in a SQL Server database or to the designated .csv or Excel file.

    Per i risultati corrispondenti verranno esportati gli elementi seguenti:The following will be exported for matching results:

    • Un elenco di cluster con i record corrispondenti in ogni cluster, inclusi il nome della regola e il punteggio.A list of clusters and the matched records in each cluster, including the rule name and the score. Il record pivot sarà contrassegnato come "Pivot".The pivot record will be marked as “Pivot”. I cluster verranno visualizzati per primi nell'elenco di esportazione.The clusters will appear first in the export list.

    • Un elenco di record non corrispondenti con "NULL" nelle colonne Punteggio e Nome regola.A list of the unmatched records, with “NULL” in the Score and Rule Name columns. Questi record verranno aggiunti nell'elenco di esportazione dopo i cluster.These records will be appended to the export list after the clusters.

      Per i risultati di sopravvivenza verranno esportati gli elementi seguenti:The following will be exported for survivorship results:

    • Un elenco di record superstiti come stabilito dal processo di sopravvivenza in base alla regola di sopravvivenza.A list of the survivor records as determined by the survivorship process according to the survivorship rule. Questi record verranno visualizzati per primi nell'elenco di esportazione.These records appear first in the export list.

    • Un elenco di record non corrispondenti non inclusi nei cluster di record corrispondenti.A list of the unmatched records that are not included in the clusters of matched records. Questi record vengono aggiunti dopo i risultati dei record superstiti.These records are appended after the survivor results.

  4. Se è stato selezionato SQL Server per Tipo destinazione, immettere il nome delle tabelle in cui si desidera esportare i risultati in Nome tabella.If you selected SQL Server for Destination Type, enter the name of the tables that you want to export the results to in Table Name. Se si esportano sia i risultati corrispondenti che quelli di sopravvivenza, le tabelle di destinazione devono avere nomi diversi essendo univoche nel database.If you export both matching results and survivorship results, the destination tables must have different names that are unique to the database.

  5. Se è stato selezionato File CSV per Tipo destinazione, immettere il nome e il percorso del file CSV in cui si desidera esportare i risultati in Nome file CSV.If you selected CSV File for Destination Type, enter the file and path for the CSV file that you want to export to in CSV File Name.

  6. Se è stato selezionato File di Excel per Tipo destinazione, immettere il nome e il percorso del file di Excel in cui si desidera esportare i risultati in Nome del file di Excel.If you selected Excel File for Destination Type, enter the file and path for the Excel file that you want to export to in Excel File Name. Non è possibile esportare in un file di Excel se si utilizza la versione a 64 bit di Excel.You cannot export to an Excel file if you are using 64-bit version of Excel.

  7. Selezionare la regola di sopravvivenza come segue:Select the survivorship rule as follows:

    • Selezionare Record pivot (valore predefinito) per identificare il record superstite come record pivot iniziale scelto arbitrariamente da DQS.Select Pivot record (the default) to identify the surviving record as the initial pivot record chosen arbitrarily by DQS.

    • Selezionare Il record più completo e più lungo per identificare il record superstite come il record con il maggior numero di campi popolati e con il maggior numero di termini in ogni campo.Select Most complete and longest record to identify the surviving record as the one with the largest number of populated fields, and has the largest number of terms in each field. Vengono controllati tutti i campi di origine, anche quelli di cui non è stato eseguito il mapping a un dominio nella pagina Mappa .All source fields are checked, even those fields that were not mapped to a domain on the Map page.

    • Selezionare Record più completo per identificare il record superstite come il record con il maggior numero di campi popolati.Select Most complete record to identify the surviving record as the one with the largest number of populated fields. Un campo popolato contiene almeno un valore (valori stringa o numerici oppure entrambi).A populated field contains at least one value (string, numeric, or both). Vengono controllati tutti i campi di origine, anche quelli di cui non è stato eseguito il mapping a un dominio nella pagina Mappa.All source fields are checked, even those fields that were not mapped to a domain on the Map page. Un campo popolato contiene almeno un valore (valori stringa o numerici oppure entrambi).A populated field contains at least one value (string, numeric, or both).

    • Selezionare Record più lungo per identificare il record superstite come il record con il maggior numero di termini nei relativi campi di origine.Select Longest record to identify the surviving record as the one with the largest number of terms in its source fields. Per determinare la lunghezza di ogni record, in DQS viene verificata la lunghezza dei termini in tutti i campi di origine, anche in quelli di cui non è stato eseguito il mapping a un dominio nella pagina Mappa .To determine the length of each record, DQS verifies the length of the terms in all source fields, even those fields that were not mapped to a domain on the Map page.

  8. Visualizzare le statistiche nella scheda Profiler per assicurarsi di avere ottenuto i risultati desiderati.View the statistics in the Profiler tab to ensure that you are achieving the results that you need.

  9. Fare clic su Esporta per esportare i risultati.Click Export to export the results. Verrà visualizzata la finestra di dialogo Esportazione corrispondenze in cui viene indicato lo stato di avanzamento e quindi i risultati dell'esportazione.This displays a Matching Export dialog box that shows the progress and then the results of the export.

    • Se è stato selezionato SQL Server come destinazione dei dati, nel database selezionato verrà creata una nuova tabella con il nome specificato.If you selected SQL Server as the data destination, a new table with the specified name will be created in the selected database.

    • Se è stato selezionato File CSV come destinazione dei dati, verrà creato un file CSV nel percorso del computer del Data Quality ServerData Quality Server con il nome file specificato in precedenza nella casella Nome file CSV .If you selected CSV File as the data destination, a .csv file will be created at the location on the Data Quality ServerData Quality Server computer with the file name that you specified earlier in the Csv file name box.

    • Se è stato selezionato File di Excel come destinazione dei dati, verrà creato un file XLSX nel percorso del computer del Data Quality ServerData Quality Server con il nome file specificato in precedenza nella casella Nome file di Excel .If you selected Excel File as the data destination, an .xlsx file will be created at the location on the Data Quality ServerData Quality Server computer with the file name that you specified earlier in the Excel file name box.

  10. Verificare che l'esportazione venga completata correttamente, quindi fare clic su Chiudi.Verify that the export completed successfully, and then click Close.

  11. Fare clic su Fine per completare il progetto corrispondente.Click Finish to complete the matching project.

    Nota

    Se un progetto corrispondente viene completato e quindi riutilizzato, verrà utilizzata la stessa Knowledge Base di quando il progetto è stato pubblicato.If you have finished a matching project and then use it again, it will use the knowledge base in place when it was published. Non verrà utilizzata alcuna modifica apportata alla Knowledge Base dopo il completamento del progetto.It will not use any changes that you have made to the knowledge base since you finished the project. Per utilizzare tali modifiche o una nuova Knowledge Base, sarà necessario creare un nuovo progetto corrispondente.To use those changes, or to use a new knowledge base, you will have to create a new matching project. Se invece il progetto corrispondente è stato creato ma non completato, verranno utilizzate tutte le modifiche pubblicate nei criteri di corrispondenza quando si esegue la corrispondenza nel progetto.On the other hand, if you have created, but not finished, a matching project, any changes that you have published to the matching policy will be used if you run matching in the project.

Completamento: fasi successive all'esecuzione di un progetto corrispondente Follow Up: After Running a Matching Project

Dopo avere eseguito un progetto corrispondente, è possibile modificare i criteri di corrispondenza nella Knowledge Base e creare ed eseguire un altro progetto corrispondente in base ai criteri di corrispondenza aggiornati.After you run a matching project, you can change the matching policy in the knowledge base, and create and run another matching project based upon the updated matching policy. Per altre informazioni, vedere Create a Matching Policy.For more information, see Create a Matching Policy.

Schede Profiler e Risultati Profiler and Results Tabs

Le schede Profiler e Risultati contengono le statistiche del processo di corrispondenza.The Profiler and Results tabs contain statistics for the matching process.

Scheda ProfilerProfiler Tab

Fare clic sulla scheda Profiler per visualizzare statistiche per il database di origine e per ogni campo incluso nella regola dei criteri.Click the Profiler tab to display statistics for the source database and for each field included in the policy rule. Le statistiche verranno aggiornate all'esecuzione della regola dei criteri.The statistics will be updated as the policy rule is run. Il profiling consente di valutare il livello di efficacia del processo di deduplicazione, determinando in che misura tale processo è in grado di migliorare la qualità dei dati.Profiling will help you assess the effectiveness of the de-duplication process, helping determine the extent to which the process is able to improve the quality of the data. L'accuratezza nel profiling non è importante per un progetto corrispondente.Accuracy in profiling is not important for a matching project.

Le statistiche relative al database di origine includono:The source database statistics include the following:

  • Record: numero complessivo di record nel databaseRecords: The total number of records in the database

  • Valori totali: numero totale di valori nei campiTotal Values: The total number of values in the fields

  • Nuovi valori: numero totale di valori nuovi dall'esecuzione precedente e la loro percentuale rispetto al totaleNew Values: The total number of values that are new since the previous run, and their percentage of the whole

  • Valori univoci: numero totale di valori univoci nei campi e la loro percentuale rispetto al totaleUnique Values: The total number of unique values in the fields, and their percentage of the whole

  • Nuovi valori univoci: numero totale di valori univoci nuovi nei campi e la loro percentuale rispetto al totaleNew Unique Values: The total number of unique values that are new in the fields, and their percentage of the whole

    Le statistiche relative ai campi includono:The field statistics include the following:

  • Campo: nome del campo incluso nei mappingField: Name of the field that was included in the mappings.

  • Dominio: nome del dominio di cui è stato eseguito il mapping al campoDomain: Name of the domain that was mapped to the field.

  • Nuovo: numero di nuove corrispondenze trovate e relativa percentuale del totaleNew: The number of new matches found and their percentage of the total

  • Univoco: numero di record univoci nel campo e relativa percentuale del totaleUnique: The number of unique records in the field and their percentaqe of the total

  • Completezza: percentuale di completamento dell'esecuzione della regolaCompleteness: The percentage that the rule run is complete.

Notifiche relative ai criteri di corrispondenzaMatching Policy Notifications

Per l'attività relativa ai criteri di corrispondenza, le condizioni seguenti generano notifiche:For the matching policy activity, the following conditions result in notifications:

  • Il campo è vuoto in tutti i record; è consigliabile eliminarlo dal mapping.The field is empty in all records; it is recommended that you eliminate it from mapping.

  • Il punteggio di completezza del campo è molto basso; è consigliabile eliminarlo dal mapping.The field completeness score is very low; you may want to eliminate it from mapping.

  • Un campo contiene solo valori non validi; è necessario verificare il mapping e la rilevanza delle regole di dominio sul contenuto del campo.All values in a field are invalid; you should verify the mapping and the relevancy of domain rules to the field contents.

  • Un campo contiene un basso livello di valori validi; è necessario verificare il mapping e la rilevanza delle regole di dominio sul contenuto del campo.There is a low level of valid values in the field; you should verify the mapping and the relevancy of domain rules to the field contents.

  • Vi è un livello elevato di unicità nel campo.There is a high level of uniqueness in this field. L'utilizzo del campo nei criteri di corrispondenza può diminuire i risultati di corrispondenza.Using this field in matching policy can decrease the matching results.

Scheda Regole di corrispondenzaMatching Rules Tab

Fare clic su questa scheda per visualizzare un elenco di regole nei criteri di corrispondenza e le condizioni in una regola.Click this tab to display a list of the rules in the matching policy and the conditions in a rule.

Elenco di regoleRules List
Visualizza un elenco di tutte le regole di corrispondenza nei criteri di corrispondenza.Displays a list of all matching rules in the matching policy. Selezionare una delle regole per visualizzare le condizioni nella regola nella tabella delle regole di corrispondenza.Select one of the rules to display the conditions in the rule in the Matching Rule table.

Tabella delle regole di corrispondenzaMatching Rule Table
Visualizza ogni condizione nella regola selezionata, inclusi dominio, valore di somiglianza, peso e prerequisito.Displays each condition in the selected rule, including domain, similarity value, weight, and prerequisite selection.

Scheda Risultati corrispondenzaMatching Results Tab

Fare clic sulla scheda Risultati corrispondenza per visualizzare le statistiche dell'analisi dell'origine dati utilizzando la Knowledge Base selezionata per il progetto e la regola o le regole di corrispondenza presenti nella Knowledge Base.Click the Matching Results tab to display statistics for the analysis of the data source using the knowledge selected for the project and the matching rule or rules in that knowledge base. Le statistiche includono gli elementi seguenti:The statistics include the following:

  • Numero complessivo di record nel databaseThe total number of records in the database

  • Numero complessivo di record corrispondenti nel databaseThe total number of matching records in the database

  • Numero di record nel database che non si considerano duplicatiThe number of records in the database that are not considered to be duplicates

  • Numero di cluster individuatiThe number of clusters discovered

  • Dimensione media di un cluster (numero di record duplicati diviso numero di cluster)The average cluster size (number of duplicate records divided by number of clusters)

  • Il minor numero di duplicati in un clusterThe fewest number of duplicates in a cluster

  • Il maggior numero di duplicati in un clusterThe greatest number of duplicates in a cluster