Ejecutar un proyecto de coincidenciaRun a Matching Project

En este tema se describe cómo realizar la búsqueda de coincidencias de datos en Data Quality ServicesData Quality Services (DQS).This topic describes how to perform data matching in Data Quality ServicesData Quality Services (DQS). El proceso de búsqueda de coincidencias identifica los clústeres de registros coincidentes en función de las reglas de coincidencia existentes en la directiva de coincidencia, designa un registro de cada clúster como el registro que permanece basándose en una regla de permanencia, y exporta los resultados.The matching process identifies clusters of matching records based upon matching rules in the matching policy, designates one record from each cluster as the survivor based upon a survivorship rule, and exports the results. DQS realiza el proceso de búsqueda de coincidencias, también denominado eliminación de datos duplicados, en un proceso asistido por PC, pero es usted quien crea las reglas de coincidencia de forma interactiva y quien selecciona la regla de permanencia entre varias opciones, por lo que también es quien controla el proceso de búsqueda de coincidencias.DQS performs the matching process, also called de-duplication, in a computer-assisted process, but you create matching rules interactively, and you select the survivorship rule from several choices, so you control the matching process.

La búsqueda de coincidencias se realiza en tres fases: un proceso de asignación en el que se identifica el origen de datos y se asignan los dominios a dicho origen de datos, un proceso de búsqueda de coincidencias en el que se ejecuta el análisis de coincidencia, y un proceso de permanencia y exportación en el que se designa la regla de permanencia y se exportan los resultados de la búsqueda de coincidencias.Matching is performed in three stages: a mapping process in which you identify the data source and map domains to the data source, a matching process in which you run the matching analysis, and a survivorship and export process in which you designate the survivorship rule and export the matching results. Cada uno de estos procesos se realiza en una página distinta del asistente para la actividad de coincidencia, lo que le permite desplazarse de una página a otra, volver a ejecutar el proceso, y cerrar un proceso de búsqueda de coincidencias específico y volver a la misma fase del proceso.Each of these processes is performed on a separate page of the Matching activity wizard, enabling you to move back and forth to different pages, to re-run the process, and to close out of a specific matching process and then return to the same stage of the process. DQS proporciona estadísticas sobre los datos de origen, las reglas de coincidencia y los resultados de búsqueda de coincidencias que permiten tomar decisiones fundadas sobre la búsqueda de coincidencias y sobre cómo refinar este proceso.DQS provides you with statistics about the source data, the matching rules, and the matching results that enable you to make informed decisions about matching, and refine the matching process.

Para preparar la búsqueda de coincidencias, debe crear una directiva de coincidencia con una o varias reglas de coincidencia y ejecutar dicha directiva con los datos de ejemplo.You must prepare for matching by creating a matching policy with one or more matching rules, and running the policy on sample data. El proceso del proyecto de búsqueda de coincidencias es independiente del proceso de la directiva de coincidencia, lo que significa que una base de conocimiento no se rellena con el conocimiento de coincidencia obtenido del proyecto de búsqueda de coincidencias.The matching project process is separate from the matching policy process, and a knowledge base is not populated with matching knowledge gained from the matching project. Para obtener más información acerca de cómo crear una directiva de coincidencia, vea Create a Matching Policy.For more information about creating a matching policy, see Create a Matching Policy.

Antes de empezarBefore You Begin

Requisitos previosPrerequisites

  • Debe haber creado una base de conocimiento con una directiva de coincidencia que conste de una o varias reglas de coincidencia.You must have created a knowledge base with a matching policy consisting of one or more matching rules.

  • Si los datos de origen implicados en el proceso de búsqueda de coincidencias están en un archivo de Excel, es necesario tener instalado Microsoft Excel en el equipo de Cliente de calidad de datosData Quality Client .Microsoft Excel must be installed on the Cliente de calidad de datosData Quality Client computer if the source data to be matched is in an Excel file. De lo contrario, no podrá seleccionar dicho archivo en la fase de asignación.Otherwise, you will not be able to select the Excel file in the mapping stage. Los archivos creados por Microsoft Excel pueden tener la extensión .xlsx, .xls o .csv.The files created by Microsoft Excel can have an extension of .xlsx, .xls, or .csv. Si se utiliza la versión de 64 bits de Excel, solo se admitirán los archivos de Excel 2003 (.xls); los archivos de Excel 2007 o 2010 (.xlsx) no son compatibles.If the 64-bit version of Excel is used, only Excel 2003 files (.xls) are supported; Excel 2007 or 2010 files (.xlsx) are not supported. Si utiliza la versión de 64 bits de Excel 2007 o 2010, guarde el archivo como un archivo .xls o .csv, o instale una versión de 32 bits de Excel en su lugar.If you are using 64-bit version of Excel 2007 or 2010, save the file as an .xls file or a .csv file, or install a 32-bit version of Excel instead.

SeguridadSecurity

PermissionsPermissions

Debe disponer del rol dqs_kb_editor o dqs_administrator en la base de datos DQS_MAIN para ejecutar un proyecto de búsqueda de coincidencias.You must have the dqs_kb_editor or the dqs_administrator role on the DQS_MAIN database to run a matching project.

Primer paso: iniciar un proyecto de búsqueda de coincidenciasFirst Step: Starting a Matching Project

Realizará la actividad de búsqueda de coincidencias en un proyecto de calidad de datos que creará en la aplicación cliente DQS.You perform the matching activity in a data quality project that you create in the DQS client application.

  1. Inicie el cliente de calidad de datos.Start Data Quality Client. Para obtener más información acerca de cómo hacerlo, veaFor information about doing so, see Ejecute la aplicación Data Quality Client. Run the Data Quality Client Application.

  2. En la página de inicio de Cliente de calidad de datosData Quality Client , haga clic en Nuevo proyecto de calidad de datos para realizar la búsqueda de coincidencias en un proyecto de calidad de datos nuevo.In the Cliente de calidad de datosData Quality Client home screen, click New Data Quality Project to perform matching in a new data quality project. Escriba un nombre y una descripción para el proyecto de calidad de datos y seleccione la base de conocimiento que desea utilizar para la búsqueda de coincidencias en Usar base de conocimiento.Enter a name for the data quality project, enter a description, and select the knowledge base that you want to use for matching in Use knowledge base. Haga clic en Coincidencia para la actividad.Click Matching for the activity. Haga clic en Siguiente para pasar a la fase de asignación.Click Next to proceed to the mapping stage.

  3. Haga clic en Abrir proyecto de calidad de datos para realizar la búsqueda de coincidencias en un proyecto de calidad de datos existente.Click Open data quality project to perform matching in an existing data quality project. Seleccione el proyecto y haga clic en Siguiente.Select the project and then click Next. (También puede hacer clic en un proyecto en Proyecto de calidad de datos reciente). Si abre un proyecto de búsqueda de coincidencias que está cerrado, continuará en la fase en la que se hallaba la actividad de proyecto de búsqueda de coincidencias en el momento en que se cerró; esta fase aparece indicada en la columna Estado de la tabla del proyecto o en el nombre del proyecto, debajo de Proyecto de calidad de datos reciente.(Or you can click a project under Recent Data Quality Project.) If you open a matching project that was closed, you will proceed to the stage that the matching project activity was closed in (as indicated by the State column in the project table or in the project name under Recent Data Quality Project). Si abre un proyecto de búsqueda de coincidencias finalizado, irá a la página Exportar (no podrá modificar las pantallas anteriores).If you open a matching project that was finished, you will go to the Export page (and you cannot go back to previous screens).

Fase de asignaciónMapping Stage

En la fase de asignación, deberá identificar el origen de los datos en el que ejecutará el análisis de coincidencia y asignará columnas de origen a los dominios para ponerlos a disposición de la actividad de coincidencia.In the mapping stage you identify the source of the data that you will run the matching analysis on, and you map source columns to domains to make the domains available for the matching activity.

  1. Para ejecutar la búsqueda de coincidencias en una base de datos, en la página Asignación , deje Origen de datos como SQL Server, seleccione la base de datos en la que desea ejecutar la búsqueda de coincidencias y, a continuación, seleccione la tabla.On the Map page, to run matching on a database, leave Data Source as SQL Server, select the database that you want to run matching on, and then select the table. La base de datos de origen debe encontrarse en la misma instancia de SQL Server que el servidor DQS.The source database must be present in the same SQL Server instance as the DQS server. En caso contrario, no aparecerá en la lista desplegable.Otherwise, it will not appear in the drop-down list.

  2. Para ejecutar la búsqueda de coincidencias en los datos de una hoja de cálculo de Excel, seleccione Archivo de Excel en Origen de datos, haga clic en Examinar , seleccione el archivo Excel y deje seleccionado Usar la primera fila como encabezado , si procede.To run matching on the data in an Excel spreadsheet, select Excel File for Data Source, click Browse and select the Excel file, and leave Use first row as header selected if appropriate. En Hoja de cálculo, seleccione la hoja de cálculo del archivo de Excel que será el origen de los datos.In Worksheet, select the worksheet in the Excel file that will be the source of the data. Es necesario tener instalado Excel en el equipo de Cliente de calidad de datosData Quality Client para seleccionar un archivo de Excel.Excel must be installed on the Cliente de calidad de datosData Quality Client computer to select an Excel file. Si Excel no está instalado en el equipo de Cliente de calidad de datosData Quality Client , el botón Examinar no estará disponible, y aparecerá una notificación debajo de este cuadro de texto indicándole que Excel no está instalado.If Excel is not installed on the Cliente de calidad de datosData Quality Client computer, the Browse button will not be available, and you will be notified beneath this text box that Excel is not installed.

  3. En Asignaciones, seleccione un campo del origen de datos para Columna de origeny, continuación, seleccione el dominio correspondiente.Under Mappings, select a field in the data source for Source Column, and then select the corresponding domain. Repita este procedimiento con todos los dominios que utilice en el proceso de búsqueda de coincidencias.Repeat for all domains that you use in the matching process. Cada dominio definido en la directiva de coincidencia debe asignarse a la columna de origen correspondiente.Each domain that is defined in the matching policy must be mapped to the appropriate source column. En el panel derecho de la página Asignación aparecen los dominios que se han definido en la directiva de coincidencia y las reglas existentes en dicha directiva.The Map page displays the domains that have been defined in the matching policy and the rules in the matching policy in the right-hand pane.

    Nota

    Solo puede asignar los datos de origen para un dominio DQS si el tipo de datos de origen se admiten en DQS y coincide con el tipo de datos de dominio DQS.You can map your source data to a DQS domain only if the source data type is supported in DQS, and matches with the DQS domain data type. Para obtener información acerca de los tipos de datos admitidos en DQS, vea Compatibilidad con los tipos de datos en SQL Server y SSIS para dominios DQS.For information about supported data types in DQS, see Supported SQL Server and SSIS Data Types for DQS Domains.

  4. Haga clic en el control más (+) para agregar una fila a la tabla Asignaciones o en el control menos (–) para eliminarla.Click the plus (+) control to add a row to the Mappings table or the minus (–) control to remove a row.

  5. Haga clic en Vista previa del origen de datos para ver los datos de la tabla o vista de SQL Server que ha seleccionado, o para ver la hoja de cálculo de Excel que ha seleccionado.Click Preview data source to see the data in the SQL Server table or view that you selected, or the Excel worksheet that you selected.

  6. Haga clic en Ver o seleccionar dominios compuestos para ver una lista de los dominios compuestos disponibles en la base de conocimiento y seleccionar el que corresponda para la asignación.Click View/Select Composite Domains to view a list of the composite domains available in the knowledge base and select as appropriate for mapping.

  7. Haga clic en Siguiente para pasar a la fase de coincidencia.Click Next to proceed to the matching stage.

    Nota

    Haga clic en Cerrar para guardar la fase del proyecto de búsqueda de coincidencias y volver a la página de inicio de DQS.Click Close to save the stage of the matching project, and return to the DQS home page. La próxima vez que abra este proyecto, se iniciará en la misma fase.The next time you open this project, it will start from the same stage. Haga clic en Cancelar para finalizar la actividad de búsqueda de coincidencias, perder los cambios realizados y volver a la página de inicio de DQS.Click Cancel to end the matching activity, losing your work, and return to the DQS home page.

Fase de coincidenciaMatching Stage

En esta fase, realizará un proceso de búsqueda de coincidencias asistido por PC que mostrará el número de coincidencias existentes en los datos de origen basándose en las reglas de coincidencia.In this stage, you perform a computer-assisted matching process that shows you how many matches there are in the source data based upon the matching rules. Este proceso generará una tabla con los resultados de búsqueda de coincidencias que mostrará los clústeres que DQS ha identificado, cada uno de los registros del clúster con su identificador de registro y su puntuación de coincidencia, y el registro inicial del clúster.This process will generate a matching results table that shows the clusters that DQS has identified, each record in the cluster with its record ID and its matching score, and the initial leading record for the cluster. El registro inicial del clúster se selecciona aleatoriamente.The leading record in the cluster is selected randomly. Para determinar el registro que permanece, seleccione la regla de permanencia en la página Exportar cuando ejecute el proyecto de búsqueda de coincidencias.You determine the surviving record by selecting the survivorship rule on the Export page when you run the matching project. Cada fila adicional de un clúster se considera una coincidencia; su puntuación de coincidencia (comparada con la del registro inicial) se muestra en la tabla de resultados.Each additional row in a cluster is considered a match; its matching score (compared to the leading record) is provided in the results table. El número de clúster es el mismo que el identificador de registro del registro inicial del clúster.The cluster number is that same as the record ID for the leading record in the cluster.

En los resultados de búsqueda de coincidencias, podrá filtrar los datos que desee y rechazar las coincidencias que estime oportuno.In the matching results, you can filter on the data that you want, and reject matches that you do not want. Podrá mostrar datos de generación de perfiles para el proceso de búsqueda de coincidencias en su conjunto, detalles sobre las reglas de coincidencia aplicadas, y estadísticas globales de los resultados de búsqueda de coincidencias.You can display profiling data for the matching process as a whole, specifics about the matching rules that are applied, and statistics about the matching results as a whole. El proceso de búsqueda de coincidencias puede identificar clústeres superpuestos y no superpuestos y, si se ejecuta varias veces, se puede ejecutar con los datos copiados del origen y reindizados, o con los datos anteriores.The matching process can identify overlapping or non-overlapping clusters, and if being run multiple times, can be executed on data newly copied from the source and re-indexed, or on previous data.

  1. En la página Coincidencia, seleccione Clústeres superpuestos en la lista desplegable para mostrar los registros dinámicos y los registros siguientes de todos los clústeres cuando se ejecute la búsqueda de coincidencias, incluso si los grupos de clústeres tienen registros en común.On the Matching page, select Overlapping clusters from the drop-down list to display the pivot records and following records for all clusters when matching is executed, even if groups of clusters have records in common. Seleccione Clústeres no superpuestos para mostrar, como un solo clúster, los clústeres que tienen registros en común cuando se ejecute la búsqueda de coincidencias.Select Non overlapping clusters to display clusters that have records in common as a single cluster when matching is executed.

  2. Haga clic en Volver a cargar los datos del origen (valor predeterminado) para copiar los datos del origen de datos en la tabla de ensayo y volverlos a indizar cuando se ejecute el proyecto de búsqueda de coincidencias.Click Reload data from source (the default) to copy data from the data source into the staging table and re-index it when you run the matching project. Haga clic en Ejecutar con los datos anteriores para ejecutar un proyecto de búsqueda de coincidencias sin copiar los datos en la tabla de ensayo ni volver a indizarlos.Click Execute on previous data to run a matching project without copying the data into the staging table and re-indexing the data. Ejecutar con los datos anteriores aparece deshabilitado la primera vez que se ejecuta el proyecto de búsqueda de coincidencias, o si cambia la asignación en la página Asignación y, a continuación, presiona en el cuadro emergente.Execute on previous data is disabled for the first run of the matching project, or if you change mapping in the Map page, and then press Yes in the following popup. En ambos casos, es necesario volver a indizar.In both of those cases, you must re-index. No será necesario volver a indizar si el proyecto de búsqueda de coincidencias no ha sufrido cambios.It is not necessary to re-index if the matching project has not changed. La ejecución con los datos anteriores puede mejorar el rendimiento.Executing on previous data can help performance.

  3. Haga clic en Iniciar para ejecutar la búsqueda de coincidencias en el origen de datos seleccionado.Click Start to run matching on the selected data source.

  4. Haga clic en Detener si desea detener el proyecto de búsqueda de coincidencias y descartar los resultados.Click Stop if you want to stop the matching project and discard the results.

  5. Cuando el proceso de búsqueda de coincidencias haya finalizado, compruebe que los clústeres de la tabla Resultados de búsqueda de coincidencias son los adecuados y vea las estadísticas de las pestañas Generador de perfiles y Resultados de búsqueda de coincidencias para asegurarse de que ha obtenido los resultados esperados.After the matching process has completed, verify that the clusters in the Matching Results table are appropriate, and view the statistics in the Profiler and Matching Results tabs to ensure that you are achieving the results that you need. Para ver los registros coincidentes, seleccione Coincidente en Filtro ; para ver los registros no coincidentes, seleccione Sin coincidencia.View the matched records by selecting Matched for Filter or view unmatched records by selecting Unmatched.

  6. Si la directiva de coincidencia tiene varias reglas de coincidencia, haga clic en la pestaña Reglas de coincidencia para identificar el icono de cada regla y, a continuación, compruebe qué regla ha identificado un registro como coincidente; para ello, busque la regla en la columna Regla de la tabla Resultados de búsqueda de coincidencias .If you have multiple matching rules in the matching policy, click the Matching Rules tab to identify the icon for each rule, and then verify which rule identified a record as a match by identifying the rule in the Rule column of the Matching Results table.

  7. Si selecciona un registro no dinámico en la tabla y hace clic en el icono Ver detalles (o hace doble clic en el registro), DQS mostrará el cuadro emergente Detalles de puntuación de coincidencia , en el que aparecen el registro en el que ha hecho doble clic y su registro dinámico (y los valores de todos los campos), la puntuación existente entre ellos y detalles acerca de la contribución de cada campo a la puntuación de coincidencia.If you select a non-pivot record in the table and click the View Details icon (or double-click the record), DQS will display a Matching Score Details popup that displays the record double-clicked and its pivot record (and the values in all their fields), the score between them, and a drill-down of the matching score contributions of each field. Cuando se hace doble clic en un registro dinámico, no aparece el cuadro emergente.Double-clicking a pivot record will not display the popup.

  8. Haga clic en el icono Contraer todo para contraer los registros de la tabla Resultados de búsqueda de coincidencias y mostrar solo el registro dinámico, no los registros duplicados.Click the Collapse All icon to collapse the records displayed in the Matching Results table to include only pivot record, not the duplicate records. Haga clic en Expandir todo para expandir los registros de la tabla Resultados de búsqueda de coincidencias y mostrar todos los registros duplicados.Click Expand All to expand the records displayed in the Matching Results table to include all duplicate records.

  9. Para rechazar un registro de los resultados de búsqueda de coincidencias, haga clic en la casilla Rechazado del registro.To reject a record from the matching results, click the Rejected checkbox for the record.

  10. Para cambiar la puntuación de coincidencia mínima que determina el nivel de coincidencia que debe tener un registro para que se muestre, seleccione el icono Puntuación de coincidencia mínima, situado sobre el lado derecho de la tabla, y escriba un número mayor.To change the minimum matching score that determines the level of matching that a record must have to be displayed, select the Min. Matching Score icon above the right-hand side of the table, and enter a higher number. De forma predeterminada, la puntuación de coincidencia mínima se establece en un 80%.The minimum matching score is set to 80% by default. Haga clic en Actualizar para cambiar el contenido de la tabla.Click Refresh to change the contents of the table.

  11. Una vez que se haya completado el análisis, el botón Iniciar se convertirá en el botón Reiniciar .After the analysis has completed, the Start button turns into a Restart button. Haga clic en Reiniciar para volver a ejecutar el proceso de análisis.Click Restart to run the analysis project again. Sin embargo, tenga en cuenta que los resultados del análisis anterior aún no se han guardado, por lo que, si hace clic en Reiniciar , los perderá.However, the results from the previous analysis have not been saved as yet, so clicking Restart will cause that previous data to be lost. Para continuar, haga clic en en el cuadro emergente.To continue, click Yes in the popup. Mientras se ejecuta el análisis, no abandone la página o el proceso de análisis se terminará.As the analysis is running, do not leave the page or the analysis process will be terminated.

  12. Haga clic en Siguiente para continuar con la fase de permanencia y exportación.Click Next to proceed to the survivorship and export stage.

Fase de permanencia y exportaciónSurvivorship and Exporting Stage

En el proceso de permanencia, Data Quality Services determina el registro que permanece para cada clúster; este registro reemplazará a los registros que coinciden con él en el clúster.In the survivorship process Data Quality Services determines a survivor record for each cluster, which will replace the other records that match it in the cluster. A continuación, exporta los resultados de búsqueda de coincidencias y/o permanencia a una tabla de la base de datos de SQL Server, a un archivo .csv o a un archivo de Excel.It then exports the matching and/or survivorship results to a table in the SQL Server database, a .csv file, or an Excel file.

La permanencia es opcional.Survivorship is optional. Puede exportar los resultados sin ejecutar la permanencia, en cuyo caso DQS utilizará el registro dinámico que designó en el análisis de coincidencia.You can export the results without running survivorship, in which case DQS would use the pivot record that was designated in the matching analysis. Si dos o más registros de un clúster cumplen la regla de permanencia, el proceso de permanencia seleccionará como el registro que permanece aquel cuyo identificador de registro sea más bajo.If two or more records in a cluster comply with the survivorship rule, the survivorship process will select the lowest record ID among the conflicting records to be the survivor. Puede exportar los registros que permanecen a varios archivos o tablas usando reglas de permanencia diferentes.You can export survivors to different files or tables using different survivorship rules.

  1. En la página Exportar , seleccione el destino al que desea exportar los datos coincidentes en Tipo de destino: SQL Server, Archivo CSVo Archivo de Excel.On the Export page, select the destination where you want to export the matching data to in Destination Type: SQL Server, CSV File, or Excel File.

    Importante

    Si utiliza la versión de 64 bits de Excel, no puede exportar los datos coincidentes en un archivo de Excel; puede exportar únicamente a una base de datos de SQL Server o un archivo .csv.If you are using 64-bit version of Excel, you cannot export the matching data to an Excel file; you can export only to a SQL Server database or to a .csv file.

  2. Si seleccionó SQL Server en Tipo de destino, seleccione la base de datos a la que desea exportar los resultados en Nombre de base de datos.If you selected SQL Server for Destination Type, select the database to export the results to in Database Name.

    Importante

    La base de datos de destino debe encontrarse en la misma instancia de SQL Server que el servidor DQS.The destination database must be present in the same SQL Server instance as the DQS server. En caso contrario, no aparecerá en la lista desplegable.Otherwise, it will not appear in the drop-down list.

  3. Active la casilla Resultados de búsqueda de coincidencias si desea exportar los resultados de búsqueda de coincidencias (vea la explicación más arriba) a la tabla designada de una base de datos de SQL Server, o al archivo de Excel o archivo .csv designado.Select the check box for Matching Results to export matching results (see above for an explanation) to the designated table in a SQL Server database or to the designated .csv or Excel file. Active la casilla Resultados de permanencia si desea exportar los resultados de permanencia (vea la explicación más arriba) a la tabla designada de una base de datos de SQL Server, o al archivo de Excel o archivo .csv designado.Select the check box for Survivorship Results to export survivorship results (see above for an explanation) to the designated table in a SQL Server database or to the designated .csv or Excel file.

    Si selecciona Resultados de búsqueda de coincidencias, se exportará lo siguiente:The following will be exported for matching results:

    • Una lista de clústeres y los registros coincidentes de cada clúster, incluido el nombre de la regla y la puntuación.A list of clusters and the matched records in each cluster, including the rule name and the score. El registro dinámico se marcará como “Dinamización”.The pivot record will be marked as “Pivot”. Los clústeres aparecerán en primer lugar en la lista de exportación.The clusters will appear first in the export list.

    • Una lista de registros no coincidentes, con el valor “NULL” en las columnas Puntuación y Nombre de la regla.A list of the unmatched records, with “NULL” in the Score and Rule Name columns. Estos registros se anexarán a la lista de exportación a continuación de los clústeres.These records will be appended to the export list after the clusters.

      Si selecciona Resultados de permanencia, se exportará lo siguiente:The following will be exported for survivorship results:

    • Una lista de los registros que permanecen tal y como lo determina el proceso de permanencia de acuerdo con la regla de permanencia.A list of the survivor records as determined by the survivorship process according to the survivorship rule. Estos registros aparecen en primer lugar en la lista de exportación.These records appear first in the export list.

    • Una lista de los registros no coincidentes que no están incluidos en los clústeres de registros coincidentes.A list of the unmatched records that are not included in the clusters of matched records. Estos registros se anexan a continuación de los resultados de permanencia.These records are appended after the survivor results.

  4. Si seleccionó SQL Server en Tipo de destino, escriba en Nombre de la tablalos nombres de las tablas a las que desea exportar los resultados.If you selected SQL Server for Destination Type, enter the name of the tables that you want to export the results to in Table Name. Si exporta tanto los resultados de búsqueda de coincidencias como los resultados de permanencia, las tablas de destino deberán tener nombres diferentes que sean únicos en la base de datos.If you export both matching results and survivorship results, the destination tables must have different names that are unique to the database.

  5. Si seleccionó Archivo CSV en Tipo de destino, escriba en Nombre de archivo CSVel nombre y la ruta de acceso del archivo CSV al que desea exportar.If you selected CSV File for Destination Type, enter the file and path for the CSV file that you want to export to in CSV File Name.

  6. Si seleccionó Archivo de Excel en Tipo de destino, escriba en Nombre del archivo de Excelel nombre y la ruta de acceso del archivo de Excel al que desea exportar.If you selected Excel File for Destination Type, enter the file and path for the Excel file that you want to export to in Excel File Name. No puede exportar a un archivo de Excel si utiliza la versión de 64 bits de Excel.You cannot export to an Excel file if you are using 64-bit version of Excel.

  7. Seleccione la regla de permanencia de la siguiente manera:Select the survivorship rule as follows:

    • Seleccione Registro dinámico (valor predeterminado) para identificar el registro que permanece como el registro dinámico inicial elegido arbitrariamente por DQS.Select Pivot record (the default) to identify the surviving record as the initial pivot record chosen arbitrarily by DQS.

    • Seleccione Registro más completo y más largo para identificar el registro que permanece como el registro con el mayor número de campos rellenos y con el mayor número de términos en cada campo.Select Most complete and longest record to identify the surviving record as the one with the largest number of populated fields, and has the largest number of terms in each field. Se comprueban todos los campos de origen, incluidos los que no se asignaron a ningún dominio en la página Asignación .All source fields are checked, even those fields that were not mapped to a domain on the Map page.

    • Seleccione Registro más completo para identificar el registro que permanece como el registro con el mayor número de campos rellenos.Select Most complete record to identify the surviving record as the one with the largest number of populated fields. Un campo está relleno si contiene al menos un valor (cadena, número o ambos).A populated field contains at least one value (string, numeric, or both). Se comprueban todos los campos de origen, incluidos los que no se asignaron a ningún dominio en la página Asignación.All source fields are checked, even those fields that were not mapped to a domain on the Map page. Un campo está relleno si contiene al menos un valor (cadena, número o ambos).A populated field contains at least one value (string, numeric, or both).

    • Seleccione Registro más largo para identificar el registro que permanece como el registro con el mayor número de términos en sus campos de origen.Select Longest record to identify the surviving record as the one with the largest number of terms in its source fields. Para determinar la longitud de cada registro, DQS comprueba la longitud de los términos en todos los campos de origen, incluidos los campos que no se asignaron a ningún dominio en la página Asignación .To determine the length of each record, DQS verifies the length of the terms in all source fields, even those fields that were not mapped to a domain on the Map page.

  8. Vea las estadísticas de la pestaña Generador de perfiles para asegurarse de que ha obtenido los resultados esperados.View the statistics in the Profiler tab to ensure that you are achieving the results that you need.

  9. Haga clic en Exportar para exportar los resultados.Click Export to export the results. Al hacerlo, aparece un cuadro de diálogo Exportación de coincidencia que muestra el progreso y los resultados de la exportación.This displays a Matching Export dialog box that shows the progress and then the results of the export.

    • Si seleccionó SQL Server como destino de los datos, se creará una nueva tabla con el nombre especificado en la base de datos seleccionada.If you selected SQL Server as the data destination, a new table with the specified name will be created in the selected database.

    • Si seleccionó Archivo CSV como destino de los datos, se creará un archivo .csv en la ubicación del equipo de Servidor de calidad de datosData Quality Server con el nombre de archivo especificado anteriormente en el cuadro Nombre de archivo csv .If you selected CSV File as the data destination, a .csv file will be created at the location on the Servidor de calidad de datosData Quality Server computer with the file name that you specified earlier in the Csv file name box.

    • Si seleccionó Archivo de Excel como destino de los datos, se creará un archivo .xlsx en la ubicación del equipo de Servidor de calidad de datosData Quality Server con el nombre de archivo especificado anteriormente en el cuadro Nombre del archivo de Excel .If you selected Excel File as the data destination, an .xlsx file will be created at the location on the Servidor de calidad de datosData Quality Server computer with the file name that you specified earlier in the Excel file name box.

  10. Compruebe que la exportación se ha realizado correctamente y, a continuación, haga clic en Cerrar.Verify that the export completed successfully, and then click Close.

  11. Haga clic en Finalizar para completar el proyecto de búsqueda de coincidencias.Click Finish to complete the matching project.

    Nota

    Si finaliza un proyecto de búsqueda de coincidencias y, más adelante, lo vuelve a utilizar, este usará la base de conocimiento que tenía cuando se publicó.If you have finished a matching project and then use it again, it will use the knowledge base in place when it was published. No usará ninguno de los cambios realizados en la base de conocimiento desde la finalización del proyecto.It will not use any changes that you have made to the knowledge base since you finished the project. Para utilizar estos cambios, o para utilizar una base de conocimiento nueva, tendrá que crear un proyecto de búsqueda de coincidencias nuevo.To use those changes, or to use a new knowledge base, you will have to create a new matching project. Por otro lado, si ha creado, pero no finalizado, un proyecto de búsqueda de coincidencias, los cambios que haya publicado en la directiva de coincidencia se utilizarán si ejecuta la búsqueda de coincidencias en el proyecto.On the other hand, if you have created, but not finished, a matching project, any changes that you have published to the matching policy will be used if you run matching in the project.

Seguimiento: después de ejecutar un proyecto de búsqueda de coincidenciasFollow Up: After Running a Matching Project

Después de ejecutar un proyecto de búsqueda de coincidencias, puede cambiar la directiva de coincidencia en la base de conocimiento y crear y ejecutar otro proyecto de búsqueda de coincidencias basado en la directiva de coincidencia actualizada.After you run a matching project, you can change the matching policy in the knowledge base, and create and run another matching project based upon the updated matching policy. Para obtener más información, consulte Create a Matching Policy.For more information, see Create a Matching Policy.

Pestañas Generador de perfiles y ResultadosProfiler and Results Tabs

Las pestañas Generador de perfiles y Resultados contienen las estadísticas del proceso de búsqueda de coincidencias.The Profiler and Results tabs contain statistics for the matching process.

Pestaña Generador de perfilesProfiler Tab

Haga clic en la pestaña Generador de perfiles para mostrar las estadísticas de la base de datos de origen y de cada campo de la regla de directiva.Click the Profiler tab to display statistics for the source database and for each field included in the policy rule. Las estadísticas se actualizarán mientras se ejecuta la regla de directiva.The statistics will be updated as the policy rule is run. La función de generación de perfiles le ayudará a evaluar la eficacia del proceso de eliminación de datos duplicados, lo que le permitirá determinar en qué medida dicho proceso puede mejorar la calidad de los datos.Profiling will help you assess the effectiveness of the de-duplication process, helping determine the extent to which the process is able to improve the quality of the data. La precisión en el proceso de generación de perfiles no es importante en un proyecto de búsqueda de coincidencias.Accuracy in profiling is not important for a matching project.

Las estadísticas de la base de datos de origen incluyen:The source database statistics include the following:

  • Registros: el número total de registros existentes en la base de datosRecords: The total number of records in the database

  • Valores totales: el número total de valores existentes en los camposTotal Values: The total number of values in the fields

  • Nuevos valores: el número total de valores que son nuevos desde la ejecución anterior y su porcentaje del totalNew Values: The total number of values that are new since the previous run, and their percentage of the whole

  • Valores únicos: el número total de valores únicos existentes en los campos y su porcentaje del totalUnique Values: The total number of unique values in the fields, and their percentage of the whole

  • Nuevos valores únicos: el número total de valores únicos que son nuevos en los campos y su porcentaje del totalNew Unique Values: The total number of unique values that are new in the fields, and their percentage of the whole

    Las estadísticas del campo incluyen las siguientes:The field statistics include the following:

  • Campo: nombre del campo incluido en las asignacionesField: Name of the field that was included in the mappings.

  • Dominio: nombre del dominio asignado al campoDomain: Name of the domain that was mapped to the field.

  • Nuevo: el número de nuevas coincidencias encontradas y su porcentaje del totalNew: The number of new matches found and their percentage of the total

  • Único: el número de registros únicos del campo y su porcentaje sobre el totalUnique: The number of unique records in the field and their percentaqe of the total

  • Integridad: el porcentaje de la regla que se ha ejecutadoCompleteness: The percentage that the rule run is complete.

Notificaciones de directiva de coincidenciaMatching Policy Notifications

En la actividad de directiva de coincidencia, se producen notificaciones cuando se dan las condiciones siguientes:For the matching policy activity, the following conditions result in notifications:

  • El campo está vacío en todos los registros; se recomienda eliminarlo de la asignación.The field is empty in all records; it is recommended that you eliminate it from mapping.

  • La puntuación de integridad del campo es muy baja; puede que desee eliminarlo de la asignación.The field completeness score is very low; you may want to eliminate it from mapping.

  • Ninguno de los valores de un campo es válido; debe comprobar la asignación y la pertinencia de las reglas de dominio para el contenido del campo.All values in a field are invalid; you should verify the mapping and the relevancy of domain rules to the field contents.

  • Hay un nivel bajo de valores válidos en el campo; debe comprobar la asignación y la pertinencia de las reglas de dominio para el contenido del campo.There is a low level of valid values in the field; you should verify the mapping and the relevancy of domain rules to the field contents.

  • Existe un alto grado de singularidad en el campo.There is a high level of uniqueness in this field. El uso de este campo en la directiva de coincidencia puede disminuir los resultados de búsqueda de coincidencias.Using this field in matching policy can decrease the matching results.

Pestaña Reglas de coincidenciaMatching Rules Tab

Haga clic en esta pestaña para mostrar una lista de las reglas existentes en la directiva de coincidencia y las condiciones de una regla.Click this tab to display a list of the rules in the matching policy and the conditions in a rule.

Lista de reglasRules List
Muestra una lista de todas las reglas de coincidencia existentes en la directiva de coincidencia.Displays a list of all matching rules in the matching policy. Seleccione una de las reglas para mostrar sus condiciones en la tabla Regla de coincidencia.Select one of the rules to display the conditions in the rule in the Matching Rule table.

Tabla Regla de coincidenciaMatching Rule Table
Muestra todas las condiciones de la regla seleccionada, incluidos el dominio, el valor de similitud, la ponderación y la selección de requisitos previos.Displays each condition in the selected rule, including domain, similarity value, weight, and prerequisite selection.

Pestaña Resultados de búsqueda de coincidenciasMatching Results Tab

Haga clic en la pestaña Resultados de búsqueda de coincidencias para mostrar las estadísticas del análisis del origen de datos usando el conocimiento seleccionado para el proyecto y la regla o reglas de coincidencia de la base de conocimiento.Click the Matching Results tab to display statistics for the analysis of the data source using the knowledge selected for the project and the matching rule or rules in that knowledge base. Las estadísticas incluyen:The statistics include the following:

  • El número total de registros existentes en la base de datosThe total number of records in the database

  • El número total de registros coincidentes existentes en la base de datosThe total number of matching records in the database

  • El número de registros existentes en la base de datos que no se consideran duplicadosThe number of records in the database that are not considered to be duplicates

  • El número de clústeres descubiertosThe number of clusters discovered

  • El promedio de tamaño de clúster (el número de registros duplicados dividido por el número de clústeres)The average cluster size (number of duplicate records divided by number of clusters)

  • El menor número de duplicados existentes en un clústerThe fewest number of duplicates in a cluster

  • El mayor número de duplicados existentes en un clústerThe greatest number of duplicates in a cluster