일치 정책 만들기Create a Matching Policy

이 항목에서는 DQS( Data Quality ServicesData Quality Services )의 기술 자료에 일치 정책을 만드는 방법에 대해 설명합니다.This topic describes how to build a matching policy in a knowledge base in Data Quality ServicesData Quality Services (DQS). 예제 데이터에서 일치 정책 작업을 실행하여 DQS에서 일치 프로세스를 준비할 수 있습니다.You prepare for the matching process in DQS by running the Matching Policy activity on sample data. 이 작업에서는 정책에서 하나 이상의 일치 규칙을 만들고 테스트한 다음 일치 규칙을 공개적으로 사용할 수 있도록 기술 자료를 게시합니다.In this activity you create and test one or more matching rules in the policy, and then publish the knowledge base to make the matching rules publically available for use. 기술 자료에는 하나의 일치 정책만 있을 수 있지만 해당 정책에 여러 일치 규칙이 포함되어 있을 수 있습니다.There can be only one matching policy in a knowledge base, but that policy can contain multiple matching rules.

일치 정책 만들기는 데이터 원본을 확인하고 도메인을 열에 매핑하는 매핑 프로세스, 하나 이상의 일치 규칙을 만들고 각 일치 규칙을 개별적으로 테스트하는 일치 정책 프로세스, 그리고 모든 일치 규칙을 동시에 실행하여 결과에 만족하는 경우 정책을 기술 자료에 추가하는 일치 결과 프로세스의 3단계로 수행됩니다.Matching policy creation is performed in three stages: a mapping process in which you identify the data source and map domains to columns, a matching policy process in which you create one or more matching rules and test each matching rule separately, and a matching results process in which you run all matching rules together, and if satisfied with them, add the policy to the knowledge base. 이러한 각 프로세스는 일치 정책 작업 마법사의 개별 페이지에서 수행되므로 여러 페이지를 앞뒤로 이동하고, 프로세스를 다시 실행하고, 특정 일치 정책 프로세스를 닫은 후 프로세스의 같은 단계로 돌아갈 수 있습니다.Each of these processes is performed on a separate page of the Matching Policy activity wizard, enabling you to move back and forth to different pages, to re-run the process, and to close out of a specific matching policy process and return to the same stage of the process. 모든 규칙을 동시에 테스트한 후 필요에 따라 일치 정책 페이지로 돌아가서 개별 규칙을 수정하고 별도로 다시 테스트한 다음 일치 결과 페이지로 돌아가서 모든 규칙을 다시 한번 동시에 실행할 수 있습니다.After testing all rules together, if desired you can return to the Matching Policy page, tweak an individual rule, test it again separately, and then return to the Matching Results page to run all rules together once again. DQS에서는 원본 데이터, 일치 규칙 및 일치 결과에 대한 통계를 제공하므로 정보를 바탕으로 일치 정책에 대한 의사를 결정하고 이를 구체화할 수 있습니다.DQS provides you with statistics about the source data, the matching rules, and the matching results that enable you to make informed decisions about the matching policy, so you can refine it.

시작하기 전에Before You Begin

필수 구성 요소Prerequisites

원본 데이터가 Excel 파일 형식인 경우 Data Quality 클라이언트Data Quality Client 컴퓨터에 Microsoft Excel이 설치되어 있어야 합니다.Microsoft Excel must be installed on the Data Quality 클라이언트Data Quality Client computer if the source data is in an Excel file. 그렇지 않으면 매핑 단계에서 Excel 파일을 선택할 수 없습니다.Otherwise, you will not be able to select the Excel file in the mapping stage. Microsoft Excel에서 만든 파일은 .xlsx, .xls 또는.csv 확장명을 가질 수 있습니다.The files created by Microsoft Excel can have an extension of .xlsx, .xls, or .csv. 64비트 버전의 Excel이 사용된 경우 Excel 2003 파일 (.xls)만 지원됩니다. Excel 2007 또는 2010 파일(.xlsx)은 지원되지 않습니다.If the 64-bit version of Excel is used, only Excel 2003 files (.xls) are supported; Excel 2007 or 2010 files (.xlsx) are not supported. 64비트 버전의 Excel 2007 또는 2010을 사용 중인 경우 파일을 .xls 파일 또는 .csv 파일로 저장하거나 32비트 버전의 Excel을 대신 설치하세요.If you are using 64-bit version of Excel 2007 or 2010, save the file as an .xls file or a .csv file, or install a 32-bit version of Excel instead.

보안Security

사용 권한Permissions

일치 정책을 만들려면 DQS_MAIN 데이터베이스에 대한 dqs_kb_editor 또는 dqs_administrator 역할이 있어야 합니다.You must have the dqs_kb_editor or the dqs_administrator role on the DQS_MAIN database to create a matching policy.

일치 규칙 매개 변수를 설정하는 방법How to Set Matching Rule Parameters

일치 규칙 만들기는 하나의 레코드가 다른 레코드와 일치하는지 확인하는 데 사용되는 요소를 입력하는 대화형 프로세스입니다.Creating a matching rule is an iterative process in which you enter the factors used to determine if one record is a match for another. 테이블의 모든 도메인에 대한 조건을 입력할 수 있습니다.You can enter conditions for any domain in a table. DQS에서는 두 개의 레코드에 대해 일치를 수행할 때 일치 규칙에 포함되어 있는 도메인에 매핑된 필드의 값을 비교합니다.When DQS performs matching on two records, it will compare the values in the fields mapped to the domains that are included in the matching rule. DQS에서는 규칙의 각 필드에 있는 값을 분석한 다음 각 도메인에 대해 규칙에 입력된 요소를 사용하여 최종 일치 점수를 계산합니다.DQS analyzes the values in each field in the rule, and then uses the factors entered in the rule for each domain to calculate a final matching score. 비교한 두 레코드의 일치 점수가 최소 일치 점수보다 큰 경우에는 두 필드가 일치하는 것으로 간주됩니다.If the matching score for the two records compared is greater than the minimum matching score, then the two fields are considered matches.

일치 규칙에 입력하는 요소는 다음과 같습니다.The factors that you enter in a matching rule include the following:

  • 가중치: 규칙의 각 도메인에 대해 숫자 가중치를 입력합니다. 이 값에 따라 도메인에 대한 일치 분석이 규칙의 다른 각 도메인에 대한 일치 분석과 비교되는 방법이 결정됩니다.Weight: For each domain in the rule, enter a numerical weight that determines how the matching analysis for the domain will be compared to that for each other domain in the rule. 가중치는 두 레코드 간의 전체 일치 점수에 대한 필드 점수의 기여도를 나타냅니다.The weight indicates the contribution of the field’s score to the overall matching score between two records. 각 원본 필드에 할당된 계산된 점수는 두 레코드의 복합 일치 점수에 합산됩니다.The calculated scores assigned to each source field are summed together for a composite matching score for the two records. 필수 구성 요소(정확한 수치 또는 근사치의 유사성을 가짐)가 아닌 각 필드에 대해 10에서 100 사이의 가중치를 설정합니다.For each field that is not a prerequisite (with a similarity of exact or similar), set the weight between 10 and 100. 필수 구성 요소가 아닌 도메인의 가중치 합은 100과 같아야 합니다.The sum of the weights of the domains that are not prerequisites must be equal to 100. 값이 필수 구성 요소인 경우 가중치는 0으로 설정되며 변경할 수 없습니다.If the value is a prerequisite, the weight is set to 0 and cannot be changed.

  • 정확한 수치의 유사성: 같은 필드에 있는 두 레코드의 값이 동일한 경우에만 값이 일치하는 것으로 간주되도록 하려면 정확한 수치 를 선택합니다.Similarity of Exact: Select Exact if the values in the same field of two different records must be identical for the values to be considered to be a match. 동일한 경우 해당 도메인의 일치 점수는 "100"으로 설정되며, DQS에서는 이 점수와 규칙의 다른 도메인에 대한 점수를 사용하여 집계 일치 점수를 결정합니다.If identical, the matching score for that domain will be set to “100”, and DQS will use that score and the scores for the other domains in the rule to determine the aggregate matching score. 동일하지 않은 경우 해당 도메인의 일치 점수는 "0"으로 설정되며, 규칙 처리가 다음 조건으로 이동합니다.If not identical, the matching score for that domain will be set to “0”, and processing of the rule will proceed to the next condition. 숫자 도메인에 대한 일치 규칙을 설정하고 근사치를 선택한 경우 백분율 또는 정수로 허용 오차를 입력할 수 있습니다.If you set up a matching rule for a numeric domain and you select Similar, you can enter a tolerance either as a percentage or an integer. 형식이 날짜인 도메인에 대해 근사치를 선택한 경우 일, 월 또는 연도(정수)로 허용 오차를 입력할 수 있습니다. 날짜 도메인에는 백분율 허용 오차가 없습니다.For a domain of type date, you can enter a tolerance as a day, month, or year (integer) if you select Similar; there is no percentage tolerance for a date domain. 정확한 수치를 선택한 경우에는 이 옵션이 제공되지 않습니다.If you select Exact, you do not have this option.

  • 근사치의 유사성: 같은 필드에 있는 두 레코드의 두 값이 동일하지 않은 경우에도 일치하는 것으로 간주되도록 하려면 근사치 를 선택합니다.Similarity of Similar: Select Similar if two values in the same field of two different records can be considered a match even if the values are not identical. 이 경우 DQS에서는 규칙을 실행할 때 해당 도메인의 일치 점수를 계산하고 이 점수와 규칙의 다른 도메인에 대한 점수를 사용하여 집계 일치 점수를 결정합니다.When DQS runs the rule, it will calculate a matching score for that domain, and will use that score and the scores for the other domains in the rule to determine the aggregate matching score. 필드의 값 사이의 최소 유사성은 60%입니다.The minimum similarity between the values of a field is 60%. 두 레코드의 필드에 대해 계산된 일치 점수가 60보다 작은 경우 유사성 점수는 자동으로 0으로 설정됩니다.If the calculated matching score for a field of two records is less than 60, the similarity score is automatically set to 0. 숫자 필드에 대한 일치 규칙을 설정하고 근사치를 선택한 경우 백분율 또는 정수로 허용 오차를 입력할 수 있습니다.If you are setting up a matching rule for a numeric field, and you select Similar, you can enter a tolerance as a percentage or integer. 날짜 필드에 대한 일치 규칙을 설정하고 근사치를 선택한 경우 숫자 허용 오차를 입력할 수 있습니다.If you are setting up a matching rule for a date field, and you select Similar, you can enter a numerical tolerance.

  • 필수 구성 요소: 같은 필드의 두 레코드 값이 100% 일치를 반환해야 하며 그렇지 않은 경우 레코드가 일치하는 것으로 간주되지 않고 규칙의 다른 절이 무시되도록 지정하려면 필수 구성 요소 를 선택합니다.Prerequisite: Select Prerequisite to specify that the values in the same field in two different records must return a 100% match, or the records are not considered a match and the other clauses in the rule are disregarded. 필수 구성 요소 를 선택한 경우에는 도메인에 대한 가중치 필드가 제거되므로 도메인에 대한 가중치를 정의할 수 없습니다.When Prerequisite is selected, the weight field for the domain is removed so that you cannot define a weight for the domain. 가중치 합계가 100과 같도록 하나 이상의 도메인 가중치를 다시 설정해야 합니다.You must reset one or more domain weights so that the sum of weights is equal to 100. 필수 구성 요소 도메인은 레코드 일치 점수에 기여하지 않습니다.Prerequisite domains do not contribute to the record matching score. 레코드 일치 점수는 유사성이 근사치 또는 정확한 수치로 설정된 필드의 값을 비교하여 결정됩니다.The record matching score is determined by comparing the values in fields for which the Similarity is set to Similar or Exact. 필드를 필수 구성 요소로 지정하면 해당 도메인에 대한 유사성이 자동으로 정확한 수치로 설정됩니다.When you make a field a prerequisite, the Similarity for that domain is automatically set to Exact.

    최소 일치 점수는 해당 점수보다 크거나 같은 경우에 두 레코드가 일치하는 것으로 간주되고 레코드 상태가 "일치함"으로 설정되는 임계값입니다.The minimum matching score is the threshold at or above which two records are considered to be a match (and the status for the records is set to “Matched”). 증가값에 정수 값 "1"을 입력하거나 위쪽 또는 아래쪽 화살표를 클릭하여 증가값의 값을 "10"씩 증가시키거나 감소시킵니다.Enter an integer value in increments of “1” or click the up or down arrow to increase or decrease the value in increments of “10”. 최소값은 80입니다.The minimum value is 80. 일치 점수가 80보다 낮으면 두 레코드가 일치하는 것으로 간주되지 않습니다.If the matching score is below 80, the two records are not considered a match. 이 페이지에서 최소 일치 점수의 범위를 변경할 수 없습니다.You cannot change the range of the minimum matching score in this page. 가장 낮은 최소 일치 점수는 80입니다.The lowest min. matching score is 80. 그러나 DQS 관리자인 경우 관리 페이지에서 가장 낮은 최소 일치 점수를 변경할 수 있습니다.You can, however, change the lowest minimum matching score within the Administration page (if you are a DQS administrator).

    일치 규칙 만들기는 반복적인 프로세스입니다. 원하는 결과를 얻기 위해 규칙의 도메인에 대한 상대 가중치, 도메인의 유사성 또는 필수 구성 요소 속성 또는 규칙의 최소 일치 점수를 변경해야 할 수 있기 때문입니다.Creating a matching rule is an iterative process because you may need to change the relative weights of the domains in the rule, or the similarity or the prerequisite property for a domain, or the min. matching score for the rule, in order to achieve the results that you need. 또한 일치 점수를 만들기 위해 여러 규칙을 만들고 각 규칙을 실행해야 할 수도 있습니다.You may also find that you need to create multiple rules, each of which will be run to create the matching score. 하나의 규칙만으로는 원하는 결과를 얻기 어려울 수 있습니다.It may be difficult to achieve the result you need with only one rule. 여러 규칙은 필요한 일치에 대한 다양한 보기를 제공합니다.Multiple rules will provide different views of a required match. 여러 규칙을 사용하면 각 규칙에 보다 적은 수의 도메인을 포함하고 각 도메인에 보다 높은 가중치를 사용하여 더 나은 결과를 얻을 수 있습니다.With multiple rules, you may be able to include fewer domains in each rule, use higher weights for each domain, and achieve better results. 데이터가 부정확하고 불완전한 경우 필요한 일치를 찾으려면 더 많은 규칙이 필요할 수 있습니다.If the data is less accurate and less complete, you may need more rules to find required matches. 데이터의 정확성과 완결성이 높을수록 필요한 규칙 수가 적어집니다.If the data is more accurate and complete, you need fewer rules.

    프로파일링은 완결성 및 고유성에 대한 통찰력을 제공합니다.Profiling gives insights on completeness and uniqueness. 따라서 완결성과 고유성을 함께 고려해야 합니다.Consider completeness and uniqueness in tandem. 완결성 및 고유성 데이터를 사용하여 일치 프로세스에서 필드에 제공할 가중치를 결정할 수 있습니다.Use completeness and uniqueness data to determine what weight to give a field in the matching process. 필드의 고유성 수준이 높은 경우 일치 정책에서 이 필드를 사용하면 일치 결과를 낮출 수 있으므로 해당 필드의 가중치를 비교적 낮은 값으로 설정할 수 있습니다.If there is a high level of uniqueness in a field, using the field in a matching policy can decrease the matching results, so you may want to set the weight for that field to a relatively small value. 열의 고유성 수준이 낮고 완결성 또한 낮은 경우 해당 열에 대한 도메인을 포함하지 않을 수 있습니다.If you have a low level of uniqueness for a column, but low completeness, you may not want to include a domain for that column. 반면, 고유성 수준은 낮지만 완결성 수준이 높은 경우에는 도메인을 포함할 수 있습니다.With a low level of uniqueness, but a high level of completeness, you may want to include the domain. 성별과 같은 일부 열은 본래 고유성 수준이 낮을 수 있습니다.Some columns, such as gender, may naturally have a low level of uniqueness. 자세한 내용은 Profiler and Results Tabs을 참조하세요.For more information, see Profiler and Results Tabs.

1단계: 일치 정책 시작First Step: Starting a Matching Policy

Data Quality 클라이언트Data Quality Client 응용 프로그램의 기술 자료 관리 영역에서 일치 정책 작업을 수행할 수 있습니다.You perform the matching policy activity in the knowledge base management area of the Data Quality 클라이언트Data Quality Client application.

  1. Data Quality 클라이언트를 시작합니다.Start Data Quality Client. 방법은 다음을 참조하세요.For information about doing so, see Data Quality Client 응용 프로그램을 실행합니다. Run the Data Quality Client Application.

  2. Data Quality 클라이언트Data Quality Client 홈 화면에서 새 기술 자료 를 클릭하여 새 기술 자료에 일치 정책을 만듭니다.In the Data Quality 클라이언트Data Quality Client home screen, click New knowledge base to create a matching policy in a new knowledge base. 기술 자료의 이름과 설명을 입력하고 원하는 대로 기술 자료 만들기 를 설정합니다.Enter a name for the knowledge base, enter a description, and set Create knowledge base from as desired. 작업에 대해 일치 정책 을 클릭합니다.Click Matching Policy for the activity. 계속 진행하려면 다음 을 클릭합니다.Click Next to proceed.

  3. 기술 자료 열기 를 클릭하여 기존 기술 자료에서 일치 정책을 만들거나 수정합니다.Click Open knowledge base to create or modify the matching policy in an existing knowledge base. 기술 자료를 선택한 다음 일치 정책을 선택하고 다음을 클릭합니다.Select the knowledge base, select Matching Policy, and then click Next. 최근 기술 자료에서 기술 자료를 클릭할 수도 있습니다.You can also click a knowledge base under Recent Knowledge Base. 일치 정책에서 작업 중일 때 닫은 기술 자료를 연 경우 일치 정책 작업이 닫힌 단계( 최신 기술 자료 아래의 기술 자료 이름 또는 기술 자료 테이블의 해당 기술 자료에 대한 상태열에 표시된 단계)로 이동합니다.If you open a knowledge base that was closed while a matching policy was being worked on, you will proceed to the stage that the matching policy activity was closed in (as indicated by the State column for the knowledge base in the knowledge base table or in the knowledge base name under Recent Knowledge Base). 일치 정책이 포함되어 있고 완료된 기술 자료를 연 경우 일치 정책 페이지로 이동합니다.If you open a knowledge base that includes a matching policy and was finished, you will go to the Matching Policy page. 일치 정책이 포함되어 있지 않고 완료된 기술 자료를 연 경우 매핑 페이지로 이동합니다.If you open a knowledge base that does not include a matching policy and was finished, you will go to the Mapping Page.

매핑 단계Mapping Stage

매핑 단계에서는 일치 정책을 만들 데이터의 원본을 확인하고 도메인을 일치 정책 작업에 사용할 수 있도록 원본 열을 도메인에 매핑합니다.In the mapping stage you identify the source of the data that you will create the matching policy for, and you map source columns to domains to make the domains available for the matching policy activity.

  1. 페이지에서 데이터베이스에 대한 정책을 만들려면 데이터 원본SQL Server로 그대로 두고 데이터베이스에서 정책을 만들려는 데이터베이스를 선택한 다음 테이블/뷰에서 테이블 또는 뷰를 선택합니다.On the Map page, to create a policy for a database, leave Data Source as SQL Server, select the database that you want to create the policy for in Database, and then select the table or view in Table/View. 원본 데이터베이스는 Data Quality 서버Data Quality Server와 동일한 SQL Server 인스턴스에 있어야 합니다.The source database must be present in the same SQL Server instance as Data Quality 서버Data Quality Server. 그렇지 않으면 드롭다운 목록에 나타나지 않습니다.Otherwise, it will not appear in the drop-down list.

  2. Excel 스프레드시트의 데이터에 대한 정책을 만들려면 Excel 파일데이터 원본으로 선택하고 찾아보기 를 클릭한 다음 Excel 파일을 선택합니다. 이때 해당되는 경우 첫 번째 행을 헤더로 사용하세요 를 선택된 상태로 그대로 둡니다.To create a policy for the data in an Excel spreadsheet, select Excel File for Data Source, click Browse and select the Excel file, and leave Use first row as header selected if appropriate. 워크시트에서 데이터의 원본으로 사용할 Excel 파일의 워크시트를 선택합니다.In Worksheet, select the worksheet in the Excel file that will be the source of the data. Excel 파일을 선택하려면 Data Quality 클라이언트 컴퓨터에 Microsoft Excel이 설치되어 있어야 합니다.Microsoft Excel must be installed on the Data Quality Client computer to select an Excel file. 그렇지 않으면 찾아보기 단추를 사용할 수 없으며 이 텍스트 상자 아래에 Microsoft Excel이 설치되어 있지 않다는 알림이 표시됩니다.Otherwise, the Browse button will not be available, and you will be notified beneath this text box that Microsoft Excel is not installed.

  3. 매핑에서 원본 열에 대한 필드를 선택한 다음 도메인 만들기 아이콘을 클릭합니다.Under Mappings, select a field for Source Column, and then click the Create Domain icon.

  4. 매핑에서 원본 열에 대한 데이터 원본의 필드를 선택한 다음 해당 도메인을 선택합니다.Under Mappings, select a field in the data source for Source Column, and then select the corresponding domain. 일치 프로세스에서 사용할 모든 도메인에 대해 작업을 반복합니다.Repeat for all domains that you use in the matching process. 필요에 따라 도메인 만들기 또는 복합 도메인 만들기를 클릭하여 도메인을 만듭니다.Create domains as necessary by clicking Create a Domain or Create a Composite Domain.

    참고

    원본 데이터 형식이 DQS에서 지원되고 DQS 도메인 데이터 형식과 일치하는 경우에만 일치 정책을 만드는 동안 DQS 도메인에 원본 데이터를 매핑할 수 있습니다.You can map your source data to a DQS domain while creating a matching policy only if the source data type is supported in DQS, and matches with the DQS domain data type. DQS에서 지원되는 데이터 형식에 대한 자세한 내용은 DQS 도메인에 대해 지원되는 SQL Server 및 SSIS 데이터 형식을 참조하세요.For information about supported data types in DQS, see Supported SQL Server and SSIS Data Types for DQS Domains.

  5. 더하기(+) 컨트롤을 클릭하여 매핑 테이블에 행을 추가하거나 빼기(–) 컨트롤을 클릭하여 행을 제거합니다.Click the plus (+) control to add a row to the Mappings table or the minus (–) control to remove a row.

  6. 데이터 원본 미리 보기 를 클릭하여 선택한 SQL Server 테이블이나 뷰 또는 선택한 Excel 워크시트에서 데이터를 확인합니다.Click Preview data source to see the data in the SQL Server table or view that you selected, or the Excel worksheet that you selected.

  7. 복합 도메인 보기/선택 을 클릭하여 기술 자료에서 사용할 수 있는 복합 도메인 목록을 확인하고 매핑에 적절한 복합 도메인을 선택합니다.Click View/Select Composite Domains to view a list of the composite domains available in the knowledge base and select as appropriate for mapping.

  8. 다음 을 클릭하여 일치 정책 단계로 이동합니다.Click Next to proceed to the matching policy stage.

    참고

    일치 프로젝트의 단계를 저장하고 DQS 홈 페이지로 돌아가려면 닫기 를 클릭합니다.Click Close to save the stage of the matching project, and return to the DQS home page. 다음에 이 프로젝트를 열면 동일한 단계에서 시작됩니다.The next time you open this project, it will start from the same stage. 취소 를 클릭하면 일치 작업이 저장되지 않고 종료되며 DQS 홈 페이지로 돌아갑니다.Click Cancel to end the matching activity, losing your work, and return to the DQS home page.

일치 정책 단계Matching Policy Stage

일치 정책 페이지에서 일치 규칙을 만들고 개별적으로 테스트할 수 있습니다.You create matching rules and test them individually in the Matching Policy page. 일치 정책 페이지에서 일치 규칙을 테스트하면 DQS에서 선택된 규칙에 대해 확인한 클러스터를 보여 주는 일치 결과 테이블이 나타납니다.When you test a matching rule on the Matching Policy page, you will see a matching results table that shows the clusters that DQS has identified for the selected rule. 이 테이블에는 클러스터의 각 레코드가 매핑 도메인 값 및 일치 점수와 함께 표시되며 클러스터에 대한 초기 피벗 레코드도 표시됩니다.The table shows each record in the cluster with the mapping domain values and matching score, and the initial pivot record for the cluster. 전체 일치 프로세스에 대한 프로파일링 데이터, 각 일치 규칙의 조건 및 각 일치 규칙의 결과에 대한 통계를 개별적으로 표시할 수도 있습니다.You can also display profiling data for the matching process as a whole, the conditions in each matching rule, and statistics on the results for each matching rule separately. 원하는 마스터 규칙 데이터를 필터링할 수 있습니다.You can filter on the master rule data that you want.

일치 규칙의 작동 방식에 대한 자세한 내용은 일치 규칙 매개 변수를 설정하는 방법을 참조하세요.For more information on how matching rules work, see How to Set Matching Rule Parameters.

  1. 일치 정책 페이지에서 일치 규칙 만들기 아이콘을 클릭합니다.On the Matching Policy page, click the Create a matching rule icon.

  2. 규칙에 대한 이름 및 설명을 입력합니다.Enter a name and description for the rule.

  3. 일치 요구 사항을 보다 엄격하게 지정하려면 최소 일치 점수 를 증가시킵니다.Increase the value of the Min. matching score if you want to make the matching requirements more stringent. 최소 일치 점수에 대한 자세한 내용은 일치 규칙 매개 변수를 설정하는 방법을 참조하세요.For more information about the minimum matching score, see How to Set Matching Rule Parameters.

  4. 새 도메인 요소 추가 아이콘을 클릭합니다.Click the Add a new domain element icon.

  5. 규칙 값을 입력할 도메인 또는 복합 도메인을 선택합니다.Select a domain or composite domain to enter rule values for.

    참고

    복합 도메인의 각 단일 도메인이 원본 열에 매핑된 경우에만 복합 도메인을 선택할 수 있습니다.You can select a composite domain only if each single domain in the composite domain has been mapped to a source column.

  6. 같은 필드에 있는 두 레코드의 두 값이 동일하지 않은 경우에도 일치하는 것으로 간주되도록 하려면 유사성에 대해 근사치 를 선택합니다.For Similarity, select Similar if two values in the same field of two different records can be considered a match even if not identical. 같은 필드에 있는 두 레코드의 값이 동일한 경우에만 값이 일치하는 것으로 간주되도록 하려면 정확한 수치 를 선택합니다.Select Exact if two values in the same field of two different records must be identical to be considered to be a match. 자세한 내용은 일치 규칙 매개 변수를 설정하는 방법를 참조하세요.(For more information, see How to Set Matching Rule Parameters.)

  7. 가중치에 대해 두 레코드의 전체 일치 점수에 대한 도메인 일치 점수의 기여도를 결정하는 값을 입력합니다.For Weight, enter a value that determines the contribution of a domain’s matching score to the overall matching score for two records.

    참고

    복합 도메인에 대한 가중치를 정의할 때 복합 도메인에 대해 별도의 가중치를 지정하지 않고 복합 도메인의 각 단일 도메인에 대해 서로 다른 가중치를 입력하거나, 복합 도메인의 단일 도메인에 대해 별도의 가중치를 지정하지 않고 복합 도메인에 대한 단일 가중치를 입력할 수 있습니다.When you define a weight for a composite domain, you can enter a different weight for each single domain in the composite domain, in which case the composite domain is not given a separate weight, or you can enter a single weight for the composite domain, in which the single domains in the composite domain are not given separate weights.

  8. 필드의 두 레코드 값이 100% 일치를 반환해야 하며 그렇지 않은 경우 레코드가 일치하는 것으로 간주되지 않고 규칙의 다른 절이 무시되도록 지정하려면 필수 구성 요소 를 선택합니다.Select Prerequisite to specify that the values for the field in the two records must return a 100% match, else the records are not considered a match and the other clauses in the rule are disregarded. 이렇게 하면 유사성근사치인 경우 정확한 수치로 변경되고 일치가 100%여야 하므로 가중치가 제거됩니다.If the Similarity is Similar, it will change to Exact, and the weight will be removed because the match must be 100%.

  9. 일치 규칙에 포함할 다른 모든 도메인에 대해 4~8단계를 반복합니다.Repeat steps 4 through 8 for all other domains that will be part of the matching rule. 규칙의 모든 도메인에 대한 가중치의 합은 100과 같아야 합니다.Ensure that the sum of the weights for all domains in the rule equals 100.

  10. 일치가 실행될 때 클러스터 그룹에 공통적인 레코드가 있는 경우에도 모든 클러스터에 대한 피벗 레코드와 다음 레코드를 표시하려면 드롭다운 목록에서 겹치는 클러스터 를 선택합니다.Select Overlapping clusters from the drop-down list to display the pivot records and following records for all clusters when matching is executed, even if groups of clusters have records in common. 일치가 실행될 때 공통적인 레코드가 있는 클러스터를 단일 클러스터로 표시하려면 겹치지 않는 클러스터 를 선택합니다.Select Non overlapping clusters to display clusters that have records in common as a single cluster when matching is executed.

  11. 데이터 원본에서 준비 테이블로 데이터를 복사하여 일치 정책을 실행할 때 인덱스를 다시 작성하려면 원본에서 데이터 다시 로드 를 클릭합니다.Click Reload data from source to copy data from the data source into the staging table and re-index it when you run the matching policy. 준비 테이블로 데이터를 복사하여 인덱스를 다시 작성하지 않고 일치 정책을 실행하려면 이전 데이터에 대해 실행 을 클릭합니다.Click Execute on previous data to run a matching policy without copying the data into the staging table and re-indexing the data. 일치 정책을 처음 실행하거나 페이지에서 매핑을 변경한 후 팝업에서 를 클릭한 경우에는 이전 데이터에 대해 실행 이 비활성화됩니다.Execute on previous data is disabled for the first run of the matching policy, or if you change mapping in the Map page, and then press Yes in the following popup. 두 경우 모두 인덱스를 다시 작성해야 합니다.In both of those cases, you must re-index. 일치 정책이 변경되지 않은 경우에는 인덱스를 다시 작성할 필요가 없습니다.It is not necessary to re-index if the matching policy has not changed. 이전 데이터에 대해 실행하면 성능이 향상됩니다.Executing on previous data can help performance.

  12. 시작 을 클릭하여 선택한 규칙에 대한 일치 프로세스를 실행합니다.Click Start to run the matching process for the selected rule. 프로세스가 완료되면 테이블에 클러스터의 각 레코드에 대한 레코드 ID, 클러스터 번호 및 데이터 열(일치 규칙에 없는 데이터 열 포함)이 표시됩니다.When the process is complete, the table displays the Record ID, Cluster number, and data columns (including those not in the matching rule) for each record in a cluster. 클러스터의 피벗 행은 중복 제거 프로세스 후에 존속되는 가장 우선적인 후보로 간주됩니다.The pivot row in the cluster is considered to be the prime candidate for surviving the de-duplication process. 클러스터의 각 추가 행은 중복된 것으로 간주되며, 피벗 레코드와 비교된 해당 일치 점수가 결과 테이블에 제공됩니다.Each additional row in a cluster is considered a duplicate; its matching score (compared to the pivot record) is provided in the results table. 클러스터 번호는 클러스터의 피벗 레코드에 대한 레코드 ID와 같습니다.The cluster number is that same as the record ID for the pivot record in the cluster.

  13. 일치 결과 테이블의 데이터를 사용하여 다음 작업을 수행할 수 있습니다.You can work with the data in the Matching Results table as follows:

    • 필터에서 일치함 을 선택하여 일치하는 모든 행과 해당 점수를 표시합니다.In Filter, select Matched to show all matched rows and their score. 일치하는 것으로 간주되지 않는 행(일치 점수가 최소 일치 점수보다 작은 행)은 일치 결과 테이블에 표시되지 않습니다.Rows that are not considered matches (that have a matching score less than the minimum matching score) are not shown in the matching results table. 일치하지 않음 을 선택하면 일치하는 행을 제외하고 일치하지 않는 모든 행이 표시됩니다.Select Unmatched to show all unmatched rows, not matched rows.

    • 백분율 드롭다운 상자의 드롭다운 목록에서 "5"씩 증가하는 백분율을 선택합니다.In the Percent Drop Down Box, select a percentage from the drop-down list, in increments of “5”. 일치 점수가 이 백분율보다 크거나 같은 모든 행이 일치 결과 테이블에 표시됩니다.All rows with a matching score that is greater than or equal to that percentage will be displayed in the matching results table.

    • 일치 결과 테이블의 레코드를 두 번 클릭하면 피벗 레코드와 원본 레코드(두 레코드의 모든 필드 값 포함), 두 레코드 간의 점수 및 레코드 일치 드릴다운이 표시된 일치 점수 정보 팝업이 나타납니다.If you double-click a record in the matching results table, DQS displays a Matching Score Details popup that displays the pivot record and source record (and the values in all their fields), the score between them, and a drill-down of the record matching. 드릴다운에는 피벗 레코드와 원본 레코드의 각 필드 값이 비교할 수 있도록 표시되고 각 필드가 두 레코드의 전체 일치 점수에 기여하는 일치 점수가 표시됩니다.The drill-down displays the values in each field of the pivot record and source record so you can compare them, and shows the matching score that each field contributes to the overall matching score for the two records.

  14. 프로파일러일치 결과 탭의 통계를 보고 원하는 결과를 얻었는지 확인합니다.View the statistics in the Profiler and Matching Results tabs to ensure that you are achieving the results that you need. 자세한 내용은 Profiler and Results Tabs을 참조하세요.For more information, see Profiler and Results Tabs.

  15. 규칙을 변경해야 하는 경우 규칙 편집기에서 변경하고 다시 시작을 클릭합니다.If the rule needs to be changed, change it in the Rule Editor, and click Restart.

    참고

    첫 번째 분석이 완료되면 시작 단추가 다시 시작 단추로 바뀝니다.After the first analysis has completed, the Start button turns into a Restart button. 그러나 이전 분석 결과가 아직 저장되지 않은 경우 다시 시작 을 클릭하면 이전 데이터가 손실됩니다.If the results from the previous analysis have not been saved as yet, clicking Restart will cause that previous data to be lost. 분석이 실행 중일 때는 페이지에서 나가지 마세요. 그러면 분석 프로세스가 종료됩니다.As the analysis is running, do not leave the page or the analysis process will be terminated.

  16. 일치 결과 탭에 마지막 두 번 실행한 규칙의 통계가 표시됩니다.The Matching Results tab displays statistics for the last two runs of the rule. 일치 규칙을 서로 다른 설정으로 두 번 이상 실행한 경우 현재 규칙과 이전 규칙에 대한 통계를 비교합니다.If you have run the matching rule more than once with different settings, compare the statistics for the current rule and the previous rule. 이전 규칙의 결과가 더 나은 경우 이전 규칙 복원 을 클릭하여 이전 규칙의 조건을 복원하면 규칙이 편집하기 이전 상태로 돌아갑니다.If you find that the results from the previous rule were better, click Restore Previous rule to restore the conditions of the previous rule, returning the rule to its previous state before editing. 현재 규칙 조건은 손실됩니다.The current rule conditions will be lost. 이렇게 하면 마지막 두 일치 실행을 기반으로 정책을 튜닝할 수 있으므로 일치 정책을 튜닝하는 데 소요되는 시간이 절감됩니다.This enables you to tune the policy based on the last two matching runs, decreasing the time that you spend tuning the matching policy.

  17. 일치 정책에 다른 규칙을 추가하려면 1단계부터 반복합니다.If you want another rule to be added to the matching policy, repeat from step 1.

  18. 다음 을 클릭하여 일치 결과 단계로 이동합니다.Click Next to proceed to the matching results stage.

일치 결과 단계Matching Results Stage

일치 결과 페이지에서 모든 일치 규칙을 한 번에 테스트할 수 있습니다.You test all your matching rules at once in the Matching Results page. 그 전에 규칙 테스트 실행을 통해 겹치거나 겹치지 않는 클러스터를 확인하도록 지정할 수 있습니다.Before you do so, you can specify that the rule test run identify overlapping or non-overlapping clusters. 규칙을 여러 번 실행하는 경우 원본에서 다시 로드된 데이터 또는 이전 데이터에 대해 규칙을 실행할 수 있습니다.If you are running the rules multiple times, you can execute the rule on data reloaded from the source or on previous data.

일치 결과 페이지에서 일치 규칙을 테스트하면 DQS에서 모든 규칙에 대해 확인한 클러스터를 보여 주는 일치 결과 테이블이 나타납니다.When you test the matching rules on the Matching Results page, you will see a matching results table that shows the clusters that DQS has identified for all rules. 이 테이블에는 클러스터의 각 레코드가 매핑 도메인 값 및 일치 점수와 함께 표시되며 클러스터에 대한 초기 피벗 레코드도 표시됩니다.The table shows each record in the cluster with the mapping domain values and matching score, and the initial pivot record for the cluster. 전체 일치 규칙에 대한 프로파일링 데이터, 각 일치 규칙의 조건 및 모든 일치 규칙의 결과에 대한 통계를 표시할 수도 있습니다.You can also display profiling data for the matching rules as a whole, the conditions in each matching rule, and statistics on the results for all matching rules.

  1. 일치가 실행될 때 클러스터 그룹에 공통적인 레코드가 있는 경우에도 모든 클러스터에 대한 피벗 레코드와 다음 레코드를 표시하려면 일치 결과 페이지의 드롭다운 목록에서 겹치는 클러스터 를 선택합니다.On the Matching Results page, select Overlapping clusters from the drop-down list to display the pivot records and following records for all clusters when matching is executed, even if groups of clusters have records in common. 일치가 실행될 때 공통적인 레코드가 있는 클러스터를 단일 클러스터로 표시하려면 겹치지 않는 클러스터 를 선택합니다.Select Non overlapping clusters to display clusters that have records in common as a single cluster when matching is executed.

  2. 데이터 원본에서 준비 테이블로 데이터를 복사하여 일치 정책을 실행할 때 인덱스를 다시 작성하려면 원본에서 데이터 다시 로드 를 클릭합니다.Click Reload data from source to copy data from the data source into the staging table and re-index it when you run the matching policy. 준비 테이블로 데이터를 복사하여 인덱스를 다시 작성하지 않고 일치 정책을 실행하려면 이전 데이터에 대해 실행 을 클릭합니다.Click Execute on previous data to run a matching policy without copying the data into the staging table and re-indexing the data. 일치 정책을 처음 실행하거나 페이지에서 매핑을 변경한 후 팝업에서 를 클릭한 경우에는 이전 데이터에 대해 실행 이 비활성화됩니다.Execute on previous data is disabled for the first run of the matching policy, or if you change mapping in the Map page, and then press Yes in the following popup. 두 경우 모두 인덱스를 다시 작성해야 합니다.In both of those cases, you must re-index. 일치 정책이 변경되지 않은 경우에는 인덱스를 다시 작성할 필요가 없습니다.It is not necessary to re-index if the matching policy has not changed. 이전 데이터에 대해 실행하면 성능이 향상됩니다.Executing on previous data can help performance.

  3. 시작 을 클릭하여 정의한 모든 규칙에 대해 일치 프로세스를 실행합니다.Click Start to run the matching process for all rules that you have defined. 일치 결과 테이블에 클러스터의 각 레코드에 대한 레코드 ID, 클러스터 번호 및 데이터 열(일치 규칙에 없는 데이터 열 포함)이 표시됩니다.The Matching Results table displays the record ID, cluster number, and data columns (including those not in the matching rule) for each record in a cluster. 클러스터의 선행 레코드는 임의로 선택됩니다.The leading record in the cluster is selected randomly. (일치 프로젝트를 실행할 때 내보내기 페이지에서 Survivorship 규칙을 선택하여 존속 레코드를 결정합니다.) 클러스터의 각 추가 행은 중복된 것으로 간주되며, 피벗 레코드와 비교된 해당 일치 점수가 결과 테이블에 제공됩니다.(You determine the surviving record by selected the survivorship rule on the Export page when you run the matching project.) Each additional row in a cluster is considered a duplicate; its matching score (compared to the pivot record) is provided in the results table.

  4. 일치 결과 테이블의 데이터를 사용하여 다음 작업을 수행할 수 있습니다.You can work with the data in the Matching Results table as follows:

    • 필터에서 일치함 을 선택하여 일치하는 모든 행과 해당 점수를 표시합니다.In Filter, select Matched to show all matched rows and their score. 일치하는 것으로 간주되지 않는 행(일치 점수가 최소 일치 점수보다 작은 행)은 일치 결과 테이블에 표시되지 않습니다.Rows that are not considered matches (that have a matching score less than the minimum matching score) are not shown in the matching results table. 일치하지 않음 을 선택하면 일치하는 행을 제외하고 일치하지 않는 모든 행이 표시됩니다.Select Unmatched to show all unmatched rows, not matched rows.

    • 백분율 드롭다운 상자의 드롭다운 목록에서 "5"씩 증가하는 백분율을 선택합니다.In the Percent Drop Down Box, select a percentage from the drop-down list, in increments of “5”. 일치 점수가 이 백분율보다 크거나 같은 모든 행이 일치 결과 테이블에 표시됩니다.All rows with a matching score that is greater than or equal to that percentage will be displayed in the matching results table.

    • 일치 결과 테이블의 레코드를 두 번 클릭하면 피벗 레코드와 원본 레코드(두 레코드의 모든 필드 값 포함), 두 레코드 간의 점수 및 레코드 일치 드릴다운이 표시된 일치 점수 정보 팝업이 나타납니다.If you double-click a record in the matching results table, DQS displays a Matching Score Details popup that displays the pivot record and source record (and the values in all their fields), the score between them, and a drill-down of the record matching. 드릴다운에는 피벗 레코드와 원본 레코드의 각 필드 값이 비교할 수 있도록 표시되고 각 필드가 두 레코드의 전체 일치 점수에 기여하는 일치 점수가 표시됩니다.The drill-down displays the values in each field of the pivot record and source record so you can compare them, and shows the matching score that each field contributes to the overall matching score for the two records.

  5. 프로파일러일치 결과 탭의 통계를 보고 원하는 결과를 얻었는지 확인합니다.View the statistics in the Profiler and Matching Results tabs to ensure that you are achieving the results that you need. 일치 규칙 탭을 클릭하여 각 규칙에 대한 도메인 설정을 확인합니다.Click the Matching Rules tab to see what the domain settings for each rule are. 자세한 내용은 Profiler and Results Tabs을 참조하세요.For more information, see Profiler and Results Tabs.

  6. 일부 규칙의 결과에 만족하지 않는 경우 뒤로 를 클릭하여 일치 정책 페이지로 이동한 후 필요에 따라 하나 이상의 규칙을 수정하고 일치 결과 페이지로 돌아가서 다시 시작을 클릭합니다.If you are not satisfied with the results of all rules, then click Back to return to the Matching Policy page, modify one or more rules as necessary, return to the Matching Results page, and then click Restart.

    참고

    분석이 완료되면 시작 단추가 다시 시작 단추로 바뀝니다.After the analysis has completed, the Start button turns into a Restart button. 그러나 이전 분석 결과가 아직 저장되지 않은 경우 다시 시작 을 클릭하면 이전 데이터가 손실됩니다.If the results from the previous analysis have not been saved as yet, clicking Restart will cause that previous data to be lost.

  7. 모든 규칙의 결과에 만족하는 경우 마침 을 클릭하여 일치 정책 프로세스를 완료한 후 다음 중 하나를 클릭합니다.If you are satisfied with the results of all rules, click Finish to complete the matching policy process, and then click one of the following:

    • 예 – 기술 자료를 게시하고 끝내기: 현재 사용자나 다른 사용자가 사용할 수 있도록 기술 자료가 게시됩니다.Yes – Publish the knowledge base and exit: The knowledge base will be published for the current user or others to use. 기술 자료가 잠기지 않고 기술 자료 테이블에서 기술 자료의 상태는 비어 있음으로 설정되며 도메인 관리 및 기술 자료 검색 작업을 둘 다 사용할 수 있습니다.The knowledge base will not be locked, the state of the knowledge base (in the knowledge base table) will be set to empty, and both the Domain Management and Knowledge Discovery activities will be available. 기술 자료 열기 화면으로 돌아갑니다.You will be returned to the Open Knowledge Base screen.

    • 아니요 – 기술 자료에 대한 작업 내용을 저장하고 끝내기: 작업 내용이 저장되고 기술 자료가 잠긴 상태로 유지되며 기술 자료의 상태는 작업 중으로 설정됩니다.No – Save the work on the knowledge base and exit: Your work will be saved, the knowledge base will remained locked, and the state of the knowledge base will be set to In work. 도메인 관리 및 기술 자료 검색 작업을 둘 다 사용할 수 있습니다.Both the Domain Management and Knowledge Discovery activities will be available. 홈 페이지로 돌아갑니다.You will be returned to the home page.

    • 취소 – 현재 화면에 머무르기: 팝업이 닫히고 도메인 관리 화면으로 돌아갑니다.Cancel – Stay on the current screen: The popup will be closed and you will be returned to the Domain Management screen.

  8. 닫기 를 클릭하여 작업 내용을 저장하고 DQS 홈 페이지로 돌아갑니다.Click Close to save your work, and return to the DQS home page. 기술 자료의 상태에 "일치 정책 - " 문자열과 현재 상태가 표시됩니다.The state of the knowledge base will show the string “Matching Policy – “, and the current state. 일치 결과 화면에서 닫기 를 클릭한 경우 상태에 "일치 정책 - 결과"가 표시됩니다.If you clicked Close while you are in the Matching Result screen, the state will show: "Matching Policy - Results". 일치 정책 화면에서 닫기를 클릭한 경우 상태에 "일치 정책 - 일치 정책"이 표시됩니다.If you clicked close while you are in the Matching Policy screen, the state will show: “Matching Policy - Matching Policy”. 닫기를 클릭한 후 기술 자료 검색 작업을 수행하려면 일치 정책 작업으로 돌아가서 마침을 클릭한 다음 를 클릭하여 기술 자료를 게시하거나 아니요 를 클릭하여 기술 자료에 대한 작업 내용을 저장하고 끝내야 합니다.After clicking Close, to perform the Knowledge Discovery activity, you would have to return to the Matching policy activity, click Finish, and then click either Yes to publish the knowledge base or No to save the work on the knowledge base and exit.

    참고

    클릭 하면 닫기 클릭 하면 일치 하는 프로세스 일치 하는 프로세스가 실행 되는 동안 종료 되지 것입니다 닫기합니다.If you click Close while a matching process is running, the matching process will not terminate when you click Close. 따라서 기술 자료를 다시 열고 프로세스가 계속 실행 중인지 또는 완료된 경우 결과가 표시되었는지 확인할 수 있습니다.You can reopen the knowledge base and see either that the process is still running, or if completed, that the results are displayed. 프로세스가 완료되지 않은 경우에는 화면에 진행률이 표시됩니다.If the process has not completed, the screen will display the progress.

  9. 취소 를 클릭하면 일치 정책 작업이 저장되지 않고 종료되며 DQS 홈 페이지로 돌아갑니다.Click Cancel to terminate the Matching Policy activity, losing your work, and return to the DQS home page.

후속 작업: 일치 정책을 만든 후Follow Up: After Creating a Matching Policy

일치 정책을 만든 후 해당 일치 정책이 포함된 기술 자료를 기반으로 일치 프로젝트를 실행할 수 있습니다.After you create a matching policy, you can run a matching project based upon the knowledge base that contains the matching policy. 자세한 내용은 일치 프로젝트 실행을 참조하세요.For more information, see Run a Matching Project.

Profiler and Results TabsProfiler and Results Tabs

프로파일러 및 결과 탭에는 일치 정책 페이지와 일치 결과 페이지 모두에 대한 통계가 포함됩니다.The Profiler and Results tab contain statistics for both the Matching Policy and the Matching Results pages.

프로파일러 탭Profiler Tab

프로파일러 탭을 클릭하면 원본 데이터베이스에 대한 통계와 정책 규칙에 포함된 각 필드에 대한 통계가 표시됩니다.Click the Profiler tab to display statistics for the source database and for each field included in the policy rule. 정책 규칙이 실행되면 통계가 업데이트됩니다.The statistics will be updated as the policy rule is run.

다음 통계를 해석하는 방법은 일치 규칙 매개 변수를 설정하는 방법을 참조하세요.For more information on how to interpret the following statistics, see How to Set Matching Rule Parameters.

원본 데이터베이스 통계에는 다음이 포함됩니다.The source database statistics include the following:

  • 레코드: 원본 데이터베이스에 있는 전체 레코드 수Records: The total number of records in the source database

  • 전체 값: 데이터 원본의 필드에 있는 전체 값 수Total Values: The total number of values in the fields of the data source

  • 새 값: 이전 실행 이후에 새로 생성된 전체 값 수와 값의 총 개수에 대한 해당 백분율New Values: The total number of values that are new since the previous run, and their percentage of the whole

  • 고유 값: 필드의 전체 고유 값 수와 값의 총 개수에 대한 해당 백분율Unique Values: The total number of unique values in the fields, and their percentage of the whole

  • 새로운 고유 값: 필드에 새로 생성된 전체 고유 값 수와 값의 총 개수에 대한 해당 백분율New Unique Values: The total number of unique values that are new in the fields, and their percentage of the whole

    필드 통계에는 다음이 포함됩니다.The field statistics include the following:

  • 필드 이름Field name

  • 도메인 이름Domain name

  • 새 항목: 도메인의 새 값 개수, 그리고 기존 값 대비 새 값의 비율New: The number of new values and the percent of new values compared to existing values in the domain

  • 고유: 필드의 고유 레코드 수와 해당 백분율Unique: The number of unique records in the field and their percentage of the total

  • 완결성: 일치 실행을 위해 매핑된 각 원본 필드의 완결성Completeness: The completeness of each source field that is mapped for the matching exercise

일치 정책 알림Matching Policy Notifications

일치 정책 작업의 경우 다음과 같은 상황에서 알림이 발생합니다.For the matching policy activity, the following conditions result in notifications:

  • 모든 레코드에 필드가 비어 있는 경우 - 해당 필드를 매핑에서 제거하는 것이 좋습니다.The field is empty in all records; it is recommended that you eliminate it from mapping.

  • 필드 완결성 점수가 매우 낮은 경우 - 해당 필드를 매핑에서 제거하는 것이 좋습니다.The field completeness score is very low; you may want to eliminate it from mapping.

  • 필드의 모든 값이 유효하지 않은 경우 - 필드 내용에 대한 도메인 규칙의 매핑과 관련성을 확인해야 합니다.All values in a field are invalid; you should verify the mapping and the relevancy of domain rules to the field contents.

  • 필드에 유효한 값이 적은 경우 - 필드 내용에 대한 도메인 규칙의 매핑과 관련성을 확인해야 합니다.There is a low level of valid values in the field; you should verify the mapping and the relevancy of domain rules to the field contents.

  • 이 필드의 고유성 수준이 높은 경우 -There is a high level of uniqueness in this field. 일치 정책에서 이 필드를 사용하면 일치 결과를 줄일 수 있습니다.Using this field in matching policy can decrease the matching results.

일치 결과 탭Matching Results Tab

일치 결과 탭을 클릭하면 일치 정책 규칙 실행 및 이전 규칙 실행에 대한 통계가 표시됩니다.Click the Matching Results tab to display statistics for the matching policy rule run, and the previous rule run. 같은 규칙을 서로 다른 설정으로 두 번 이상 실행한 경우에는 일치 결과 테이블에 두 실행 모두에 대한 통계가 표시되므로 이를 비교할 수 있습니다.If you have run the same rule more than once with different parameters, the matching results table will display statistics for both runs, enabling you to compare them. 필요한 경우 이전 규칙을 복원할 수도 있습니다.You can also restore the previous rule if you would like.

통계에는 다음이 포함됩니다.The statistics include the following:

  • 데이터베이스에 있는 전체 레코드 수The total number of records in the database

  • 데이터베이스에 있는 전체 일치 레코드 수The total number of matching records in the database

  • 중복된 것으로 간주되지 않는 데이터베이스의 레코드 수The number of records in the database that are not considered to be duplicates

  • 검색된 클러스터 수The number of clusters discovered

  • 평균 클러스터 크기(중복 레코드 수를 클러스터 수로 나눈 값)The average cluster size (number of duplicate records divided by number of clusters)

  • 클러스터의 최소 중복 레코드 수The fewest number of duplicates in a cluster

  • 클러스터의 최대 중복 레코드 수The greatest number of duplicates in a cluster