도메인 속성 설정Set Domain Properties

이 항목에서는 DQS( Data Quality ServicesData Quality Services )에서 도메인 속성을 설정하는 방법에 대해 설명합니다.This topic describes how to set domain properties in Data Quality ServicesData Quality Services (DQS).

시작하기 전에 Before You Begin

필수 구성 요소 Prerequisites

도메인의 속성을 설정하려면 기술 자료와 도메인을 만들어 두어야 합니다.To set properties for a domain, you must have created a knowledge base and a domain.

보안 Security

사용 권한 Permissions

도메인의 속성을 설정하려면 DQS_MAIN 데이터베이스에 대한 dqs_kb_editor 또는 dqs_administrator 역할이 있어야 합니다.You must have the dqs_kb_editor or the dqs_administrator role on the DQS_MAIN database to set properties on a domain.

도메인 속성 설정 Set Domain Properties

  1. 도메인 관리 작업에서 기술 자료를 연 후( Open a Knowledge Base참조) 도메인 목록에서 적절한 도메인을 선택하여 기존 도메인의 속성을 설정합니다.Set properties on an existing domain by opening a knowledge base in the Domain Management activity (see Open a Knowledge Base), and then selecting the appropriate domain in the Domain list. 기본적으로 도메인 속성 페이지가 표시됩니다.The Domain Properties page will be displayed by default.

  2. Create a Domain에 설명된 대로 새 도메인을 만든 후 속성을 설정합니다.Set properties on a new domain after creating it as described in Create a Domain.

  3. 마침 을 클릭하여 End the Domain Management Activity에 설명된 대로 도메인 관리 작업을 완료합니다.Click Finish to complete the domain management activity, as described in End the Domain Management Activity.

후속 작업: 도메인 속성 설정 후 Follow Up: After Setting Domain Properties

도메인 속성을 설정한 후 도메인에 대해 다른 도메인 관리 태스크를 수행하거나, 기술 자료 검색을 수행하여 도메인에 정보를 추가하거나, 도메인에 일치 정책을 추가할 수 있습니다.After you set domain properties, you can perform other domain management tasks on the domain, you can perform knowledge discovery to add knowledge to the domain, or you can add a matching policy to the domain. 자세한 내용은 기술 자료 검색 수행, 도메인 관리 또는 일치 정책 만들기를 참조하세요.For more information, see Perform Knowledge Discovery, Managing a Domain, or Create a Matching Policy.

도메인 속성 Domain Properties

도메인 이름 및 설명 Domain Name and Description

도메인이 생성된 후 도메인 이름 또는 설명을 변경할 수 있습니다.Once a domain has been created, the domain name or description can be changed. 도메인 이름은 기술 자료에 대해 고유해야 합니다.The domain name must be unique for the knowledge base. 설명은 최대 256자까지 지정할 수 있습니다.The description can be up to 256 characters.

데이터 형식 Data Type

도메인을 만들 때 도메인의 값에 대해 문자열 (기본값), 날짜, 정수또는 10진수데이터 형식 중 하나를 선택합니다.When you create the domain, select one of the following data types for the values in the domain: String (the default), Date, Integer, or Decimal. 도메인을 만든 후 데이터 형식을 볼 수 있지만 변경할 수는 없습니다.After you have created the domain, you can view the data type, but you cannot change it. 도메인에 대해 선택한 데이터 형식에 따라 도메인에 매핑할 수 있는 원본 데이터가 정의됩니다.The data type selected for a domain defines the type of source data that can be mapped to the domain. DQS에서 4개의 도메인 데이터 형식 각각에 대해 지원되는 데이터 형식에 대한 자세한 내용은 Supported SQL Server and SSIS Data Types for DQS Domains을 참조하십시오.For information about supported data types for each of the four domain data types in DQS, see Supported SQL Server and SSIS Data Types for DQS Domains.

선행 값 사용 Use Leading Values

동의어 값 대신 동의어 그룹의 선행 값이 출력되도록 지정하려면 이 확인란을 선택합니다.Select this checkbox to specify that the leading value in a group of synonyms will be output instead of a value that is a synonym to it. 각 동의어 값이 올바른 형식 또는 수정된 형식으로 출력되고 동의어 그룹의 선행 값으로 바뀌지 않도록 지정하려면 선행 값 사용 을 선택 취소합니다.Deselect Use Leading Values to specify that each synonym value is output in its correct or corrected form, and is not replaced by the leading value for its group.

문자열 정규화 Normalize String

데이터 형식이 문자열인 경우 클릭하여 DQS의 데이터 품질 처리를 위해 원본 데이터의 특수 문자를 무시합니다.If the data type is String, click to ignore the special characters in the source data for data-quality processing by DQS. DQS는 날짜가 도메인에 로드될 때 내부적으로 특수 문자를 null 또는 공백으로 바꿉니다.DQS internally replaces the special characters with a null or a space when the data is loaded into the domain. 콜론, 하이픈, 마침표, 큰따옴표 또는 세미콜론이 공백으로 바뀝니다.A colon, hyphen, period, double quote, or semicolon is replaced by a space. 작은따옴표는 null로 바뀝니다.A single quote is replaced by a null. null을 사용하면 문자열의 두 부분이 결합됩니다.Using the null brings the two parts of the string together.

문자열 값의 특수 문자를 무시하면 일치 정확도가 증가할 수 있습니다.Ignoring special characters in a string value can increase matching accuracy. 특수 문자를 null 또는 공백으로 바꾸면 두 문자열 간의 유사성 점수가 높아질 수 있습니다.The similarity score between two strings can be increased by replacing special characters with a null or a space. 문장 부호 또는 다른 기호는 여러 문자열에서 서로 다를 가능성이 높습니다.Punctuation marks or other symbols can easily be different in different strings. 내부적으로 특수 문자를 바꾸면 점수가 DQS의 최소 일치 임계값을 초과하여 이전에 일치한 적 없는 두 문자열이 일치 항목으로 간주될 수 있습니다.Replacing special characters internally can enable the score to surpass the minimum matching threshold in DQS, causing two strings to be deemed matches when they would not have been so otherwise. 그러나 일치 작업을 수행할 데이터 형식에 따라 특수 문자를 무시하도록 선택할지 여부를 결정해야 합니다.However, whether you choose to ignore special characters may depend upon the type of data that you are performing matching on. 예를 들어 영어로 된 측정 시스템의 데이터를 작업 중일 때 제품 데이터에서 큰따옴표가 인치를 의미하고, 작은따옴표가 피트를 의미할 경우 제품 데이터의 큰따옴표와 작은따옴표를 무시하면 거짓 긍정이 발생할 수 있습니다.For example, when you are working with data in the English System of measurement, ignoring double quotes and single quotes in product data may result in false positives if a double quote stands for an inch and a single quote stands for a foot.

검색, 일치 정책, 일치 프로젝트 및 정리 프로젝트 작업의 데이터 처리 단계에서 데이터가 로드되고 인덱싱될 때 정규화가 수행됩니다.Normalization is performed when data is loaded and indexed in the data processing stages of discovery, matching policy, matching project, and cleansing project activities. 설정된 경우 정규화와 용어 기반 관계 변환은 모두 분석 전 전처리 단계에서 완료됩니다.If enabled, normalization and term-based relations transformation are both done in a pre-processing stage before analysis. 문자열 간의 유사성을 계산하는 알고리즘이 적용되기 전에 각 도메인에 대해 실행됩니다.They are executed on each domain before any algorithms are applied that compute similarity between strings. 복합 도메인 구문 분석이 요청된 경우 구분 기호 구문 분석 시 기호가 필요하므로 이 작업이 정규화 및 용어 기반 관계 변환보다 먼저 수행됩니다.If composite domain parsing is requested, it will be performed before normalization and term-based relations transformation, because delimiter parsing requires symbols. 도메인 규칙 및 도메인 값 변경과 같은 다른 작업은 이러한 변환 후에 수행됩니다.Other operations, such as domain rules and domain value changes, will be performed after the transformations. 결과 데이터의 DQS 특수 문자는 내부적으로 바뀌지 않습니다.The resultant data is not changed by the internal replacement of special characters in DQS.

출력 형식 Format Output to

도메인의 데이터 값이 출력될 때 적용할 서식을 선택합니다.Select the formatting that will be applied when the data values in the domain are output. 서식은 다음 목록에 표시된 것처럼 선택한 데이터 형식에 따라 달라집니다.The formatting is specific to the data type selected, as shown in the following list. 없음 을 선택하면 목록의 아무런 서식도 적용되지 않습니다.Selecting None means none of the formats in the list will be applied.

  • 문자열 값의 경우 문자열이 대문자, 소문자로 출력되거나 앞 글자만 대문자로 출력되도록 지정할 수 있습니다.For a string value, you can specify that the string be output as upper case, lower case, or capitalized.

  • 날짜 값의 경우 년, 월, 일 형식으로 지정할 수 있습니다.For a date value, you can specify the format of the day, month, and year.

  • 정수 값의 경우 적용할 서식 마스크의 유형을 지정할 수 있습니다.For an integer value, you can specify the type of format mask to be applied.

  • 10진수 값의 경우 적용할 서식 마스크의 유형과 정확도를 지정할 수 있습니다.For a decimal value, you can specify the accuracy and the type of format mask to be applied.

언어 Language

데이터 형식이 문자열인 경우 맞춤법 검사기 작업에서 도메인과 연결할 언어를 선택합니다.If the data type is String, select which language you want to associate the domain with for operation of the speller. 이 선택 항목은 맞춤법 검사기에만 적용됩니다. 맞춤법 검사기 결과는 사용하는 언어에 따라 달라지기 때문입니다.This selection only applies for the speller, because speller results depend upon the language in use. 선택 항목은 데이터 형식이 문자열인 단일 도메인에만 적용됩니다.The selection only applies for a single domain with a data type is string. 언어 속성은 복합 도메인과는 관련이 없습니다.The language property is not relevant for composite domains. 복합 도메인에서 각 부분의 언어는 관련 단일 도메인에 의해 결정됩니다.The language for each part of a composite domain is determined by the relevant single domain.

기본 언어는 한국어(Korean)입니다.English is the default language. 언어 속성을 기타 로 설정하면 도메인에 대해 맞춤법 검사기가 해제됩니다.Setting the Language property to Other disables the Speller for the domain.

언어가 언어 드롭다운 목록에 나열되지 않는 경우 기타를 선택해야 합니다.If your language is not listed in the Language drop-down list, you must select Other. 이렇게 하면 DQS는 도메인에서 사용 가능한 정보(도메인 규칙, 도메인 값, TBR, 일치 규칙)를 기반으로 나열되지 않는 언어 데이터에 대한 중복을 정리하여 제거합니다.This ensures that DQS cleanses and eliminates duplicates for the non-listed language data based on the available knowledge (domain rules, domain values, TBRs, matching rule) in the domain.

맞춤법 검사기 설정 Enable Speller

데이터 형식이 문자열인 경우 도메인에 대해 DQS 맞춤법 검사기를 설정하려면 클릭합니다.If the data type is String, click to enable the DQS Speller for the domain. 맞춤법 검사기는 문자열 데이터 형식인 도메인에 대해서만 작동합니다.The Speller only works on domains with a data type of string. 맞춤법 검사기 사용 확인란은 확인란과 관련된 단일 도메인에 대해서만 맞춤법 검사기를 설정합니다.The Enable Speller check box enables the speller only for the single domain associated with the check box. 복합 도메인에는 이 확인란이 적용되지 않습니다.The check box does not apply to a composite domain.

맞춤법 검사기는 도메인 값에 대한 구문 및 유효성 검사 수정 사항을 제안합니다.The Speller proposes syntax and validation corrections to values in the domain. 자세한 내용은 Use the DQS Speller을 참조하세요.For more information, see Use the DQS Speller.

구문 오류 알고리즘 해제 Disable Syntax Error Algorithms

데이터 형식이 문자열인 경우 정리 작업 시 DQS에서 도메인의 구문 오류를 식별하지 않도록 지정하려면 선택합니다.If the data type is String, select to specify that syntax errors will not be identified by DQS in the domain during cleansing. 해당 도메인의 구문 오류 식별이 무의미한 경우 이 확인란을 선택합니다.Select this checkbox when identifying syntax errors for that domain is irrelevant. 예를 들어 일련 번호의 경우 구문 오류 식별이 중요하지 않을 수 있습니다.For example, identifying syntax errors may not matter for a serial number. 이 컨트롤은 문자열 데이터 형식에만 사용할 수 있습니다.This control is only available for the string data type. DQS는 문자열이 아닌 데이터 형식에서 구문 오류를 검사하지 않습니다.DQS will not check non-string data types for syntax errors.