DQS 정리 변환DQS Cleansing Transformation

DQS 정리 변환은 DQS(Data Quality Services)를 통해, 데이터 원본 또는 유사한 데이터 원본에 대해 만든 승인된 규칙을 적용하여 연결된 데이터 원본에서 데이터를 수정합니다.The DQS Cleansing transformation uses Data Quality Services (DQS) to correct data from a connected data source, by applying approved rules that were created for the connected data source or a similar data source. 데이터 수정 규칙에 대한 자세한 내용은 DQS Knowledge Bases and Domains을 참조하십시오.For more information about data correction rules, see DQS Knowledge Bases and Domains. DQS에 대한 자세한 내용은 Data Quality Services Concepts을 참조하십시오.For more information DQS, see Data Quality Services Concepts.

데이터를 수정해야 할지 여부를 확인하기 위해 DQS 정리 변환은 다음과 같은 조건이 충족되는 경우 입력 열의 데이터를 처리합니다.To determine whether the data has to be corrected, the DQS Cleansing transformation processes data from an input column when the following conditions are true:

  • 데이터 수정을 위해 열이 선택됩니다.The column is selected for data correction.

  • 열 데이터 형식에 데이터 수정이 지원됩니다.The column data type is supported for data correction.

  • 열은 호환 가능한 데이터 형식의 도메인에 매핑됩니다.The column is mapped a domain that has a compatible data type.

    변환에는 행 수준 오류를 처리하기 위해 구성할 수 있는 오류 출력이 포함됩니다.The transformation also includes an error output that you configure to handle row-level errors. 오류 출력을 구성하려면 DQS 정리 변환 편집기를 사용합니다.To configure the error output, use the DQS Cleansing Transformation Editor.

    데이터 흐름에 Fuzzy Grouping Transformation 을 포함하여 중복된 것으로 간주되는 데이터 행을 식별할 수 있습니다.You can include the Fuzzy Grouping Transformation in the data flow to identify rows of data that are likely to be duplicates.

데이터 품질 프로젝트 및 값Data Quality Projects and Values

DQS 정리 변환으로 데이터를 처리하면 Data Quality 서버에 정리 프로젝트가 생성됩니다.When you process data with the DQS Cleansing transformation, a cleansing project is created on the Data Quality Server. Data Quality 클라이언트를 사용하여 프로젝트를 관리합니다.You use the Data Quality Client to manage the project. 또한 Data Quality 클라이언트를 사용하여 프로젝트 값을 DQS 기술 자료 도메인으로 가져올 수 있습니다.In addition, you can use the Data Quality Client to import the project values into a DQS knowledge base domain. 값만 도메인(또는 연결된 도메인)으로 가져올 수 있으며, DQS 정리 변환은 해당 도메인을 사용하도록 구성되었습니다.You can import the values only to a domain (or linked domain) that the DQS Cleansing transformation was configured to use.

DQS 정리 변환 편집기 대화 상자DQS Cleansing Transformation Editor Dialog Box

DQS 정리 변환 편집기 대화 상자를 통해 DQS(Data Quality Services)를 사용하여 데이터를 수정할 수 있습니다.Use the DQS Cleansing Transformation Editor dialog box to correct data using Data Quality Services (DQS). 자세한 내용은 Data Quality Services Concepts을(를) 참조하세요.For more information, see Data Quality Services Concepts.

수행 작업What do you want to do?

DQS 정리 변환 편집기 열기 Open the DQS Cleansing Transformation Editor

  1. Integration ServicesIntegration Services 에서 SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT)패키지에 DQS 정리 변환을 추가합니다.Add the DQS Cleansing Transformation to Integration ServicesIntegration Services package, in SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT).

  2. 구성 요소를 마우스 오른쪽 단추로 클릭한 다음 편집을 클릭합니다.Right-click the component and then click Edit.

연결 관리자 탭에서 옵션 설정 Set options on the Connection Manager tab

데이터 품질 연결 관리자Data quality connection manager
목록에서 기존 DQS 연결 관리자를 선택하거나 새로 만들기를 클릭하여 새 연결을 만듭니다.Select an existing DQS connection manager from the list, or create a new connection by clicking New.

새로 만들기New
DQS 정리 연결 관리자 대화 상자를 사용하여 새 연결 관리자를 만듭니다.Create a new connection manager by using the DQS Cleansing Connection Manager dialog box. DQS 정리 연결 관리자 대화 상자에서 옵션 설정을 참조하세요.See Set the options in the DQS Cleansing Connection Manager dialog box

데이터 품질 기술 자료Data Quality Knowledge Base
연결된 데이터 원본에 대한 기존 DQS 기술 자료를 선택합니다.Select an existing DQS knowledge base for the connected data source. DQS 기술 자료에 대한 자세한 내용은 DQS Knowledge Bases and Domains을 참조하십시오.For more information about the DQS knowledge base, see DQS Knowledge Bases and Domains.

연결 암호화Encrypt connection
DQS 서버와 Integration ServicesIntegration Services간 데이터 전송을 암호화하기 위해 연결을 암호화할지 여부를 지정합니다.Specifiy whether to encrypt the connection, in order to encrypt the data transfer between the DQS Server and Integration ServicesIntegration Services.

사용 가능한 도메인Available domains
선택한 기술 자료에 사용 가능한 도메인을 나열합니다.Lists the available domains for the selected knowledge base. 단일 도메인과 둘 이상의 단일 도메인을 포함하는 복합 도메인의 두 가지 도메인 유형이 있습니다.There are two types of domains: single domains, and composite domains that contain two or more single domains.

복합 도메인에 열을 매핑하는 방법은 Map Columns to Composite Domains을 참조하십시오.For information on how to map columns to composite domains, see Map Columns to Composite Domains.

도메인에 대한 자세한 내용은 DQS Knowledge Bases and Domains을 참조하십시오.For more information about domains, see DQS Knowledge Bases and Domains.

오류 출력 구성Configure Error Output
행 수준 오류 처리 방법을 지정합니다.Specify how to handle row-level errors. 변환에서 연결된 데이터 원본의 데이터를 수정할 때 예기치 않은 데이터 값 또는 유효성 검사 제약 조건으로 인해 오류가 발생할 수 있습니다.Errors can occur when the transformation corrects data from the connected data source, due to unexpected data values or validation constraints.

유효한 값은 다음과 같습니다.The following are the valid values:

  • 구성 요소 실패- 변환에 실패하여 Data Quality Services 데이터베이스에 입력 데이터가 삽입되지 않았음을 나타냅니다.Fail Component, which indicates that the transformation fails and the input data is not inserted into the Data Quality Services database. 이 값은 기본값입니다.This is the default value.

  • 행 리디렉션- 입력 데이터가 Data Quality Services 데이터베이스에 삽입되지 않고 오류 출력으로 리디렉션되었음을 나타냅니다.Redirect Row, which indicates that the input data is not inserted into the Data Quality Services database and is redirected to the error output.

매핑 탭에서 옵션 설정 Set options on the Mapping tab

복합 도메인에 열을 매핑하는 방법은 Map Columns to Composite Domains을 참조하십시오.For information on how to map columns to composite domains, see Map Columns to Composite Domains.

사용 가능한 입력 열Available Input Columns
연결된 데이터 원본의 열을 나열합니다.Lists the columns from the connected data source. 수정할 데이터가 들어 있는 하나 이상의 열을 선택합니다.Select one or more columns that contain data that you want to correct.

입력 열Input Column
사용 가능한 입력 열 영역에서 선택한 입력 열을 나열합니다.Lists an input column that you selected in the Available Input Columns area.

도메인Domain
입력 열에 매핑할 도메인을 선택합니다.Select a domain to map to the input column.

원본 별칭Source Alias
원래 열 값이 들어 있는 원본 열을 나열합니다.Lists the source column that contains the original column value.

열 이름을 수정할 필드를 클릭합니다.Click in the field to modify the column name.

출력 별칭Output Alias
DQS 정리 변환을 통해 출력될 열을 나열합니다.Lists the column that is outputted by the DQS Cleansing Transformation. 원래 열 값 또는 수정된 값이 들어 있는 열입니다.The column contains the original column value or the corrected value.

열 이름을 수정할 필드를 클릭합니다.Click in the field to modify the column name.

상태 별칭Status Alias
수정된 데이터에 대한 상태 정보가 들어 있는 열을 나열합니다.Lists the column that contains status information for the corrected data. 열 이름을 수정할 필드를 클릭합니다.Click in the field to modify the column name.

고급 탭에서 옵션 설정 Set options on the Advanced tab

출력 표준화Standardize output
도메인에 대해 정의된 출력 형식을 기반으로 표준화된 형식으로 데이터를 출력할지 여부를 나타냅니다.Indicate whether to output the data in the standardized format based on the output format defined for domains. 표준화된 형식에 대한 자세한 내용은 데이터 정리를 참조하세요.For more information about standardized format, see Data Cleansing.

신뢰도Confidence
수정된 데이터에 대한 신뢰 수준을 포함할지 여부를 나타냅니다.Indicate whether to include the confidence level for corrected data. 신뢰 수준은 수정 내용 또는 제안 내용에 대한 DQS의 확신도를 나타냅니다.The confidence level indicates the extend of certainty of DQS for the correction or suggestion. 신뢰 수준에 대한 자세한 내용은 데이터 정리를 참조하세요.For more information about confidence levels, see Data Cleansing.

원인Reason
데이터 수정 이유를 포함할지 여부를 나타냅니다.Indicate whether to include the reason for the data correction.

추가된 데이터Appended Data
기존 참조 데이터 공급자에서 받은 추가 데이터를 출력할지 여부를 나타냅니다.Indicate whether to output additional data that is received from an existing reference data provider. 자세한 내용은 Reference Data Services in DQS을(를) 참조하세요.For more information, see Reference Data Services in DQS.

추가된 데이터 스키마Appended Data Schema
데이터 스키마를 출력할지 여부를 나타냅니다.Indicate whether to output the data schema. 자세한 내용은 참조 데이터에 도메인 또는 복합 도메인 연결을 참조하세요.For more information, see Attach Domain or Composite Domain to Reference Data.

DQS 정리 연결 관리자 대화 상자에서 옵션 설정 Set the options in the DQS Cleansing Connection Manager dialog box

서버 이름Server name
연결할 DQS 서버의 이름을 선택하거나 입력합니다.Select or type the name of the DQS server that you want to connect to. 서버에 대한 자세한 내용은 DQS Administration를 참조하십시오.For more information about the server, see DQS Administration.

연결 테스트Test Connection
지정한 연결이 표시되는지 확인하려면 클릭합니다.Click to confirm that the connection that you specified is viable.

다음을 수행하여 연결 영역에서 DQS 정리 연결 관리자 대화 상자를 열 수도 있습니다.You can also open the DQS Cleansing Connection Manager dialog box from the connections area, by doing the following:

  1. SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT)에서 기존 Integration ServicesIntegration Services 프로젝트를 열거나 새 프로젝트를 만듭니다.In SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT), open an existing Integration ServicesIntegration Services project or create a new one.

  2. 연결 영역을 마우스 오른쪽 단추로 클릭하고 새 연결을 클릭한 다음 DQS를 클릭합니다.Right-click in the connections area, click New Connection, and then click DQS.

  3. 추가를 클릭합니다.Click Add.