데이터 품질 프로젝트(DQS)Data Quality Projects (DQS)

DQS( Data Quality ServicesData Quality Services )의 데이터 품질 프로젝트는 기술 자료를 사용하여 데이터 정리데이터 일치 작업을 수행한 다음 결과 데이터를 SQL Server 데이터베이스 또는 .csv 파일로 내보내 원본 데이터의 품질을 향상시킬 수 있는 수단입니다.A data quality project in Data Quality ServicesData Quality Services (DQS) is a means of using a knowledge base to improve the quality of your source data by performing data cleansing and data matching activities, and then exporting the resultant data to a SQL Server database or a .csv file. 데이터 품질 프로젝트를 정리 프로젝트 또는 일치 프로젝트로 만들어 각 작업을 수행할 수 있습니다.You can create a data quality project as a cleansing project or a matching project to perform respective activities. 데이터 정리 및 일치에 대한 정보는 같은 기술 자료에 기본 제공될 수 있으므로 같은 기술 자료를 사용하여 정리 및 일치 프로젝트를 실행할 수 있습니다.Cleansing and matching projects can be run using the same knowledge base, because knowledge for data cleansing and matching can be built into the same knowledge base.

데이터 품질 프로젝트에는 다음과 같은 이점이 있습니다.A data quality project has the following benefits:

  • DQS 기술 자료의 정보를 사용하여 원본 데이터에 대해 데이터 정리를 수행할 수 있습니다.Enables you to perform data cleansing on your source data by using the knowledge in a DQS knowledge base.

  • 기술 자료의 일치 정책을 사용하여 원본 데이터에 대해 데이터 일치를 수행할 수 있습니다.Enables you to perform data matching on your source data by using the matching policy in a knowledge base.

  • 정리 및 일치 작업을 안내하고 선택 항목에 따라 SQL Server 데이터베이스 또는 .csv 파일로 데이터를 내보내는 마법사를 제공합니다.Provides a wizard to guide you through the cleansing and matching activities, and export the data as per your selection to a SQL Server database or to a .csv file. 데이터 관리자는 데이터 품질 프로젝트를 사용하여 컴퓨터 기반/대화형 정리 및 데이터 일치 단계를 실행하고 제어할 수 있습니다.The data steward can use the data quality project to run and control the computer-assisted/interactive cleansing and data matching steps.

데이터 품질 프로젝트: 정리 작업Data Quality Project: Cleansing Activity

정리 데이터 품질 프로젝트를 사용하여 기술 자료에 따라 원본 데이터를 정리할 수 있습니다.A cleansing data quality project enables you to cleanse your source data based on a knowledge base. DQS의 데이터 정리 작업은 2단계 프로세스입니다.The data cleansing activity in DQS is a two-step process:

  1. 컴퓨터 기반 데이터 정리 프로세스는 기술 자료의 정보에 대해 원본 데이터를 분석하고 변경 내용을 제안합니다.A computer-assisted data cleansing process that analyzes source data against the knowledge in the knowledge base, and proposes changes. 처리된 데이터는 DQS에 의해 분류(제안, 새로 만들기, 잘못됨, 수정됨 및 올바름)되어 추가로 처리할 수 있도록 사용자에게 표시됩니다.The processed data is categorized (suggested, new, invalid, corrected, and correct) by DQS, and displayed to the user for further processing.

  2. 대화형 정리 프로세스에서는 데이터 관리자가 컴퓨터 기반 데이터 정리 프로세스에서 제안된 데이터를 승인, 거부 또는 수정할 수 있습니다.An interactive cleansing process that enables the data steward to approve, reject, or modify the data proposed by the computer-assisted data cleansing process.

    데이터 품질 프로젝트의 정리 작업에 대한 자세한 내용은 Data Cleansing를 참조하세요.For detailed information about the cleansing activity in a data quality project, see Data Cleansing.

데이터 품질 프로젝트: 일치 작업Data Quality Project: Matching Activity

일치 데이터 품질 프로젝트를 사용하면 정확한 수치 및 근사치 일치를 확인하고 이를 통해 중복 데이터를 제거하는 방식으로 기술 자료의 일치 정책에 따라 일치 작업을 수행하여 데이터 중복을 방지할 수 있습니다.A matching data quality project enables you to perform matching activity based on matching policy in a knowledge base to prevent data duplication by identifying exact and approximate matches, and thereby enabling you to remove duplicate data. 따라서 일치를 실행하기 전에 데이터를 정리하는 것이 좋습니다.It is recommended that you cleanse your data before running matching on it. 이렇게 하려면To do so:

  1. 데이터 품질 프로젝트를 만들고 정리 작업을 선택한 다음 원본 데이터에 대해 데이터 정리 작업을 완료하고 SQL Server 데이터베이스의 테이블로 데이터를 내보냅니다.Create a data quality project, select the Cleansing activity, complete the data cleansing activity on your source data, and then export it to a table in a SQL Server database.

  2. 일치 정책이 포함된 기술 자료를 사용하여 다른 데이터 품질 프로젝트를 만들고 일치 작업을 선택한 다음 페이지에서 1단계 중에 정리한 데이터를 내보낸 데이터베이스 및 테이블을 선택합니다.Create another data quality project by using a knowledge base that contains a matching policy, select the Matching activity, and then in the Map page, select the database and the table where you exported the cleansed data in step 1.

  3. 정리한 데이터에 대해 일치 작업을 완료합니다.Complete the matching activity on the cleansed data.

    데이터 품질 프로젝트의 일치 작업에 대한 자세한 내용은 Data Matching를 참조하세요.For detailed information about the matching activity in a data quality project, see Data Matching.

데이터 프로파일링 및 알림Data Profiling and Notifications

데이터 품질 프로젝트에서 정리 및 일치 작업을 실행하는 동안 DQS에 의해 처리되는 데이터의 실시간 통계 및 정보를 확인할 수 있습니다.While running the cleansing and matching activities in a data quality project, you can see real-time statistics and information about the data that is being processed by DQS. 데이터 프로파일링을 통해 정리 및 일치 프로세스의 효과를 평가하고 잠재적으로 데이터 정리 또는 일치로 데이터 품질이 개선된 정도를 확인할 수 있습니다.Data profiling helps you assess the effectiveness of the cleansing and matching processes, and you can potentially determine the extent to which data cleansing or matching helped improve the data quality. DQS 프로파일링에서는 완결성 (데이터가 존재하는 정도)과 정확도 (데이터를 의도된 용도에 맞게 사용할 수 있는 정도)의 두 가지 데이터 품질 차원을 제공합니다.DQS profiling provides two data-quality dimensions: completeness (the extent to which data is present) and accuracy (the extent to which data can be used for its intended use). 또한 데이터 프로파일링 정보를 기반으로 데이터 정리 및 데이터 일치 작업을 향상시키기 위해 수행할 수 있는 작업에 대한 알림이 표시됩니다.Further, based on the data profiling information, notifications are displayed to the user on the actions that can be taken to enhance the data cleansing and data matching operations. 데이터 프로파일링 및 알림에 대한 자세한 내용은 Data Profiling and Notifications in DQS을 참조하세요.For detailed information about data profiling and notifications, see Data Profiling and Notifications in DQS.

태스크 설명Task Description 항목Topic
데이터 품질 프로젝트를 만드는 방법에 대해 설명합니다.Describes how to create a data quality project. 데이터 품질 프로젝트 만들기Create a Data Quality Project
데이터 품질 프로젝트를 열기, 잠금 해제, 이름 바꾸기 및 삭제하는 방법에 대해 설명합니다.Describes how to open, unlock, rename, and delete a data quality project. 데이터 품질 프로젝트 열기, 잠금 해제, 이름 바꾸기 및 삭제Open, Unlock, Rename, and Delete a Data Quality Project
Data Quality 클라이언트Data Quality Client에서 Integration Services 프로젝트를 여는 방법에 대해 설명합니다.Describes how to open an Integration Services project in Data Quality 클라이언트Data Quality Client. Data Quality Client에서 Integration Services 프로젝트 열기Open Integration Services Projects in Data Quality Client

관련 항목:See Also

DQS 기술 자료 및 도메인DQS Knowledge Bases and Domains