Data Quality Services 개념Data Quality Services Concepts

이 항목에서는 기술 자료 관리, 데이터 품질 프로젝트 및 데이터 품질 관리의 DQS( Data Quality ServicesData Quality Services ) 개념을 간단히 요약합니다.This topic provides a brief summary of Data Quality ServicesData Quality Services (DQS) concepts in knowledge management, data quality projects, and data quality administration.

기술 자료 관리 개념Knowledge Management Concepts

DQS 기술 자료는 데이터 관리자나 IT 전문가가 데이터 정리 및 데이터 일치를 통해 데이터 품질 향상을 위해 만든 메타데이터의 리포지토리입니다.The DQS knowledge base is a repository of metadata that is created by the data steward or IT pro for use in improving data quality through data cleansing and data matching. DQS 기술 자료 관리에는 컴퓨터 기반은 물론 대화형으로도 기술 자료를 만들고 관리하는 데 사용되는 프로세스가 포함됩니다.DQS knowledge management includes the processes used to create and manage the knowledge base, both in a computer-assisted manner and interactively.

기술 자료 검색Knowledge Discovery

기술 자료 검색은 조직의 데이터 샘플을 분석하여 데이터에 대한 기술 자료를 구축하는 프로세스입니다.Knowledge discovery is a computer-assisted process that analyzes samples of your organization’s data to build knowledge about the data. 분석 결과가 나오면 기술 자료의 유효성을 검사하고 개선한 후 데이터 정리, 일치 및 프로파일링을 수행하는 데 적용할 수 있습니다.Once you have the results of the analysis, you can validate and enhance the knowledge, and then apply it to perform data cleansing, matching, and profiling. 자세한 내용은 DQS Knowledge Bases and Domains을 참조하세요.For more information, see DQS Knowledge Bases and Domains.

도메인 관리Domain Management

도메인 관리 프로세스에서는 기술 자료 검색 프로세스에서 생성된 기술 자료를 변경하거나 보강할 수 있습니다.The domain management process enables you to change or augment the knowledge that has been generated by the knowledge discovery process. 기술 자료를 대화형으로 편집, 업데이트 및 검토할 수 있습니다.You can interactively edit, update, and review the knowledge in a knowledge base. 기술 자료는 도메인 값과 해당 상태, 도메인 규칙, 용어 기반 관계 및 참조 데이터가 포함된 데이터 도메인으로 구성됩니다.A knowledge base consists of data domains that contain domain values and their status, domain rules, term-based relations, and reference data. 도메인 관리에서 도메인 속성을 변경하고, 참조 데이터를 도메인에 연결하고, 도메인 규칙을 관리하고, 도메인 값을 관리하며 데이터 관계를 입력하고, 도메인을 만들거나 삭제하거나 가져오거나 내보낼 수 있습니다.In domain management, you can change domain properties, attach reference data to a domain, manage domain rules, manage domain values and enter data relations, and create, delete, import, or export domains. 둘 이상의 단일 도메인을 집계하는 복합 도메인을 사용할 수도 있습니다.You can also use composite domains that aggregate more than one single domain. 자세한 내용은 DQS Knowledge Bases and Domains을 참조하세요.For more information, see DQS Knowledge Bases and Domains.

일치 정책Matching Policy

일치 정책에는 데이터 중복 제거를 수행하는 데 사용되는 일치 규칙이 포함됩니다.A matching policy contains the matching rules used to perform data deduplication. 일치 정책 프로세스에서는 일치 규칙을 만들고, 일치 결과와 프로파일링 데이터를 기반으로 이 결과를 미세 조정하며, 정책을 기술 자료에 추가할 수 있습니다.The matching policy process enables you to create matching rules, fine-tune them based upon matching results and profiling data, and to add the policy to the knowledge base. 자세한 내용은 데이터 일치을 참조하세요.For more information, see Data Matching.

참조 데이터 서비스Reference Data Services

참조 데이터를 사용하면 참조 데이터 품질을 보장하는 회사의 서비스를 이용하여 데이터의 유효성을 검사하고 데이터를 수정 및 보강할 수 있습니다.You can use reference data to validate, correct, and enrich your data, leveraging the services of companies who guarantee the quality of their reference data. Windows Azure Marketplace의 서비스를 사용하여 참조 데이터 공급자에 연결하거나 공급자에 대한 직접 연결을 사용할 수 있습니다.You can use the services of Windows Azure Marketplace to connect to reference data providers, or you can use a direct connection to a provider. 자세한 내용은 Reference Data Services in DQS을 참조하세요.For more information, see Reference Data Services in DQS.

DQS의 기술 자료 관리에 대한 자세한 내용은 DQS Knowledge Bases and Domains을 참조하세요.For more information about knowledge management in DQS, see DQS Knowledge Bases and Domains.

데이터 품질 프로젝트 개념Data Quality Project Concepts

데이터 관리자는 Data Quality 클라이언트Data Quality Client 응용 프로그램에서 데이터 품질 프로젝트를 사용하여 데이터 품질 작업(정리 및 일치)을 수행합니다.The data steward performs data-quality operations (cleansing and matching) using a data quality project in the Data Quality 클라이언트Data Quality Client application.

데이터 정리Data Cleansing

DQS의 데이터 정리 작업은 DQS 기술 자료의 지식을 기반으로 수행됩니다.Data cleansing in DQS is done based on the knowledge in a DQS knowledge base. DQS의 데이터 정리 작업은 2단계 프로세스입니다.Data cleansing in DQS is a two-step process:

  • 컴퓨터 기반 정리: DQS에서는 정리 프로젝트에 대해 선택된 기술 자료의 지식을 사용하여 데이터 원본에 있는 값에 대한 수정/제안 사항을 제공합니다.Computer-assisted cleansing: DQS uses the knowledge in the selected knowledge base for the cleansing project to propose corrections/suggestions to the values in a data source.

  • 대화형 정리: 데이터 관리자는 대화형 정리 프로세스를 수행하여 컴퓨터 기반 데이터 정리 프로세스에서 제안한 데이터 수정 사항을 변경하거나 보강할 수 있습니다.Interactive Cleansing: The data steward can perform the interactive cleansing process to change or augment data corrections that have been proposed by the computer-assisted data cleansing process. 데이터 관리자는 데이터 정리 프로세스에서 식별된 신뢰 수준과 통계를 사용하거나 변경 사항을 프로젝트에 수동으로 입력하여 이 작업을 수행합니다.The data steward does so by using confidence levels and statistics identified by the data cleansing process, or by manually entering their own changes in the project.

    데이터 관리자는 데이터를 정리한 후 처리된 데이터를 SQL Server 데이터베이스, .csv 파일 또는 Excel 파일로 내보낼 수 있습니다.After cleansing data, the data steward can export the processed data to a SQL Server database, .csv, or an Excel file. 자세한 내용은 Data Cleansing을 참조하세요.For more information, see Data Cleansing.

    데이터 일치Data Matching

    일치 프로세스에서는 데이터 관리자가 데이터를 비교하여 중복 제거 프로세스를 통해 비슷하지만 약간 다른 데이터를 정렬할 수 있습니다.The matching process enables the data steward to compare data so that similar, but slightly different, data can be aligned through a deduplication process. DQS에서는 기술 자료에 포함된 일치 규칙을 기반으로 중복 제거를 수행합니다. 데이터 관리자는 데이터 품질 프로젝트 내에서 일치 프로세스에 대한 매개 변수를 지정합니다.DQS performs deduplication based on matching rules contained in the knowledge base; the data steward specifies parameters for the matching process from within a data quality project. 자세한 내용은 데이터 일치을 참조하세요.For more information, see Data Matching.

    프로파일링 및 알림Profiling and Notifications

    데이터 관리자는 데이터 프로파일링을 통해 DQS에 의해 처리되는 데이터에 대한 실시간 통계 및 정보를 얻어 데이터 품질 프로젝트를 실행하는 동안 정리 또는 일치 작업을 수행할 수 있습니다.Data profiling provides data stewards real-time statistics and information about the data that is being processed by DQS for the cleansing or matching activities while running a data quality project. 데이터 프로파일링을 활용하면 데이터 품질 프로젝트에서 정리 및 일치 작업의 효과를 평가하는 데 도움이 되며, 알림을 활용하면 사용자가 데이터 정리 및 데이터 일치 작업을 개선하기 위해 취할 수 있는 조치에 도움이 됩니다.Data profiling helps you assess the effectiveness of the cleansing and matching activities in a data quality project, and notifications help the user with actions that can be taken to enhance the data cleansing and data matching activities. 자세한 내용은 Data Profiling and Notifications in DQS을 참조하세요.For more information, see Data Profiling and Notifications in DQS.

    DQS의 데이터 품질 프로젝트에 대한 자세한 내용은 데이터 품질 프로젝트(DQS)를 참조하세요.For more information about data quality projects in DQS, see Data Quality Projects (DQS).

데이터 품질 관리 개념Data Quality Administration Concepts

DQS 관리자는 Data Quality 클라이언트Data Quality Client 응용 프로그램을 사용하여 다양한 관리 태스크를 수행할 수 있습니다.A DQS administrator can perform variety of administrative tasks using the Data Quality 클라이언트Data Quality Client application.

작업 모니터링Activity Monitoring

작업 모니터링은 데이터 범위 내에서 수행한 각 작업의 상태를 표시하고, 각 작업의 데이터를 제공하며, DQS 관리자가 작업을 제어할 수 있도록 합니다.Activity monitoring displays the status and state of each activity performed within a data range, provides data for each activity, and enables DQS administrators to control an activity. 자세한 내용은 Monitor DQS Activities을 참조하세요.For more information, see Monitor DQS Activities.

ConfigurationConfiguration

구성 옵션을 사용하면 다음 작업을 수행할 수 있습니다.The Configuration option enables you to:

  • 참조 데이터 서비스 설정 구성.Configure reference data service settings. 자세한 내용은 Configure DQS to Use Reference Data을 참조하세요.For more information, see Configure DQS to Use Reference Data.

  • 정리 및 일치 작업에 대한 임계값 설정.Set the threshold values for the cleansing and matching activities. 자세한 내용은 정리 및 일치에 대한 임계값 구성을 참조하세요.For more information, see Configure Threshold Values for Cleansing and Matching.

  • 프로파일링 알림 설정/해제.Enable/disable profiling notifications. 자세한 내용은 DQS에서 프로파일링 알림 설정 또는 해제를 참조하세요.For more information, see Enable or Disable Profiling Notifications in DQS.

  • 작업 기반 수준이나 고급 모듈 기반 수준에서 DQS 로그 파일에 대한 심각도 수준 구성.Configure severity levels for the DQS log files at the activity-based level or the more advanced module-based level. 자세한 내용은 Configure Severity Levels for DQS Log Files을 참조하세요.For more information, see Configure Severity Levels for DQS Log Files.

    DQS 보안DQS Security

    SQL Server 보안 메커니즘 내의 역할을 사용하여 DQS 보안을 설정할 수 있습니다.You use roles within the SQL Server security mechanism to make DQS secure. Data Quality 클라이언트Data Quality Client 응용 프로그램에서 사용자의 액세스 수준은 dqs_administrator, dqs_kb_editor 및 dqs_kb_operator라는 세 가지 DQS 역할에 의해 결정됩니다.There are three DQS roles that determine the access level for a user in the Data Quality 클라이언트Data Quality Client application: dqs_administrator, dqs_kb_editor, and dqs_kb_operator. Data Quality 클라이언트Data Quality Client 응용 프로그램을 사용하여 사용자에게 역할을 부여할 수는 없습니다. 이 작업은 SQL Server Management Studio를 사용하여 수행됩니다.You cannot grant roles to the users using the Data Quality 클라이언트Data Quality Client application; it is done using SQL Server Management Studio. 자세한 내용은 DQS Security을 참조하세요.For more information, see DQS Security.

    DQS 관리에 대한 자세한 내용은 DQS Administration를 참조하세요.For more information about DQS administration, see DQS Administration.

관련 항목:See Also

Data Quality ServicesData Quality Services