복합 도메인의 데이터 정리

적용 대상:SQL Server

이 항목에서는 DQS(Data Quality Services)에서 복합 도메인을 정리하는 방법에 대한 정보를 제공합니다. 복합 도메인은 둘 이상의 단일 도메인으로 구성되며 여러 관련 용어로 구성된 데이터 필드에 매핑됩니다. 복합 도메인의 개별 도메인은 서로 공통된 정보 영역이 있어야 합니다. 복합 도메인에 대한 자세한 내용은 복합 도메인 관리를 참조 하세요.

복합 도메인을 원본 데이터에 매핑

원본 데이터와 복합 도메인을 매핑하는 방법에는 두 가지가 있습니다.

  • 원본 데이터는 복합 도메인에 매핑되는 단일 필드(전체 이름이라고 가정)입니다.

    • 복합 도메인이 참조 데이터 서비스에 매핑되는 경우 원본 데이터는 수정 및 구문 분석을 위해 참조 데이터 서비스에 있는 그대로 전송됩니다.

    • 복합 도메인이 참조 데이터 서비스에 매핑되지 않은 경우에는 복합 도메인에 대해 정의된 구문 분석 방법에 따라 구문 분석됩니다. 복합 도메인의 구문 분석 방법을 지정하는 방법은 Create a Composite Domain를 참조하세요.

  • 원본 데이터는 복합 도메인 내 개별 도메인에 매핑되는 여러 필드(예: First Name, Middle Name 및 Last Name)로 구성됩니다.

복합 도메인을 원본 데이터에 매핑하는 방법의 예는 참조 데이터에 도메인 또는 복합 도메인 연결을 참조하세요.

선언적 도메인 간 규칙을 사용하여 데이터 수정

복합 도메인의 도메인 간 규칙을 사용하면 복합 도메인의 개별 도메인 간 관계를 나타내는 규칙을 만들 수 있습니다. 도메인 간 규칙은 복합 도메인과 관련된 원본 데이터에 대해 정리 작업을 실행할 때 고려됩니다. 도메인 간 규칙의 유효성에 대해 알려주는 것 외에도 확실한 Then 도메인 간 규칙인 값은 같으며 데이터 정리 작업 중에 데이터를 수정합니다.

다음 예제를 고려하세요. ProductName, CompanyName 및 ProductVersion의 세 가지 개별 도메인이 있는 복합 도메인인 Product가 있습니다. 다음과 같은 선언적 도메인 간 규칙을 만드세요.

도메인 'CompanyName' 값에 Microsoft가 포함되고 도메인 'ProductName' 값이 Office와 같고 'ProductVersion' 값이 2010과 같으면 도메인 'ProductName' 값이 Microsoft Office 2010과 같습니다.

이 도메인 간 규칙이 실행되면 정리 작업 후에 원본 데이터(ProductName)가 다음으로 수정됩니다.

원본 데이터

ProductName CompanyName ProductVersion
Office Microsoft Inc. 2010

출력 데이터

ProductName CompanyName ProductVersion
Microsoft Office 2010 Microsoft Inc. 2010

최종 도메인 간 규칙을 테스트할 때 값은 동일합니다. 복합 도메인 규칙 테스트 대화 상자에는 올바른 데이터를 표시하는 새 열인 Correct To가 포함됩니다. 정리 데이터 품질 프로젝트에서 이 최종 도메인 간 규칙은 100% 신뢰도로 데이터를 변경하고 이유 열에는 규칙 '도메인 간 규칙 이름>'<으로 수정됨이라는 메시지가 표시됩니다. 도메인 간 규칙에 대한 자세한 내용은 Create a Cross-Domain Rule를 참조하세요.

참고 항목

참조 데이터 서비스에 연결된 복합 도메인에는 최종 도메인 간 규칙이 작동하지 않습니다.

복합 도메인의 데이터 프로파일링

DQS 프로파일링은 정리 작업 중에 완전성(데이터가 존재하는 정도) 및 정확도(데이터를 의도한 용도로 사용할 수 있는 범위)의 두 가지 데이터 품질 차원을 제공합니다. 프로파일링은 복합 도메인에 대한 신뢰할 수 있는 완전성 통계를 제공하지 않을 수 있습니다. 완전성 통계가 필요한 경우 복합 도메인 대신 단일 도메인을 사용합니다. 복합 도메인을 사용하려는 경우 프로파일링을 위해 단일 도메인이 있는 기술 자료를 하나 만들어 완성도를 확인하고 정리 작업을 위한 복합 도메인이 있는 다른 도메인을 만들 수 있습니다. 예를 들어 프로파일링은 복합 도메인을 사용하는 주소 레코드에 대해 95%의 완전성을 표시할 수 있지만 우편(우편) 코드 열과 같은 열 중 하나에 대해 훨씬 더 높은 수준의 불완전성이 있을 수 있습니다. 이 예제에서는 단일 도메인을 사용하여 우편 번호 열의 완전성을 측정할 수 있습니다.

프로파일링은 여러 열에 대한 정확도를 함께 측정할 수 있으므로 복합 도메인에 대해 신뢰할 수 있는 정확도 통계를 제공할 수 있습니다. 이 데이터의 값은 복합 집계에 있으므로 복합 도메인을 사용하여 정확도를 측정할 수 있습니다.

정리 작업 중 데이터 프로파일링에 대한 자세한 내용은 DQS(내부) 지식을 사용하여 데이터 정리의 프로파일러 통계를 참조하세요.