복합 도메인의 데이터 정리

이 항목에서는 DQS( Data Quality ServicesData Quality Services)의 복합 도메인 정리에 대한 정보를 제공합니다. 복합 도메인은 둘 이상의 단일 도메인으로 구성되며 여러 관련 용어로 구성된 데이터 필드에 매핑됩니다. 복합 도메인의 개별 도메인은 서로 공통된 정보 영역이 있어야 합니다. 복합 도메인에 대한 자세한 내용은 Managing a Composite Domain를 참조하세요.

원본 데이터에 복합 도메인 매핑

원본 데이터와 복합 도메인을 매핑하는 방법에는 두 가지가 있습니다.

  • 원본 데이터는 복합 도메인에 매핑되는 단일 필드입니다(예:Full Name).

    • 복합 도메인이 참조 데이터 서비스에 매핑된 경우 원본 데이터가 수정 및 구문 분석을 위해 있는 그대로 참조 데이터 서비스에 전송됩니다.

    • 복합 도메인이 참조 데이터 서비스에 매핑되지 않은 경우에는 복합 도메인에 대해 정의된 구문 분석 방법에 따라 구문 분석됩니다. 복합 도메인의 구문 분석 방법을 지정하는 방법은 Create a Composite Domain를 참조하세요.

  • 원본 데이터는 복합 도메인 내 개별 도메인에 매핑되는 여러 필드(예: First Name, Middle Name 및 Last Name)로 구성됩니다.

    원본 데이터에 복합 도메인을 매핑하는 방법에 대 한 예제를 보려면 연결 도메인 또는 복합 도메인을 참조 데이터합니다.

선언적 도메인 간 규칙을 사용하여 데이터 수정

복합 도메인의 도메인 간 규칙을 사용하여 복합 도메인의 개별 도메인 간 관계를 나타내는 규칙을 만들 수 있습니다. 도메인 간 규칙은 복합 도메인과 관련된 원본 데이터에 대해 정리 작업을 실행할 때 고려됩니다. 와 별개로 뿐만 알고 선언적 도메인 간 규칙의 유효성을 검사 하는 방법에 대 한 다음 도메인 간 규칙 값이 같지, 또한 데이터 정리 작업 중에서 데이터를 수정 합니다.

다음 예제를 살펴보세요. 3개의 개별 도메인 ProductName, CompanyName 및 ProductVersion이 있는 복합 도메인 Product가 있습니다. 다음과 같은 선언적 도메인 간 규칙을 만드세요.

IF 도메인 'CompanyName' 값이 다음을 포함 Microsoft AND 도메인 'ProductName' 값이 다음 값과 같음 Office AND 'ProductVersion' 값이 다음 값과 같음 2010 THEN 도메인 'ProductName' 값이 다음 값과 같음 Microsoft Office 2010

이 도메인 간 규칙을 실행하면 정리 작업 후 원본 데이터(ProductName)가 다음과 같이 수정됩니다.

원본 데이터

ProductName CompanyName ProductVersion
Office Microsoft Inc. 2010

출력 데이터

ProductName CompanyName ProductVersion
Microsoft Office 2010 Microsoft Inc. 2010

결정적인 테스트할 때 다음 도메인 간 규칙 값이 같지, 복합 도메인 규칙 테스트 대화 상자에 새 열을 수정, 올바른 데이터를 표시 하는 합니다. 정리 데이터 품질 프로젝트에서이 선언적 도메인 간 규칙이 100% 확신을가지고 데이터를 변경 및 이유 열에는 다음과 같은 메시지가 표시 됩니다: 규칙에 의해 수정 '< 도메인 간 규칙 이름 >'. 도메인 간 규칙에 대 한 자세한 내용은 참조 도메인 간 규칙을 만드는합니다.

참고

선언적 도메인 간 규칙은 참조 데이터 서비스에 연결된 복합 도메인에 대해 작동하지 않습니다.

복합 도메인의 데이터 프로파일링

DQS 프로 파일링 할 두 가지 데이터 품질 차원을 제공: 완결성 (데이터가 표시 되는 정도) 및 정확도 (의도 된 용도 대 한 데이터를 사용 수 있는 정도) 정리 작업 시. 프로파일링은 복합 도메인에 대한 신뢰할 수 있는 완결성 통계를 제공할 수 없습니다. 완결성 통계가 필요한 경우 복합 도메인 대신 단일 도메인을 사용하세요. 복합 도메인을 사용하려는 경우 프로파일링을 위해 단일 도메인을 사용하는 하나의 기술 자료를 만들어 완결성을 확인하고 정리 작업을 위해 복합 도메인을 사용하는 다른 도메인을 만드는 것이 좋습니다. 예를 들어 프로파일링은 복합 도메인을 사용하는 주소 레코드에 대해 95%의 완결성을 표시할 수 있지만 우편 번호 열과 같은 열의 경우 불완결성 수준이 매우 높을 수 있습니다. 이 예에서는 단일 도메인을 사용하는 우편 번호 열의 완결성을 평가하는 것이 좋습니다.

프로파일링은 복합 도메인에 대해 신뢰할 수 있는 정확성 통계를 제공할 가능성이 높습니다. 여러 열의 정확성을 함께 평가할 수 있기 때문입니다. 이 데이터의 값은 복합 집계 형식이므로 복합 도메인을 사용하여 정확성을 평가하는 것이 좋습니다.

정리 작업 시 프로 파일링 데이터에 대 한 자세한 내용은 참조 프로파일러 통계 에서 데이터를 사용 하 여 DQS 정리 & #40; 내부 & #41; 기술합니다.