값 포함 프로필 요청 옵션(데이터 프로파일링 태스크)Value Inclusion Profile Request Options (Data Profiling Task)

프로필 요청 페이지의 요청 속성 창을 사용하여 요청 창에서 선택한 값 포함 프로필 요청 의 옵션을 설정할 수 있습니다.Use the Request Properties pane of the Profile Requests page to set the options for the Value Inclusion Profile Request selected in the requests pane. 값 포함 프로필은 두 개의 열 또는 열 집합 간에 겹치는 값을 계산합니다.A Value Inclusion profile computes the overlap in the values between two columns or sets of columns. 따라서 이 프로필은 열 또는 열 집합이 선택한 테이블 간의 외래 키 역할을 수행하기에 적합한지 여부도 확인할 수 있습니다.Thus, it can also determine whether a column or set of columns is appropriate to serve as a foreign key between the selected tables. 또한 이 프로필을 사용하면 잘못된 값과 같은 데이터 문제를 식별할 수 있습니다.This profile can also help you identify problems in your data such as invalid values. 예를 들어 값 포함 프로필을 사용하여 Sales 테이블의 ProductID 열을 프로파일링하는 중For example, you use a value inclusion profile to profile the ProductID column of a Sales table. 프로필이 Products 테이블의 ProductID 열에 없는 값이 열에 포함되어 있음을 검색할 수 있습니다.The profile discovers that the column contains values that are not found in the ProductID column of the Products table.

참고

이 항목에서 설명하는 옵션은 데이터 프로파일링 태스크 편집기프로필 요청 페이지에 나타납니다.The options described in this topic appear on the Profile Requests page of the Data Profiling Task Editor. 편집기의 이 페이지에 대한 자세한 내용은 데이터 프로파일링 태스크 편집기(프로필 요청 페이지)를 참조하세요.For more information about this page of the editor, see Data Profiling Task Editor (Profile Requests Page).

데이터 프로파일링 태스크를 사용하는 방법에 대한 자세한 내용은 데이터 프로파일링 태스크 설정을 참조하세요.For more information about how to use the Data Profiling Task, see Setup of the Data Profiling Task. 데이터 프로필 뷰어를 사용하여 데이터 프로파일링 태스크의 출력을 분석하는 방법에 대한 자세한 내용은 데이터 프로필 뷰어를 참조하세요.For more information about how to use the Data Profile Viewer to analyze the output of the Data Profiling Task, see Data Profile Viewer.

InclusionColumns 속성에 대한 열 선택 이해Understanding the Selection of Columns for the InclusionColumns Property

값 포함 프로필 요청 은 하위 집합의 모든 값이 상위 집합에 있는지 여부를 계산합니다.A Value Inclusion Profile Request computes whether all the values in a subset are present in the superset. 상위 집합은 주로 조회 테이블 또는 참조 테이블입니다.The superset is often a lookup or reference table. 예를 들어 주소 테이블의 주 열은 하위 집합 테이블입니다.For example, the state column in a table of addresses is the subset table. 이 열에 있는 두 개의 문자로 구성된 모든 주 코드는 상위 집합 테이블인 미국 우편 서비스 주 코드 테이블에도 있어야 합니다.Every two-character state code in this column should also be found in the table of United States Postal Service state codes, which is the superset table.

() 와일드카드를 하위 집합 열 또는 상위 집합 열의 값으로 사용하면 데이터 프로파일링 태스크에서 해당 측의 각 열을 다른 측에 지정된 열에 대해 비교합니다.When you use the () wildcard as the value of the subset column or the superset column, the Data Profiling task compares each column on that side against the column specified on the other side.

참고

()를 선택하는 경우 이 옵션으로 인해 계산이 많이 발생하여 태스크의 성능이 저하될 수 있습니다.If you select (), this option might result in a large number of computations and decrease the performance of the task.

임계값 설정 이해Understanding the Threshold Settings

두 개의 다른 임계값 설정을 사용하여 값 포함 프로필 요청의 출력을 구체화할 수 있습니다.You can use two different threshold settings to refine the output of a Value Inclusion Profile Request.

InclusionThresholdSetting 에 대해 None이외의 값을 지정하면 다음 상황 중 하나에서만 프로필이 상위 집합에 있는 하위 집합의 포함 수준을 보고합니다.When you specify a value other than None for InclusionThresholdSetting, the profile reports the inclusion strength of the subset in the superset only under one of the following conditions:

  • 포함 수준이 InclusionStrengthThreshold에 지정된 임계값을 초과하는 경우When the inclusion strength exceeds the threshold specified in InclusionStrengthThreshold.

  • 포함 수준의 값이 1.0이고 InclusionStrengthThresholdExact로 설정된 경우When the inclusion strength has a value of 1.0 and the InclusionStrengthThreshold is set to Exact.

    고유하지 않은 값으로 인해 상위 집합 열이 상위 집합 테이블에 적절한 키가 아닌 조합을 필터링하여 출력을 보다 구체화할 수 있습니다.You can refine the output more by filtering out combinations where the superset column is not an appropriate key for the superset table because of non-unique values. SupersetColumnsKeyThresholdSetting 에 대해 None이외의 값을 지정하면 다음 상황 중 하나에서만 프로필이 상위 집합에 있는 하위 집합의 포함 수준을 보고합니다.When you specify a value other than None for SupersetColumnsKeyThresholdSetting, the profile reports the inclusion strength of the subset in the superset only under one of the following conditions:

  • 상위 집합 테이블에서 상위 집합 열이 키로 적합한 정도를 나타내는 값이 SupersetColumnsKeyThreshold에 지정된 임계값을 초과하는 경우When the suitability of the superset columns as a key in the superset table exceeds the threshold specified in SupersetColumnsKeyThreshold

  • 포함 수준의 값이 1.0이고 SupersetColumnsKeyThresholdExact로 설정된 경우When the inclusion strength has a value or 1.0 and the SupersetColumnsKeyThreshold is set to Exact.

요청 속성 옵션Request Properties Options

값 포함 프로필 요청에 대해 요청 속성 창에는 다음 옵션 그룹이 표시됩니다.For a Value Inclusion Profile Request, the Request Properties pane displays the following groups of options:

  • 데이터- SubsetTableOrView, SupersetTableOrViewInclusionColumns 옵션이 포함되어 있습니다.Data, which includes the SubsetTableOrView, SupersetTableOrView, and InclusionColumns options

  • 일반General

  • OptionsOptions

데이터 옵션Data Options

ConnectionManagerConnectionManager
.NET Data Provider for ADO.NETADO.NET (SqlClient)를 사용하여 프로파일링할 테이블이나 뷰가 포함된 SQL ServerSQL Server 데이터베이스에 연결하는 기존 SQL ServerSQL Server 연결 관리자를 선택합니다.Select the existing ADO.NETADO.NET connection manager that uses the .NET Data Provider for SQL ServerSQL Server (SqlClient) to connect to the SQL ServerSQL Server database that contains the table or view to be profiled.

SubsetTableOrViewSubsetTableOrView
프로파일링할 기존 테이블이나 뷰를 선택합니다.Select the existing table or view to be profiled.

자세한 내용은 이 항목의 "SubsetTableOrView 및 SupersetTableOrView 옵션" 섹션을 참조하십시오.For more information, see the section, "SubsetTableOrView and SupersetTableOrView Options," in this topic.

SupersetTableOrViewSupersetTableOrView
프로파일링할 기존 테이블이나 뷰를 선택합니다.Select the existing table or view to be profiled.

자세한 내용은 이 항목의 "SubsetTableOrView 및 SupersetTableOrView 옵션" 섹션을 참조하십시오.For more information, see the section, "SubsetTableOrView and SupersetTableOrView Options," in this topic.

InclusionColumnsInclusionColumns
하위 집합 및 상위 집합 테이블에서 열 또는 열 집합을 선택합니다.Select the columns or sets of columns from the subset and superset tables.

자세한 내용은 이 항목의 "InclusionColumns 속성에 대한 열 선택 이해" 및 "InclusionColumns 옵션" 섹션을 참조하십시오.For more information, see the sections, "Understanding the Selection of Columns for the InclusionColumns Property" and "InclusionColumns Options," in this topic.

SubsetTableOrView 및 SupersetTableOrView 옵션SubsetTableOrView and SupersetTableOrView Options

스키마Schema
선택한 테이블이 속해 있는 스키마를 지정합니다.Specifies the schema to which the selected table belongs. 이 옵션은 읽기 전용입니다.This option is read-only.

TableOrViewTableOrView
선택한 테이블의 이름을 표시합니다.Displays the name of the selected table. 이 옵션은 읽기 전용입니다.This option is read-only.

InclusionColumns 옵션InclusionColumns Options

InclusionColumns에서 프로파일링 대상으로 선택한 각 열 집합에 대해 다음 옵션이 제공됩니다.The following options are presented for each set of columns selected for profiling in InclusionColumns.

자세한 내용은 이 항목의 앞부분에 나오는 "InclusionColumns 속성에 대한 열 선택 이해" 섹션을 참조하십시오.For more information, see the section, "Understanding the Selection of Columns for the InclusionColumns Property," earlier in this topic.

IsWildcardIsWildcard
(*) 와일드카드가 선택되었는지 여부를 지정합니다.Specifies whether the (*) wildcard has been selected. 이 옵션은 모든 열을 프로파일링하도록 (*)를 선택한 경우 True로 설정됩니다.This option is set to True if you have selected (*) to profile all columns. 프로파일링할 개별 열을 선택한 경우에는 False 로 설정됩니다.It is False if you have selected an individual column to be profiled. 이 옵션은 읽기 전용입니다.This option is read-only.

ColumnNameColumnName
선택한 열의 이름을 표시합니다.Displays the name of the selected column. 이 옵션은 모든 열을 프로파일링하도록 (*)를 선택한 경우 비어 있습니다.This option is blank if you have selected (*) to profile all columns. 이 옵션은 읽기 전용입니다.This option is read-only.

StringCompareOptionsStringCompareOptions
문자열 값을 비교할 수 있는 옵션을 선택합니다.Select options for comparing string values. 이 속성의 옵션은 다음 표에 나열되어 있습니다.This property has the options listed in the following table. 이 옵션의 기본값은 Default입니다.The default value of this option is Default.

참고

ColumnName에 대해 (*) 와일드카드를 사용하는 경우 CompareOptions가 읽기 전용이 되며 Default 설정으로 설정됩니다.When you use the (*) wildcard for ColumnName, CompareOptions is read-only and is set to the Default setting.

Value DescriptionDescription
DefaultDefault 원본 테이블에서 열의 데이터 정렬을 기준으로 데이터를 정렬 및 비교합니다.Sorts and compares data based on the column's collation in the source table.
BinarySortBinarySort 각 문자에 대해 정의된 비트 패턴을 기준으로 데이터를 정렬 및 비교합니다.Sorts and compares data based on the bit patterns defined for each character. 이진 정렬 순서는 대/소문자와 악센트를 구분합니다.Binary sort order is case sensitive and accent sensitive. 이진은 가장 빠른 정렬 순서입니다.Binary is also the fastest sorting order.
DictionarySortDictionarySort 관련된 언어 또는 알파벳에 대해 사전에 정의된 정렬 및 비교 규칙에 따라 데이터를 정렬 및 비교합니다.Sorts and compares data based on the sorting and comparison rules as defined in dictionaries for the associated language or alphabet.

DictionarySort를 선택하는 경우 다음 테이블에 나열된 옵션 조합을 선택할 수도 있습니다.If you select DictionarySort, you can also select any combination of the options listed in the following table. 이러한 추가 옵션은 기본적으로 선택되어 있지 않습니다.By default, none of these additional options are selected.

ValueValue DescriptionDescription
IgnoreCaseIgnoreCase 비교 시 대문자와 소문자를 구분할지 여부를 지정합니다.Specifies whether the comparison distinguishes between uppercase and lowercase letters. 이 옵션을 설정하면 문자열 비교 시 대/소문자가 무시됩니다.If this option is set, the string comparison ignores case. 예를 들어 "ABC"는 "abc"와 동일하게 인식됩니다.For example, "ABC" becomes the same as "abc".
IgnoreNonSpaceIgnoreNonSpace 비교 시 공백 문자와 분음 기호를 구분할지 여부를 지정합니다.Specifies whether the comparison distinguishes between spacing characters and diacritics. 이 옵션을 설정하면 비교 시 분음 기호가 무시됩니다.If this option is set, the comparison ignores diacritics. 예를 들어 "å"와 "a"는 동일합니다.For example, "å" is equal to "a".
IgnoreKanaTypeIgnoreKanaType 비교 시 두 가지 형식의 일본어 가나 문자인 히라가나와 가타가나를 구분합니다.Specifies whether the comparison distinguishes between the two types of Japanese kana characters: hiragana and katakana. 이 옵션을 설정하면 문자열 비교 시 가나 형식이 무시됩니다.If this option is set, the string comparison ignores kana type.
IgnoreWidthIgnoreWidth 비교 시 싱글바이트 문자와 동일 문자의 더블바이트 문자 표현을 구분할지 여부를 지정합니다.Specifies whether the comparison distinguishes between a single-byte character and the same character when it is represented as a double-byte character. 이 옵션을 설정하면 문자열 비교 시 동일 문자에 대한 싱글바이트 표현과 더블바이트 표현이 동일하게 인식됩니다.If this option is set, the string comparison treats single-byte and double-byte representations of the same character as identical.

일반 옵션General Options

RequestIDRequestID
이 프로필 요청을 식별할 설명이 포함된 이름을 입력합니다.Type a descriptive name to identify this profile request. 일반적으로 자동 생성된 값은 변경하지 않아도 됩니다.Typically, you do not have to change the autogenerated value.

옵션이 포함되어 있습니다.Options

NoneInclusionThresholdSetting
프로필의 출력을 구체화하기 위한 임계값 설정을 선택합니다.Select the threshold setting to refine the output of the profile. 이 속성의 기본값은 Specified입니다.The default value of this property is Specified. 자세한 내용은 이 항목의 앞부분에 나오는 "임계값 설정 이해" 섹션을 참조하십시오.For more information, see the section, "Understanding the Threshold Settings," earlier in this topic.

ValueValue DescriptionDescription
InclusionThresholdSettingNone 임계값을 지정하지 않습니다.Does not specify a threshold. 키 수준은 해당 값에 관계없이 보고됩니다.The key strength is reported regardless of its value.
SpecifiedSpecified InclusionStrengthThreshold에 지정된 임계값을 사용합니다.Use the threshold that is specified in InclusionStrengthThreshold. 포함 수준은 이 값이 임계값보다 큰 경우에만 보고됩니다.The inclusion strength is reported only if it is greater than the threshold.
ExactExact 임계값을 지정하지 않습니다.Does not specify a threshold. 포함 수준은 하위 집합 값이 상위 집합 값에 완전히 포함된 경우에만 보고됩니다.The inclusion strength is reported only if the subset values are completedly included in the upserset values.

InclusionStrengthThresholdInclusionStrengthThreshold
0-1의 값을 사용하여 임계값을 지정합니다. 이 임계값을 초과하는 포함 수준은 보고됩니다.Specify the threshold (by using a value between 0 and 1) above which the inclusion strength should be reported. 이 속성의 기본값은 0.95입니다.The default value of this property is 0.95. SpecifiedInclusionThresholdSetting으로 선택된 경우에만 이 옵션을 사용할 수 있습니다.This option is enabled only when Specified is selected as the InclusionThresholdSetting.

자세한 내용은 이 항목의 앞부분에 나오는 "임계값 설정 이해" 섹션을 참조하십시오.For more information, see the section, "Understanding the Threshold Settings," earlier in this topic.

NoneSupersetColumnsKeyThresholdSetting
상위 집합 임계값을 지정합니다.Specify the superset threshold. 이 속성의 기본값은 Specified입니다.The default value of this property is Specified. 자세한 내용은 이 항목의 앞부분에 나오는 "임계값 설정 이해" 섹션을 참조하십시오.For more information, see the section, "Understanding the Threshold Settings," earlier in this topic.

ValueValue DescriptionDescription
InclusionThresholdSettingNone 임계값을 지정하지 않습니다.Does not specify a threshold. 포함 수준은 상위 집합 열의 키 수준에 관계없이 보고됩니다.The inclusion strength is reported regardless of the key strength of the superset column.
SpecifiedSpecified SupersetColumnsKeyThreshold에 지정된 임계값을 사용합니다.Use the threshold that is specified in SupersetColumnsKeyThreshold. 포함 수준은 상위 집합 열의 키 수준이 임계값보다 큰 경우에만 보고됩니다.The inclusion strength is reported only if the key strength of the superset column is greater than the threshold.
ExactExact 임계값을 지정하지 않습니다.Does not specify a threshold. 포함 수준은 상위 집합 열이 상위 집합 테이블의 정확한 키인 경우에만 보고됩니다.The inclusion strength is reported only if the supserset columns are an exact key in the superset table.

SupersetColumnsKeyThresholdSupersetColumnsKeyThreshold
0-1의 값을 사용하여 임계값을 지정합니다. 이 임계값을 초과하는 포함 수준은 보고됩니다.Specify the threshold (by using a value between 0 and 1) above which the inclusion strength should be reported. 이 속성의 기본값은 0.95입니다.The default value of this property is 0.95. SpecifiedSupersetColumnsKeyThresholdSetting으로 선택된 경우에만 이 옵션을 사용할 수 있습니다.This option is enabled only when Specified is selected as the SupersetColumnsKeyThresholdSetting.

자세한 내용은 이 항목의 앞부분에 나오는 "임계값 설정 이해" 섹션을 참조하십시오.For more information, see the section, "Understanding the Threshold Settings," earlier in this topic.

MaxNumberOfViolationsMaxNumberOfViolations
출력에 보고할 최대 포함 위반 수를 지정합니다.Specify the maximum number of inclusion violations to report in the output. 이 속성의 기본값은 100입니다.The default value of this property is 100. ExactInclusionThresholdSetting으로 선택된 경우 이 옵션을 사용할 수 없습니다.This option is disabled when Exact is selected as the InclusionThresholdSetting.

관련 항목:See Also

데이터 작업 편집기 ( 프로 파일링 일반 페이지 ) Data Profiling Task Editor (General Page)
단일 테이블 빠른 프로필 형식 ( 데이터 작업 ) 프로 파일링Single Table Quick Profile Form (Data Profiling Task)