비율 샘플링 변환Percentage Sampling Transformation

비율 샘플링 변환은 변환 입력 행의 비율을 선택하여 샘플 데이터 집합을 만듭니다.The Percentage Sampling transformation creates a sample data set by selecting a percentage of the transformation input rows. 샘플 데이터 집합은 입력을 대표하는 결과 샘플을 만들기 위해 변환 입력에서 임의로 선택한 행입니다.The sample data set is a random selection of rows from the transformation input, to make the resultant sample representative of the input.

참고

지정한 비율 외에도 비율 샘플링 변환은 특정 행을 샘플 출력에 포함할지를 결정하는 알고리즘을 사용합니다.In addition to the specified percentage, the Percentage Sampling transformation uses an algorithm to determine whether a row should be included in the sample output. 이는 샘플 출력의 행 수가 지정한 비율을 정확하게 반영하지 않을 수도 있다는 것을 의미합니다.This means that the number of rows in the sample output may not exactly reflect the specified percentage. 예를 들어 행 수가 25,000개인 입력 데이터 집합에 대해 10%를 지정해도 2,500개 행을 가진 샘플이 생성되지 않고 샘플에 포함된 행 수가 이보다 많거나 적을 수도 있습니다.For example, specifying 10 percent for an input data set that has 25,000 rows may not generate a sample with 2,500 rows; the sample may have a few more or a few less rows.

비율 샘플링 변환은 특히 데이터 마이닝에 유용합니다.The Percentage Sampling transformation is especially useful for data mining. 이 변환을 사용하면 하나의 데이터 집합을 임의로 두 개의 데이터 집합으로 나눌 수 있으며 하나는 데이터 마이닝 모델 학습에 사용되고 다른 하나는 모델 테스트에 사용됩니다.By using this transformation, you can randomly divide a data set into two data sets: one for training the data mining model, and one for testing the model.

비율 샘플링 변환은 패키지 개발을 위해 샘플 데이터 집합을 만드는 데에도 유용합니다.The Percentage Sampling transformation is also useful for creating sample data sets for package development. 비율 샘플링 변환을 데이터 흐름에 적용하면 데이터 특징을 유지하면서 데이터 집합의 크기를 균일하게 줄일 수 있습니다.By applying the Percentage Sampling transformation to a data flow, you can uniformly reduce the size of the data set while preserving its data characteristics. 테스트 패키지는 전체 데이터 집합을 대표하지만 크기가 작은 데이터 집합을 사용하기 때문에 보다 신속하게 실행할 수 있습니다.The test package can then run more quickly because it uses a small, but representative, data set.

비율 샘플링 변환 구성Configuration the Percentage Sampling Transformation

샘플링 초기값을 지정하여 비율 샘플링 변환이 행 선택 시 사용하는 난수 생성기의 동작을 수정할 수 있습니다.You can specify a sampling seed to modify the behavior of the random number generator that the transformation uses to select rows. 같은 샘플링 초기값을 사용하면 이 변환은 항상 동일한 샘플 출력을 만듭니다.If the same sampling seed is used, the transformation always creates the same sample output. 초기값을 지정하지 않으면 변환에서 운영 체제의 틱 수를 사용하여 난수를 만듭니다.If no seed is specified, the transformation uses the tick count of the operating system to create the random number. 따라서 패키지 개발 및 테스트 중에 변환 결과를 확인하기 위해 표준 초기값을 사용하도록 선택한 다음 패키지를 프로덕션으로 이동할 때 임의 초기값을 사용하도록 변경할 수도 있습니다.Therefore, you might choose to use a standard seed when you want to verify the transformation results during the development and testing of a package, and then change to use a random seed when the package is moved into production.

이 변환은 지정한 수의 입력 행을 선택하여 샘플 데이터 집합을 만드는 행 샘플링 변환과 유사합니다.This transformation is similar to the Row Sampling transformation, which creates a sample data set by selecting a specified number of the input rows. 자세한 내용은 Row Sampling Transformation을(를) 참조하세요.For more information, see Row Sampling Transformation.

비율 샘플링 변환은 SamplingValue 사용자 지정 속성을 포함합니다.The Percentage Sampling transformation includes the SamplingValue custom property. 이 속성은 패키지가 로드되면 속성 식을 사용하여 업데이트할 수 있습니다.This property can be updated by a property expression when the package is loaded. 자세한 내용은 Integration Services(SSIS) 식, 패키지에서 속성 식 사용변환 사용자 지정 속성을 참조하세요.For more information, see Integration Services (SSIS) Expressions, Use Property Expressions in Packages, and Transformation Custom Properties.

이 변환에는 하나의 입력과 두 개의 출력이 있습니다.The transformation has one input and two outputs. 오류 출력은 지원하지 않습니다.It does not support an error output.

SSISSSIS 디자이너를 사용하거나 프로그래밍 방식으로 속성을 설정할 수 있습니다.You can set properties through SSISSSIS Designer or programmatically.

고급 편집기 대화 상자에는 프로그래밍 방식으로 설정할 수 있는 속성이 표시됩니다.The Advanced Editor dialog box reflects the properties that can be set programmatically. 고급 편집기 대화 상자를 사용하거나 프로그래밍 방식으로 설정할 수 있는 속성에 대한 자세한 내용을 보려면 다음 항목 중 하나를 클릭하세요.For more information about the properties that you can set in the Advanced Editor dialog box or programmatically, click one of the following topics:

비율 샘플링 변환 편집기Percentage Sampling Transformation Editor

비율 샘플링 변환 편집기 대화 상자에서 지정한 행의 백분율을 사용하여 입력 부분을 샘플로 분할할 수 있습니다.Use the Percentage Sampling Transformation Editor dialog box to split part of an input into a sample using a specified percentage of rows. 이 변환으로 인해 입력이 두 개의 별도 출력으로 나뉩니다.This transformation divides the input into two separate outputs.

옵션Options

행의 백분율Percentage of rows
입력에서 샘플로 사용할 행의 백분율을 지정합니다.Specify the percentage of rows in the input to use as a sample.

이 속성의 값은 속성 식을 사용하여 지정할 수 있습니다.The value of this property can be specified by using a property expression.

샘플 출력 이름Sample output name
샘플링한 행이 포함될 출력에 사용할 고유 이름을 제공합니다.Provide a unique name for the output that will include the sampled rows. 제공한 이름은 SSISSSIS 디자이너에 표시됩니다.The name provided will be displayed within the SSISSSIS Designer.

선택하지 않은 출력 이름Unselected output name
샘플링에서 제외된 행이 포함될 출력에 사용할 고유 이름을 제공합니다.Provide a unique name for the output that will contain the rows excluded from the sampling. 제공한 이름은 SSISSSIS 디자이너에 표시됩니다.The name provided will be displayed within the SSISSSIS Designer.

다음과 같은 임의 초기값 사용Use the following random seed
변환에서 샘플을 만드는 데 사용하는 난수 생성기에 샘플링 초기값을 지정합니다.Specify the sampling seed for the random number generator that the transformation uses to create a sample. 이 옵션은 개발 및 테스트 용도로만 사용하는 것이 좋습니다.This is only recommended for development and testing. 임의 초기값을 지정하지 않으면 Microsoft Windows 틱 수가 사용됩니다.The transformation uses the Microsoft Windows tick count if a random seed is not specified.