행 샘플링 변환Row Sampling Transformation

행 샘플링 변환은 임의로 선택된 입력 데이터 집합의 하위 집합을 얻는 데 사용합니다.The Row Sampling transformation is used to obtain a randomly selected subset of an input dataset. 출력 샘플의 정확한 크기와 난수 생성기의 초기값을 지정할 수 있습니다.You can specify the exact size of the output sample, and specify a seed for the random number generator.

무작위 샘플링은 다양한 용도로 응용될 수 있습니다.There are many applications for random sampling. 예를 들어 복권 당첨 경품을 받을 50명의 직원을 임의로 선택하려는 회사는 직원 데이터베이스에 대해 행 샘플링 변환을 사용하여 정확한 수의 당첨자를 생성할 수 있습니다.For example, a company that wanted to randomly select 50 employees to receive prizes in a lottery could use the Row Sampling transformation on the employee database to generate the exact number of winners.

행 샘플링 변환은 패키지 개발 중에 전체 데이터 집합을 대표하지만 크기가 작은 데이터 집합을 만드는 데에도 유용합니다.The Row Sampling transformation is also useful during package development for creating a small but representative dataset. 유효한 대표 데이터를 사용하여 패키지 실행과 데이터 변환을 테스트할 수 있을 뿐만 아니라 전체 데이터 집합 대신 무작위 샘플링을 사용하기 때문에 시간이 훨씬 단축됩니다.You can test package execution and data transformation with richly representative data, but more quickly because a random sample is used instead of the full dataset. 테스트 패키지에 사용되는 샘플 데이터 집합은 항상 크기가 같기 때문에 샘플 하위 집합을 사용하면 패키지의 성능 문제도 쉽게 식별할 수 있습니다.Because the sample dataset used by the test package is always the same size, using the sample subset also makes it easier to identify performance problems in the package.

이 변환은 입력 행의 비율을 선택하여 샘플 데이터 집합을 만드는 비율 샘플링 변환과 유사합니다.This transformation is similar to the Percentage Sampling transformation, which creates a sample dataset by selecting a percentage of the input rows. Percentage Sampling Transformation을 참조하세요.See Percentage Sampling Transformation.

행 샘플링 변환 구성Configuring the Row Sampling Transformation

행 샘플링 변환은 지정한 수의 변환 입력 행을 선택하여 샘플 데이터 집합을 만듭니다.The Row Sampling transformation creates a sample dataset by selecting a specified number of the transformation input rows. 변환 입력에서 임의로 행이 선택되기 때문에 결과 샘플은 전체 입력을 대표합니다.Because the selection of rows from the transformation input is random, the resultant sample is representative of the input. 난수 생성기에 사용되는 초기값을 지정하여 변환의 행 선택 방법에 영향을 줄 수도 있습니다.You can also specify the seed that is used by the random number generator, to affect how the transformation selects rows.

동일한 변환 입력에 대해 같은 임의 초기값을 사용하면 항상 동일한 샘플 출력이 만들어집니다.Using the same random seed on the same transformation input always creates the same sample output. 초기값을 지정하지 않으면 변환에서 운영 체제의 틱 수를 사용하여 난수를 만듭니다.If no seed is specified, the transformation uses the tick count of the operating system to create the random number. 따라서 패키지 개발 및 테스트 중에 변환 결과를 확인하기 위해 테스트 시에는 동일한 초기값을 사용한 다음 패키지를 프로덕션으로 이동할 때 임의 초기값으로 변경할 수도 있습니다.Therefore, you could use the same seed during testing, to verify the transformation results during the development and testing of the package, and then change to a random seed when the package is moved into production.

행 샘플링 변환은 SamplingValue 사용자 지정 속성을 포함합니다.The Row Sampling transformation includes the SamplingValue custom property. 이 속성은 패키지가 로드되면 속성 식을 사용하여 업데이트할 수 있습니다.This property can be updated by a property expression when the package is loaded. 자세한 내용은 Integration Services(SSIS) 식, 패키지에서 속성 식 사용변환 사용자 지정 속성을 참조하세요.For more information, see Integration Services (SSIS) Expressions, Use Property Expressions in Packages, and Transformation Custom Properties.

이 변환에는 하나의 입력과 두 개의 출력이 있습니다.This transformation has one input and two outputs. 오류 출력은 없습니다.It has no error output.

SSISSSIS 디자이너를 사용하거나 프로그래밍 방식으로 속성을 설정할 수 있습니다.You can set properties through SSISSSIS Designer or programmatically.

고급 편집기 대화 상자에는 프로그래밍 방식으로 설정할 수 있는 속성이 표시됩니다.The Advanced Editor dialog box reflects the properties that can be set programmatically. 고급 편집기 대화 상자를 사용하거나 프로그래밍 방식으로 설정할 수 있는 속성에 대한 자세한 내용을 보려면 다음 항목 중 하나를 클릭하세요.For more information about the properties that you can set in the Advanced Editor dialog box or programmatically, click one of the following topics:

행 샘플링 변환 편집기(샘플링 페이지)Row Sampling Transformation Editor (Sampling Page)

행 샘플링 변환 편집기 대화 상자를 사용하여 입력의 일부분을 지정된 행 수를 사용하는 샘플로 분할할 수 있습니다.Use the Row Sampling Transformation Editor dialog box to split a portion of an input into a sample using a specified number of rows. 이 변환으로 인해 입력이 두 개의 별도 출력으로 나뉩니다.This transformation divides the input into two separate outputs.

옵션Options

행 수Number of rows
입력에서 샘플로 사용할 행 수를 지정합니다.Specify the number of rows from the input to use as a sample.

이 속성의 값은 속성 식을 사용하여 지정할 수 있습니다.The value of this property can be specified by using a property expression.

샘플 출력 이름Sample output name
샘플링한 행이 포함될 출력에 사용할 고유 이름을 제공합니다.Provide a unique name for the output that will include the sampled rows. 제공한 이름은 SSIS 디자이너에 표시됩니다.The name provided will be displayed within SSIS Designer.

선택하지 않은 출력 이름Unselected output name
샘플링에서 제외된 행이 포함될 출력에 사용할 고유 이름을 제공합니다.Provide a unique name for the output that will contain the rows excluded from the sampling. 제공한 이름은 SSIS 디자이너에 표시됩니다.The name provided will be displayed within SSIS Designer.

다음과 같은 임의 초기값 사용Use the following random seed
변환에서 샘플을 만드는 데 사용하는 난수 생성기에 샘플링 초기값을 지정합니다.Specify the sampling seed for the random number generator that the transformation uses to create a sample. 이 옵션은 개발 및 테스트 용도로만 사용하는 것이 좋습니다.This is only recommended for development and testing. 임의 초기값을 지정하지 않으면 변환에서 Microsoft Windows 틱 수를 초기값으로 사용합니다.The transformation uses the Microsoft Windows tick count as a seed if a random seed is not specified.

데이터 흐름 구성 요소의 속성 설정Set the Properties of a Data Flow Component