преобразование «Процентная выборка»

Применимо к: SQL Server Integration Runtime служб SSIS в Фабрика данных Azure

Преобразование «Процентная выборка» создает образец набора данных извлечением некоторого процента входных строк преобразования. Данные выборки извлекаются случайным образом из входа преобразования. За счет этого достигается репрезентативность выборки.

Примечание

Помимо заданного количества процентов преобразование «Процентная выборка» использует алгоритм, определяющий возможность включения строки в результирующую выборку. Это означает, что количество строк в выборке может не соответствовать точно заданному количеству процентов. Например, определив 10 процентов от входного набора данных, содержащего 25000 строк, можно получить выборку, содержащую немного больше или немного меньше, чем 2500 строк.

Преобразование «Процентная выборка» особенно полезно для интеллектуального анализа данных. С помощью этого преобразования можно случайным образом разделить набор данных на два набора: один — для изучения модели интеллектуального анализа данных, другой — для тестирования этой модели.

Преобразование «Процентная выборка» также полезно для создания образца набора данных, используемого при разработке пакета. Применяя преобразование «Процентная выборка» к потоку данных, можно уменьшить размер набора данных, сохраняя его статистические характеристики. Тестовый пакет можно выполнить быстрее, потому что он содержит меньший, но репрезентативный набор данных.

Настройка преобразования «Процентная выборка»

Можно изменить начальное значение генератора случайных чисел, используемого для выборки строк. Если всегда использовать одинаковое начальное значение для генератора, то результирующая выборка, при прочих равных условиях, будет тоже всегда одинаковая. Если начальное значение для создания случайного номера не указано, преобразование использует счетчик тактов операционной системы. Поэтому можно выбрать постоянное начальное значение для генератора во время отладки и случайное значение при передаче пакета в производственную эксплуатацию.

Это преобразование немного схоже с преобразованием «Выборка строк», которое создает выборку с заданным количеством строк. Дополнительные сведения см. в разделе Row Sampling Transformation.

Преобразование «Процентная выборка» содержит пользовательское свойство SamplingValue . Это свойство может быть обновлено выражением свойства при загрузке пакета. Дополнительные сведения см. в разделах Выражения служб Integration Services (SSIS), Использование выражений свойств в пакетах и Пользовательские свойства преобразований.

Преобразование имеет один вход и два выхода. Вывод ошибок не поддерживается.

Значения свойств можно задавать с помощью конструктора Integration Services или программными средствами.

Диалоговое окно Расширенный редактор содержит свойства, которые можно установить с помощью программных средств. Дополнительные сведения о свойствах, которые вы можете задать в диалоговом окне Расширенный редактор или программными средствами, см. в следующих разделах.

Дополнительные сведения о настройке свойств см. в разделе Установление свойств компонента потока данных.

редактор преобразования «Процентная выборка»

Используйте диалоговое окно Редактор преобразования «Процентная выборка» для выборки части входных данных по заданному проценту строк. Это преобразование разделяет входные данные на два отдельных вывода.

Параметры

Процент строк
Задает процент строк во входных данных для использования в качестве выборки.

Значение этого свойства можно задать с помощью выражения свойства.

Имя выхода выборки
Задайте уникальное имя выхода, содержащего строки выборки. Это имя будет отображаться в конструкторе служб Integration Services .

Имя вывода невыбранных элементов
Задает уникальное имя выхода, который содержит строки, исключенные из выборки. Это имя будет отображаться в конструкторе служб Integration Services .

Использовать следующее начальное значение
Задайте начальное значение выборки для генератора случайных чисел, который преобразование использует для создания выборки. Рекомендуется только для разработки и тестирования. Если начальное значение выборки не задано, преобразование использует счетчик тактов Microsoft Windows.