行サンプリング変換

適用対象: SQL Server Azure Data Factory の SSIS Integration Runtime

行サンプリング変換を使用すると、入力データセットからランダムに選択されたサブセットを取得できます。 出力サンプルの正確なサイズを指定したり、乱数ジェネレーターのシード値を指定できます。

ランダム サンプリング用のアプリケーションには、多くの種類があります。 たとえば、ある会社がくじ引きを行って、ランダムに選択された 50 人の社員を当選者とする場合、社員データベースに対して行サンプリング変換を行い、正確な数の当選者を生成できます。

また、行サンプリング変換は、パッケージの開発中にサイズは小さいが標本化されたデータセットを作成する際に便利です。 十分に標本化されたデータがあれば、パッケージの実行とデータ変換のテストを行うことができます。この場合、完全なデータセットではなくランダム サンプルを使用するため、より迅速にテストできます。 テスト パッケージで使用されるサンプル データセットは常に同じサイズであるため、サンプル サブセットを使用することで、パッケージのパフォーマンスの問題をより簡単に判別することもできます。

この変換は、比率サンプリング変換と同様です。ただし、比率サンプリング変換は、入力行数の比率を選択してサンプル データセットを作成します。 「 比率サンプリング変換」をご覧ください。

行サンプリング変換の構成

行サンプリング変換は、指定された数の変換入力行を選択してサンプル データセットを作成します。 変換入力からの行の選択はランダムに行われるため、結果サンプルは入力の標本となります。 乱数ジェネレーターで使用するシード値を指定すると、変換による行の選択方法を制御することもできます。

同じ変換入力で同じランダム シードを使用すると、常に同じサンプル出力が作成されます。 シードを指定しない場合、この変換はオペレーティング システムのティック数を使用して乱数を作成します。 したがって、パッケージの開発およびテスト中に変換結果を確認するためにテスト中は同じシード値を使用し、パッケージの実稼働時にランダム シードへ変更することができます。

行サンプリング変換には、 SamplingValue カスタム プロパティがあります。 このプロパティは、パッケージの読み込み時にプロパティ式で更新できます。 詳細については、「Integration Services (SSIS) の式」、「パッケージでプロパティ式を使用する」、および「変換のカスタム プロパティ」を参照してください。

この変換は、1 つの入力と 2 つの出力をとります。 エラー出力はありません。

プロパティを設定するには SSIS デザイナーから行うか、またはプログラムによって設定します。

[詳細エディター] ダイアログ ボックスには、プログラムによって設定できるプロパティが反映されます。 [詳細エディター] ダイアログ ボックスまたはプログラムで設定できるプロパティの詳細については、次のトピックのいずれかを参照してください。

プロパティの設定方法の詳細については、次のトピックを参照してください。

行サンプリング変換エディター ([サンプリング] ページ)

[行サンプリング変換エディター] ダイアログ ボックスを使用すると、指定された行数を使用して、入力の一部をサンプルに分割できます。 この変換は、入力を 2 つの別個の出力に分割します。

オプション

[行数]
サンプルとして使用する入力における行数を指定します。

このプロパティの値は、プロパティ式を使用して指定することができます。

[サンプル出力名]
サンプリングされた行を含める出力の一意な名前を指定します。 指定した名前は、SSIS デザイナー内に表示されます。

[選択されていない出力名]
サンプリングから除外された行を含む出力の一意な名前を指定します。 指定した名前は、SSIS デザイナー内に表示されます。

[次のランダム シードを使用する]
変換でサンプルを作成するために使用する乱数ジェネレーターのサンプリング シードを指定します。 このオプションは、開発およびテスト用にのみ使用することをお勧めします。 ランダム シードを指定しなかった場合は、Microsoft Windows のティック数がシードとして使用されます。

データ フロー コンポーネントのプロパティを設定する