資料列取樣轉換

適用於:SQL Server Azure Data Factory 中的 SSIS Integration Runtime

「資料列取樣」轉換是用來取得隨機選取的輸入資料集子集。 您可以指定輸出範例的確實大小,以及指定隨機號碼產生器的種子資料 (Seed)。

可用於隨機取樣的應用程式有許多種。 例如,某公司希望隨機選取 50 名員工接受抽獎獎項,即可在員工資料庫上使用「資料列取樣」轉換產生正確的獲獎者數目。

在封裝部署期間,「資料列取樣」轉換對於建立小型但具代表性的資料集來說亦相當實用。 您可以運用豐富的代表性資料測試封裝執行和資料庫轉換,而由於使用隨機取樣而非整個資料集,因此速度更快。 由於測試封裝所使用的取樣資料集大小始終相同,因此使用取樣子集亦可讓識別封裝中的效能問題更為容易。

此轉換與「百分比取樣」轉換相似,但後者是藉由選取某個百分比的輸入資料列建立取樣資料集。 請參閱 百分比取樣轉換

設定資料列取樣轉換

「資料列取樣」轉換會藉由選取指定數目的轉換輸入資料列來建立取樣資料集。 由於是從轉換輸入隨機選取資料列,因此結果取樣即為輸入的代表。 您也可以指定隨機號碼產生器使用的種子資料,以影響轉換選取資料列的方式。

使用相同轉換輸入上的相同隨機種子資料,會固定建立相同的取樣輸出。 如果未指定種子,轉換會使用作業系統的滴答計數建立隨機號碼。 因此,您可以在測試過程中使用相同的種子,以便在開發和測試封裝期間驗證轉換結果,然後在封裝移至實際執行階段時變更為隨機種子。

資料列取樣轉換包括 SamplingValue 自訂屬性。 屬性運算式可以在載入封裝時更新這個屬性。 如需詳細資訊,請參閱 Integration Services (SSIS) 運算式在封裝中使用屬性運算式轉換自訂屬性

此轉換有一個輸入和兩個輸出。 但沒有錯誤輸出。

您可以透過 SSIS 設計師或以程式設計方式設定屬性。

[進階編輯器] 對話方塊會反映能以程式設計的方式設定之屬性。 如需有關可以在 [進階編輯器] 對話方塊中或以程式設計方式設定之屬性的詳細資訊,請按下列其中一個主題:

如需有關如何設定屬性的詳細資訊,請參閱。

資料列取樣轉換編輯器 (取樣頁面)

使用 [資料列取樣轉換編輯器] 對話方塊,即可將輸入的一部分分割為指定資料列數目的取樣。 這個轉換會將輸入分成兩個不同的輸出。

選項。

資料列數目
指定輸入中的資料列數目作為取樣。

此屬性的值可以使用屬性運算式指定。

取樣輸出名稱
提供包含取樣資料列之輸出的唯一名稱。 提供的名稱將顯示在 SSIS 設計師內。

未選取的輸出名稱
提供輸出的唯一名稱,其中包含從取樣排除的資料列。 提供的名稱將顯示在 SSIS 設計師內。

使用下列隨機種子
指定轉換用來建立取樣之隨機號碼產生器的取樣種子。 只建議用於開發和測試。 如果未指定隨機種子,則轉換會使用 Microsoft Windows 滴答計數作為種子。

設定資料流程元件的屬性