Campionamento righe - trasformazioneRow Sampling Transformation

La trasformazione Campionamento righe consente di ottenere un subset di elementi selezionati casualmente da un set di dati di input.The Row Sampling transformation is used to obtain a randomly selected subset of an input dataset. È possibile specificare le dimensioni esatte dell'output campione e un valore di inizializzazione per il generatore di numeri casuali.You can specify the exact size of the output sample, and specify a seed for the random number generator.

Il campionamento casuale può essere utilizzato in molte circostanze.There are many applications for random sampling. Se ad esempio in una società si desidera selezionare casualmente 50 dipendenti a cui assegnare i premi di una lotteria, sarà possibile utilizzare la trasformazione Campionamento righe sul database dei dipendenti per generare esattamente il numero di vincitori specificato.For example, a company that wanted to randomly select 50 employees to receive prizes in a lottery could use the Row Sampling transformation on the employee database to generate the exact number of winners.

La trasformazione Campionamento righe risulta utile anche durante lo sviluppo dei pacchetti, per la creazione di un set di dati piccolo ma rappresentativo.The Row Sampling transformation is also useful during package development for creating a small but representative dataset. È possibile testare l'esecuzione del pacchetto e la trasformazione dei dati con dati altamente rappresentativi, ma più rapidamente, perché al posto del set di dati completo viene utilizzato un campione casuale.You can test package execution and data transformation with richly representative data, but more quickly because a random sample is used instead of the full dataset. Poiché le dimensioni del set di dati di esempio utilizzato dal pacchetto di test sono sempre uguali, l'utilizzo del subset campione semplifica inoltre l'identificazione di eventuali problemi di prestazioni nel pacchetto.Because the sample dataset used by the test package is always the same size, using the sample subset also makes it easier to identify performance problems in the package.

Questa trasformazione è simile alla trasformazione Campionamento percentuale, che crea un set di dati campione selezionando una percentuale delle righe di input.This transformation is similar to the Percentage Sampling transformation, which creates a sample dataset by selecting a percentage of the input rows. Vedere Trasformazione Campionamento percentuale.See Percentage Sampling Transformation.

Configurazione della trasformazione Campionamento righeConfiguring the Row Sampling Transformation

La trasformazione Campionamento righe crea un set di dati campione selezionando un numero specificato di righe di input della trasformazione.The Row Sampling transformation creates a sample dataset by selecting a specified number of the transformation input rows. Poiché la selezione delle righe dall'input della trasformazione è casuale, il campione risultante è rappresentativo dell'input.Because the selection of rows from the transformation input is random, the resultant sample is representative of the input. Per determinare la modalità di selezione delle righe da parte della trasformazione, è inoltre possibile specificare il valore di inizializzazione utilizzato dal generatore di numeri casuali.You can also specify the seed that is used by the random number generator, to affect how the transformation selects rows.

Se si utilizza sempre lo stesso valore di inizializzazione per il generatore di numeri casuali sullo stesso input della trasformazione, si otterrà sempre lo stesso output campione.Using the same random seed on the same transformation input always creates the same sample output. Se non viene specificato alcun valore di inizializzazione, per creare il numero casuale la trasformazione utilizzerà il numero di tick del sistema operativo.If no seed is specified, the transformation uses the tick count of the operating system to create the random number. È pertanto possibile utilizzare un valore di inizializzazione costante durante il test per verificare i risultati della trasformazione durante lo sviluppo e il test di un pacchetto e quindi passare all'utilizzo di un valore di inizializzazione casuale quando il pacchetto viene introdotto nell'ambiente di produzione.Therefore, you could use the same seed during testing, to verify the transformation results during the development and testing of the package, and then change to a random seed when the package is moved into production.

La trasformazione Campionamento righe include la proprietà personalizzata SamplingValue ,The Row Sampling transformation includes the SamplingValue custom property. che può essere aggiornata da un'espressione di proprietà al caricamento del pacchetto.This property can be updated by a property expression when the package is loaded. Per altre informazioni, vedere Espressioni di Integration Services (SSIS), Utilizzo delle espressioni di proprietà nei pacchetti e Proprietà personalizzate delle trasformazioni.For more information, see Integration Services (SSIS) Expressions, Use Property Expressions in Packages, and Transformation Custom Properties.

Questa trasformazione include un input e due output.This transformation has one input and two outputs. Non include alcun output degli errori.It has no error output.

È possibile impostare le proprietà tramite Progettazione SSISSSIS o a livello di codice.You can set properties through SSISSSIS Designer or programmatically.

Nella finestra di dialogo Editor avanzato sono disponibili le proprietà che è possibile impostare a livello di codice.The Advanced Editor dialog box reflects the properties that can be set programmatically. Per ulteriori informazioni sulle proprietà che è possibile impostare nella finestra di dialogo Editor avanzato o a livello di codice, fare clic su uno degli argomenti seguenti:For more information about the properties that you can set in the Advanced Editor dialog box or programmatically, click one of the following topics:

Editor trasformazione Campionamento righe (pagina Campionamento)Row Sampling Transformation Editor (Sampling Page)

Utilizzare la finestra di dialogo Editor trasformazione Campionamento righe per dividere parte di un input in un campione utilizzando il numero di righe specificato.Use the Row Sampling Transformation Editor dialog box to split a portion of an input into a sample using a specified number of rows. La trasformazione divide l'input in due output separati.This transformation divides the input into two separate outputs.

OpzioniOptions

Numero di righeNumber of rows
Consente di specificare il numero di righe dell'input da utilizzare come campione.Specify the number of rows from the input to use as a sample.

È possibile specificare il valore di questa proprietà tramite un'espressione di proprietà.The value of this property can be specified by using a property expression.

Nome output campioneSample output name
Consente di specificare un nome univoco per l'output che includerà le righe campionate.Provide a unique name for the output that will include the sampled rows. Il nome specificato verrà visualizzato in Progettazione SSIS.The name provided will be displayed within SSIS Designer.

Nome output non selezionatoUnselected output name
Consente di specificare un nome univoco per l'output che conterrà le righe escluse dal campionamento.Provide a unique name for the output that will contain the rows excluded from the sampling. Il nome specificato verrà visualizzato in Progettazione SSIS.The name provided will be displayed within SSIS Designer.

Usa il valore di inizializzazione casuale seguenteUse the following random seed
Consente di specificare il valore di inizializzazione del campionamento per il generatore di numeri casuali utilizzato dalla trasformazione per creare un campione.Specify the sampling seed for the random number generator that the transformation uses to create a sample. È consigliato solo a scopo di sviluppo e test.This is only recommended for development and testing. Se non viene specificato alcun valore di inizializzazione casuale, la trasformazione utilizza il conteggio tick di Microsoft Windows come valore di inizializzazione.The transformation uses the Microsoft Windows tick count as a seed if a random seed is not specified.

Impostazione delle proprietà di un componente del flusso di datiSet the Properties of a Data Flow Component