Campionamento percentuale - trasformazionePercentage Sampling Transformation

La trasformazione Campionamento percentuale consente di creare un set di dati campione selezionando una percentuale delle righe di input della trasformazione.The Percentage Sampling transformation creates a sample data set by selecting a percentage of the transformation input rows. Il set di dati campione viene ottenuto selezionando casualmente dall'input della trasformazione un numero di righe sufficiente per ottenere un campione rappresentativo dell'input.The sample data set is a random selection of rows from the transformation input, to make the resultant sample representative of the input.

Nota

Oltre alla percentuale specificata, la trasformazione Campionamento percentuale utilizza un algoritmo per determinare quali righe devono essere incluse nell'output campione.In addition to the specified percentage, the Percentage Sampling transformation uses an algorithm to determine whether a row should be included in the sample output. Il numero delle righe nell'output campione potrebbe di conseguenza non corrispondere esattamente alla percentuale specificata.This means that the number of rows in the sample output may not exactly reflect the specified percentage. Se ad esempio si specifica il 10% per un set di dati di input di 25.000 righe, il campione generato potrebbe non includere 2.500 righe, ma alcune righe in più o in meno.For example, specifying 10 percent for an input data set that has 25,000 rows may not generate a sample with 2,500 rows; the sample may have a few more or a few less rows.

La trasformazione Campionamento percentuale è particolarmente utile per il data mining.The Percentage Sampling transformation is especially useful for data mining. Tramite questa trasformazione è possibile suddividere casualmente un set di dati in due set di dati: uno per il training del modello di data mining e uno per il test del modello.By using this transformation, you can randomly divide a data set into two data sets: one for training the data mining model, and one for testing the model.

La trasformazione Campionamento percentuale può essere utilizzata anche per la creazione di set di dati di esempio per lo sviluppo dei pacchetti.The Percentage Sampling transformation is also useful for creating sample data sets for package development. Applicando la trasformazione Campionamento percentuale a un flusso di dati, è possibile ridurre uniformemente le dimensioni di un set di dati, mantenendo tuttavia le caratteristiche dei dati.By applying the Percentage Sampling transformation to a data flow, you can uniformly reduce the size of the data set while preserving its data characteristics. Il pacchetto di test può essere pertanto eseguito più rapidamente, perché utilizza un set di dati più piccolo ma comunque rappresentativo.The test package can then run more quickly because it uses a small, but representative, data set.

Configurazione della trasformazione Campionamento percentualeConfiguration the Percentage Sampling Transformation

È possibile specificare un valore di inizializzazione del campionamento per modificare il comportamento del generatore di numeri casuali utilizzato dalla trasformazione per la selezione delle righe.You can specify a sampling seed to modify the behavior of the random number generator that the transformation uses to select rows. Se si utilizza sempre lo stesso valore di inizializzazione del campionamento, la trasformazione creerà sempre lo stesso output campione.If the same sampling seed is used, the transformation always creates the same sample output. Se non viene specificato alcun valore di inizializzazione, per creare il numero casuale la trasformazione utilizzerà il numero di tick del sistema operativo.If no seed is specified, the transformation uses the tick count of the operating system to create the random number. È pertanto possibile scegliere di utilizzare un valore di inizializzazione standard per verificare i risultati della trasformazione durante lo sviluppo e il test di un pacchetto e quindi passare all'utilizzo di un valore di inizializzazione casuale quando il pacchetto viene introdotto nell'ambiente di produzione.Therefore, you might choose to use a standard seed when you want to verify the transformation results during the development and testing of a package, and then change to use a random seed when the package is moved into production.

Questa trasformazione è simile alla trasformazione Campionamento righe, che crea un set di dati campione selezionando un numero specificato di righe di input.This transformation is similar to the Row Sampling transformation, which creates a sample data set by selecting a specified number of the input rows. Per altre informazioni, vedere Trasformazione Campionamento righe.For more information, see Row Sampling Transformation.

La trasformazione Campionamento percentuale include la proprietà personalizzata SamplingValue ,The Percentage Sampling transformation includes the SamplingValue custom property. che può essere aggiornata da un'espressione di proprietà al caricamento del pacchetto.This property can be updated by a property expression when the package is loaded. Per altre informazioni, vedere Espressioni di Integration Services (SSIS), Utilizzo delle espressioni di proprietà nei pacchetti e Proprietà personalizzate delle trasformazioni.For more information, see Integration Services (SSIS) Expressions, Use Property Expressions in Packages, and Transformation Custom Properties.

Questa trasformazione include un input e due output.The transformation has one input and two outputs. Non supporta un output degli errori.It does not support an error output.

È possibile impostare le proprietà tramite Progettazione SSISSSIS o a livello di codice.You can set properties through SSISSSIS Designer or programmatically.

Nella finestra di dialogo Editor avanzato sono disponibili le proprietà che è possibile impostare a livello di codice.The Advanced Editor dialog box reflects the properties that can be set programmatically. Per ulteriori informazioni sulle proprietà che è possibile impostare nella finestra di dialogo Editor avanzato o a livello di codice, fare clic su uno degli argomenti seguenti:For more information about the properties that you can set in the Advanced Editor dialog box or programmatically, click one of the following topics:

Editor trasformazione Campionamento percentualePercentage Sampling Transformation Editor

Utilizzare la finestra di dialogo Editor trasformazione Campionamento percentuale per dividere parte di un input in un campione utilizzando la percentuale di righe specificata.Use the Percentage Sampling Transformation Editor dialog box to split part of an input into a sample using a specified percentage of rows. La trasformazione divide l'input in due output separati.This transformation divides the input into two separate outputs.

OpzioniOptions

Percentuale di righePercentage of rows
Consente di specificare la percentuale di righe dell'input da utilizzare come campione.Specify the percentage of rows in the input to use as a sample.

È possibile specificare il valore di questa proprietà tramite un'espressione di proprietà.The value of this property can be specified by using a property expression.

Nome output campioneSample output name
Consente di specificare un nome univoco per l'output che includerà le righe campionate.Provide a unique name for the output that will include the sampled rows. Il nome specificato verrà visualizzato in Progettazione SSISSSIS .The name provided will be displayed within the SSISSSIS Designer.

Nome output non selezionatoUnselected output name
Consente di specificare un nome univoco per l'output che conterrà le righe escluse dal campionamento.Provide a unique name for the output that will contain the rows excluded from the sampling. Il nome specificato verrà visualizzato in Progettazione SSISSSIS .The name provided will be displayed within the SSISSSIS Designer.

Usa il valore di inizializzazione casuale seguenteUse the following random seed
Consente di specificare il valore di inizializzazione del campionamento per il generatore di numeri casuali utilizzato dalla trasformazione per creare un campione.Specify the sampling seed for the random number generator that the transformation uses to create a sample. È consigliato solo a scopo di sviluppo e test.This is only recommended for development and testing. Se non viene specificato alcun valore di inizializzazione casuale, la trasformazione utilizza il conteggio tick di Microsoft Windows.The transformation uses the Microsoft Windows tick count if a random seed is not specified.