OneHotEncodingEstimator Classe

Definizione

Converte una o più colonne di input di valori categorici in tutte le colonne di output di vettori con codifica one-hot.

public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
    interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
Ereditarietà
OneHotEncodingEstimator
Implementazioni

Commenti

Caratteristiche dello strumento di stima

Questo strumento di stima deve esaminare i dati per eseguire il training dei relativi parametri?
Tipo di dati della colonna di input Vettore o scalare di tipo numerico, booleano, DateTimetesto o chiave.
Tipo di dati della colonna di output Scalare o vettore di chiave o vettore di Single tipo .
Esportabile in ONNX

Compila OneHotEncodingEstimator un dizionario di valori univoci visualizzati nella colonna di input. L'oggetto risultante OneHotEncodingTransformer converte una o più colonne di input in tutte le colonne di output di vettori con codifica one-hot.

Viene OneHotEncodingEstimator spesso usato per convertire i dati categorici in un modulo che può essere fornito a un algoritmo di Machine Learning.

L'output di questa trasformazione viene specificato da OneHotEncodingEstimator.OutputKind:

  • Indicator produce un vettore di indicatore. Ogni slot in questo vettore corrisponde a una categoria nel dizionario, quindi la sua lunghezza è la dimensione del dizionario compilato. Se un valore non viene trovato nel dictioray, l'output è il vettore zero.

  • Bag produce un vettore in modo che ogni slot archivii il numero di occorrenze del valore corrispondente nel vettore di input. Ogni slot in questo vettore corrisponde a un valore nel dizionario, quindi la sua lunghezza è la dimensione del dizionario compilato. Indicator e Bag differiscono semplicemente nel modo in cui i vettori di bit generati dai singoli slot nella colonna di input vengono aggregati: per Indicatore vengono concatenati e per Bag vengono aggiunti. Quando la colonna di origine è scalare, le opzioni Indicatore e Contenitore sono identiche.

  • Key produce chiavi in una KeyDataViewType colonna. Se la colonna di input è un vettore, l'output contiene un tipo di chiave vettoriale, dove ogni slot del vettore corrisponde al rispettivo slot del vettore di input. Se non viene trovata una categoria nel dizionario bulit, viene assegnato il valore zero.

  • Binary produce un vettore con codifica binaria per rappresentare i valori trovati nel dizionario presenti nella colonna di input. Se un valore nella colonna di input non viene trovato nel dizionario, l'output è il vettore zero.

OneHotEncodingTransformer può essere applicato a una o più colonne, nel qual caso compila e usa un dizionario separato per ogni colonna a cui viene applicato.

Vedere la sezione Vedere anche i collegamenti agli esempi di utilizzo.

Metodi

Fit(IDataView)

Esegue il training e restituisce un oggetto OneHotEncodingTransformer.

GetOutputSchema(SchemaShape)

Restituisce l'oggetto SchemaShape dello schema che verrà prodotto dal trasformatore. Usato per la propagazione e la verifica dello schema in una pipeline.

Metodi di estensione

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training in base ai dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima che i formatori eseseguono più passaggi di dati.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dato un estimator, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. È spesso importante che uno strumento di stima restituisca informazioni sull'adattamento, motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> vengono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di estimatori tramite EstimatorChain<TLastTransformer> dove lo strumento di stima per il quale si vuole ottenere il trasformatore è sepolto in una posizione in questa catena. Per questo scenario, è possibile collegare un delegato che verrà chiamato una volta chiamato fit.

Si applica a

Vedi anche