OneHotHashEncodingEstimator Clase

Definición

Convierte una o varias columnas de entrada de valores categóricos en tantas columnas de salida de vectores codificados uno en caliente basados en hash.

public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
    interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
Herencia
OneHotHashEncodingEstimator
Implementaciones

Comentarios

Características del estimador

¿Este estimador necesita examinar los datos para entrenar sus parámetros?
Tipo de datos de columna de entrada Escalar o vector de tipo numérico, booleano, de texto o de clave .
Tipo de datos de columna de salida Escalar o vector de clave o vector de Single tipo.
Exportable a ONNX No

El resultado OneHotEncodingTransformer convierte una o varias columnas de entrada en tantas columnas de salida de vectores codificados con un solo acceso, donde la indexación se realiza mediante el algoritmo hash del valor y el uso del hash como índice.

OneHotEncodingEstimator a menudo se usa para convertir datos categóricos en un formulario que se puede proporcionar a un algoritmo de aprendizaje automático.

La salida de esta transformación se especifica mediante OneHotEncodingEstimator.OutputKind:

  • Indicator genera un vector de indicador. Cada ranura de este vector corresponde a una categoría del diccionario, por lo que su longitud es el tamaño del diccionario que se ha creado. Si no se encuentra un valor en el diccionario, la salida es el vector cero.

  • Bag genera un vector de modo que cada ranura almacena el número de repeticiones del valor correspondiente en el vector de entrada. Cada ranura de este vector corresponde a un valor del diccionario, por lo que su longitud es el tamaño del diccionario compilado. Indicator y Bag difieren simplemente en cómo se agregan los vectores de bits generados a partir de ranuras individuales de la columna de entrada: para Indicador se concatenan y para Bag se agregan. Cuando la columna de origen es escalar, las opciones Indicador y Bolsa son idénticas.

  • Key genera claves en una KeyDataViewType columna. Si la columna de entrada es un vector, la salida contiene un tipo de clave vectorial, donde cada ranura del vector corresponde a la ranura correspondiente del vector de entrada. Si no se encuentra una categoría en el diccionario compilado, se le asigna el valor cero.

  • Binary genera un vector codificado binario para representar los valores que se encuentran en el diccionario que están presentes en la columna de entrada. Si no se encuentra un valor en la columna de entrada en el diccionario, la salida es el vector cero.

OneHotEncodingTransformer se puede aplicar a una o varias columnas, en cuyo caso compila y usa un diccionario independiente para cada columna a la que se aplica.

Consulte la sección Consulte también los vínculos a ejemplos de uso.

Métodos

Fit(IDataView)

Entrena y devuelve un OneHotHashEncodingTransformer.

GetOutputSchema(SchemaShape)

Devuelve el SchemaShape valor del esquema que generará el transformador. Se usa para la propagación y comprobación de esquemas en una canalización.

Métodos de extensión

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Anexe un "punto de control de almacenamiento en caché" a la cadena del estimador. Esto garantizará que los estimadores de nivel inferior se entrenarán con los datos almacenados en caché. Resulta útil tener un punto de control de almacenamiento en caché antes de que los instructores tomen varios pases de datos.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dado un estimador, devuelva un objeto de ajuste que llamará a un delegado una vez Fit(IDataView) que se llame. A menudo, es importante que un estimador devuelva información sobre lo que cabe, por lo que el Fit(IDataView) método devuelve un objeto con tipo específico, en lugar de simplemente un general ITransformer. Sin embargo, al mismo tiempo, IEstimator<TTransformer> a menudo se forman en canalizaciones con muchos objetos, por lo que es posible que tengamos que crear una cadena de estimadores a través EstimatorChain<TLastTransformer> de donde el estimador para el que queremos obtener el transformador está enterrado en algún lugar de esta cadena. En ese escenario, podemos a través de este método adjuntar un delegado al que se llamará una vez que se llame a fit.

Se aplica a

Consulte también