Share via


microsoftml.n_gram: convierte texto en características mediante n-gramas

Uso

microsoftml.n_gram(ngram_length: numbers.Real = 1,
    skip_length: numbers.Real = 0, all_lengths: bool = True,
    max_num_terms: list = [10000000], weighting: str = 'Tf')

Descripción

Extrae n-gramas de texto y los convierte en vectores mediante el diccionario.

Argumentos

ngram_length

Longitud de los n-gramas (configuración).

skip_length

Número máximo de tokens que se omitirán al construir un n-grama (configuración).

all_lengths

Indica si deben incluirse todas las longitudes de n-grama hasta NgramLength o solo NgramLength (configuración).

max_num_terms

Número máximo de n-gramas que se almacenarán en el diccionario (configuración).

weighting

Criterios de ponderación (configuración).

Vea también

n_gram_hash, featurize_text