microsoftml.n_gram: convierte texto en características mediante n-gramas
Uso
microsoftml.n_gram(ngram_length: numbers.Real = 1,
skip_length: numbers.Real = 0, all_lengths: bool = True,
max_num_terms: list = [10000000], weighting: str = 'Tf')
Descripción
Extrae n-gramas de texto y los convierte en vectores mediante el diccionario.
Argumentos
ngram_length
Longitud de los n-gramas (configuración).
skip_length
Número máximo de tokens que se omitirán al construir un n-grama (configuración).
all_lengths
Indica si deben incluirse todas las longitudes de n-grama hasta NgramLength o solo NgramLength (configuración).
max_num_terms
Número máximo de n-gramas que se almacenarán en el diccionario (configuración).
weighting
Criterios de ponderación (configuración).
Vea también
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de