Freigeben über


microsoftml.n_gram: konvertiert Text mit N-Grammen in Features

Verwendung

microsoftml.n_gram(ngram_length: numbers.Real = 1,
    skip_length: numbers.Real = 0, all_lengths: bool = True,
    max_num_terms: list = [10000000], weighting: str = 'Tf')

BESCHREIBUNG

Extrahiert N-Gramme aus Text und konvertiert sie mithilfe eines Wörterbuchs in einen Vektor.

Argumente

ngram_length

Länge des N-Gramms (Einstellungen).

skip_length

Maximale Anzahl von Token, die beim Erstellen eines N-Gramms übersprungen werden sollen (Einstellungen).

all_lengths

Gibt an, ob alle N-Grammlängen bis NgramLength oder nur NgramLength eingeschlossen werden sollen (Einstellungen).

max_num_terms

Maximale Anzahl von N-Grammen, die im Wörterbuch gespeichert werden sollen (Einstellungen).

weighting

Die Gewichtungskriterien (Einstellungen).

Siehe auch

n_gram_hash, featurize_text