Microsoft.ML.Transforms.Text Spazio dei nomi

Spazio dei nomi contenente componenti di trasformazione dati di testo.

Classi

CustomStopWordsRemovingEstimator

IEstimator<TTransformer>per .CustomStopWordsRemovingTransformer

CustomStopWordsRemovingEstimator.Options

Usare l'utilità di rimozione delle parole di arresto che può rimuovere un elenco specifico della lingua delle parole di arresto (parole più comuni) già definite nel sistema.

CustomStopWordsRemovingTransformer

ITransformer risultante dall'adattamento di un CustomStopWordsRemovingEstimatoroggetto .

LatentDirichletAllocationEstimator

La trasformazione LDA implementa LightLDA, un'implementazione all'avanguardia dell'allocazione di Dirichlet latente.

LatentDirichletAllocationTransformer

ITransformer risultante dall'adattamento di un LatentDirichletAllocationEstimatoroggetto .

LatentDirichletAllocationTransformer.ModelParameters

Fornire informazioni dettagliate sugli argomenti individuati da LightLDA.

NgramExtractingEstimator

Produce un vettore di conteggi di n-grammi (sequenze di parole consecutive) rilevate nel testo di input.

NgramExtractingTransformer

ITransformer risultante dall'adattamento di un NgramExtractingEstimatoroggetto .

NgramHashingEstimator

IEstimator<TTransformer>per .NgramHashingTransformer

NgramHashingTransformer

Spazio dei nomi contenente componenti di trasformazione dati di testo.

StopWordsRemovingEstimator

IEstimator<TTransformer>per .CustomStopWordsRemovingTransformer

StopWordsRemovingEstimator.Options

Usare l'utilità di rimozione delle parole di arresto che possono rimuovere un elenco specifico della lingua delle parole di arresto (parole più comuni) già definite nel sistema.

StopWordsRemovingTransformer

ITransformer risultante dall'adattamento di un StopWordsRemovingEstimatoroggetto .

TextFeaturizingEstimator

Uno strumento di stima che trasforma una raccolta di documenti di testo in vettori di funzionalità numerici. I vettori di funzionalità sono conteggi normalizzati di parole e/o caratteri n-grammi (in base alle opzioni fornite).

TextFeaturizingEstimator.Options

Opzioni avanzate per .TextFeaturizingEstimator

TextNormalizingEstimator

IEstimator<TTransformer>per .TextNormalizingTransformer

TextNormalizingTransformer

ITransformer risultante dall'adattamento di un TextNormalizingEstimatoroggetto .

TokenizingByCharactersEstimator

IEstimator<TTransformer>per .TokenizingByCharactersTransformer

TokenizingByCharactersTransformer

ITransformer risultante dall'adattamento di un TokenizingByCharactersEstimatoroggetto .

WordBagEstimator

IEstimator<TTransformer>per .ITransformer

WordBagEstimator.Options

Opzioni per il modo in cui vengono estratti i n-grammi.

WordEmbeddingEstimator

Funzionalità di testo che converte i vettori di token di testo in un vettore numerico usando un modello di incorporamento pre-sottoposto a training.

WordEmbeddingTransformer

ITransformer risultante dall'adattamento di un WordEmbeddingEstimatoroggetto .

WordHashBagEstimator

IEstimator<TTransformer>per .ITransformer

WordTokenizingEstimator

Tokenzza il testo di input usando delimitatori specificati.

WordTokenizingTransformer

ITransformer risultante dall'adattamento di un WordTokenizingEstimatoroggetto .

Struct

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

Spazio dei nomi contenente componenti di trasformazione dati di testo.

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

Spazio dei nomi contenente componenti di trasformazione dati di testo.

Interfacce

IStopWordsRemoverOptions

Definisce il diverso tipo di parole di arresto supportate.

Enumerazioni

NgramExtractingEstimator.WeightingCriteria

Misura statistica usata per valutare l'importanza di una parola in un documento in un corpus. Questa enumerazione viene serializzata.

StopWordsRemovingEstimator.Language

Lingua di parole non significative. Questa enumerazione viene serializzata.

TextFeaturizingEstimator.Language

Lingua di testo. Questa enumerazione viene serializzata.

TextFeaturizingEstimator.NormFunction

Tipo normalizzatore del vettore di testo.

TextNormalizingEstimator.CaseMode

Modalità di normalizzazione delle maiuscole e minuscole del testo. Questa enumerazione viene serializzata.

WordEmbeddingEstimator.PretrainedModelKind

Specifica quali parole incorporano da usare.