Microsoft.ML.Transforms.Text 命名空间

包含文本数据转换组件的命名空间。

CustomStopWordsRemovingEstimator

IEstimator<TTransformer> for the CustomStopWordsRemovingTransformer.

CustomStopWordsRemovingEstimator.Options

使用非索引字删除器,它可以删除特定于语言的非索引字列表, (系统中已定义的最常见单词) 。

CustomStopWordsRemovingTransformer

ITransformer 由拟合 a CustomStopWordsRemovingEstimator.

LatentDirichletAllocationEstimator

LDA 转换实现 LightLDA,这是 Latent Dirichlet Allocation 的最先进的实现。

LatentDirichletAllocationTransformer

ITransformer 由拟合 a LatentDirichletAllocationEstimator.

LatentDirichletAllocationTransformer.ModelParameters

提供有关 LightLDA 发现的主题的详细信息。

NgramExtractingEstimator

生成输入文本中遇到的连续) 单词序列的 n 元元 (序列的向量。

NgramExtractingTransformer

ITransformer 由拟合 a NgramExtractingEstimator.

NgramHashingEstimator

IEstimator<TTransformer> for the NgramHashingTransformer.

NgramHashingTransformer

包含文本数据转换组件的命名空间。

StopWordsRemovingEstimator

IEstimator<TTransformer> for the CustomStopWordsRemovingTransformer.

StopWordsRemovingEstimator.Options

使用非索引字删除器,可以删除特定于语言的非索引字列表, (系统中已定义的最常见单词) 。

StopWordsRemovingTransformer

ITransformer 由拟合 a StopWordsRemovingEstimator.

TextFeaturizingEstimator

一个估算器,可将文本文档集合转换为数值特征向量。 特征向量是基于所提供的选项规范化单词和/或字符 n 元语法) (计数。

TextFeaturizingEstimator.Options

高级选项。TextFeaturizingEstimator

TextNormalizingEstimator

IEstimator<TTransformer> for the TextNormalizingTransformer.

TextNormalizingTransformer

ITransformer 由拟合 a TextNormalizingEstimator.

TokenizingByCharactersEstimator

IEstimator<TTransformer> for the TokenizingByCharactersTransformer.

TokenizingByCharactersTransformer

ITransformer 由拟合 a TokenizingByCharactersEstimator.

WordBagEstimator

IEstimator<TTransformer> for the ITransformer.

WordBagEstimator.Options

有关如何提取 n 元语法的选项。

WordEmbeddingEstimator

文本特征化器,它使用预先训练的嵌入模型将文本标记的向量转换为数值向量。

WordEmbeddingTransformer

ITransformer 由拟合 a WordEmbeddingEstimator.

WordHashBagEstimator

IEstimator<TTransformer> for the ITransformer.

WordTokenizingEstimator

使用指定的分隔符标记输入文本。

WordTokenizingTransformer

ITransformer 由拟合 a WordTokenizingEstimator.

结构

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

包含文本数据转换组件的命名空间。

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

包含文本数据转换组件的命名空间。

接口

IStopWordsRemoverOptions

定义支持的不同类型的非索引字删除器。

枚举

NgramExtractingEstimator.WeightingCriteria

用于评估单词对语料库中的文档的重要性的统计度量值。 此枚举已序列化。

StopWordsRemovingEstimator.Language

非索引字语言。 此枚举已序列化。

TextFeaturizingEstimator.Language

文本语言。 此枚举已序列化。

TextFeaturizingEstimator.NormFunction

文本向量规范化器类型。

TextNormalizingEstimator.CaseMode

文本的规范化模式。 此枚举已序列化。

WordEmbeddingEstimator.PretrainedModelKind

指定要使用的单词嵌入。