CountFeatureSelectingEstimator 类

定义

选择非默认值计数大于或等于阈值的槽。

public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
继承
CountFeatureSelectingEstimator
实现

注解

估算器特征

此估算器是否需要查看数据来训练其参数?
输入列数据类型 文本数据类型的SingleDouble向量或标量
输出列数据类型 与输入列相同
可导出到 ONNX

此转换使用一组聚合器来计算每个槽 (向量元素的值数,) 非默认和非缺失 (的默认值和缺失 (,请参阅) 中的 DataKind 备注部分。 如果计数值小于提供的 count 参数,则会删除该槽。 当与 a OneHotHashEncodingTransformer一起应用时,此转换非常有用。 它可以删除哈希转换生成的功能,这些特征在示例中没有数据。

例如,如果将 count 参数设置为 3 并适合估算器,请将转换器应用于以下功能列,则会看到第二个槽,其中包含:NaN (缺失值) 、5、5、0 (默认值) 值被丢弃,因为该槽只有两个非默认值和非缺失值,即这两个 5 个值。 正在保留第三个槽,因为它的值为 6、6、6、NaN;因此,它具有 3 个非默认值和非缺失。

功能
4,NaN,6
4,5,6
4,5,6
4,0,NaN

这是上述数据集在转换后的外观。

功能
4,6
4,6
4,6
4,NaN

有关使用示例的链接,请查看“另请参阅”部分。

方法

Fit(IDataView)

火车并返回一个 ITransformer

GetOutputSchema(SchemaShape)

返回 SchemaShape 由转换器生成的架构。 用于管道中的架构传播和验证。

扩展方法

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

将“缓存检查点”追加到估算器链。 这将确保根据缓存的数据训练下游估算器。 在执行多个数据传递的训练器之前,拥有缓存检查点会很有帮助。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

给定估算器后,返回一个包装对象,该对象将调用委托一次 Fit(IDataView) 。 估算器通常必须返回有关适合的内容的信息,这就是为什么 Fit(IDataView) 该方法返回特定类型化对象的原因,而不仅仅是常规 ITransformer对象。 但是,同时, IEstimator<TTransformer> 通常形成为包含许多对象的管道,因此,我们可能需要通过 EstimatorChain<TLastTransformer> 估算器链生成一个估算器链,以便将转换器埋在此链中的某个位置。 对于该方案,我们可以通过此方法附加一个委托,该委托将在调用拟合后调用。

适用于

另请参阅