CategoryBinarizer 类
转换器从 TimeSeriesDataSet 生成二进制列。
也称为“独热编码”或“虚拟编码”。
- 继承
-
CategoryBinarizer
构造函数
CategoryBinarizer(prefix=None, prefix_sep='_', dummy_na=False, columns=None, encode_all_categoricals=False, drop_first=False)
参数
- prefix
默认值: None
- prefix_sep
默认值: _
- dummy_na
默认值: False
- columns
默认值: None
- encode_all_categoricals
默认值: False
- drop_first
默认值: False
方法
| fit |
在输入数据上拟合二值化。 |
| transform |
通过编码器转换请求的列。 |
fit
在输入数据上拟合二值化。
fit(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet, y: Optional[numpy.ndarray] = None) -> azureml.automl.runtime.featurizer.transformer.timeseries.category_binarizer.CategoryBinarizer
参数
- y
必需
已忽略。 管道兼容性所必需的
返回
拟合转换
返回类型
<xref:azureml.automl.runtime.featurizer.transformer.timeseries.CategoryBinarizer>
transform
通过编码器转换请求的列。
transform(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet, y: Optional[numpy.ndarray] = None) -> azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet
参数
- y
必需
已忽略。 管道兼容性所必需的
返回
使用虚拟编码分类的数据
返回类型
属性
columns
要视为分类的列的名称。
如果 columns=None,则将编码所有具有对象或分类数据类型的列。
columns_in_fit
只读属性,它包含从上次拟合以来编码的列的列表。
在某些情况下,columns_in_fit 和 columns 不同。 例如,如果在调用拟合时,columns=None,拟合将在 columns_in_fit 属性中保存 dtype=object 或 dtype=category 的所有列的列表。 然后,这些列将通过转换进行编码。
反馈
提交和查看相关反馈