CategoryBinarizer 类

转换器从 TimeSeriesDataSet 生成二进制列。

也称为“独热编码”或“虚拟编码”。

继承
CategoryBinarizer

构造函数

CategoryBinarizer(prefix=None, prefix_sep='_', dummy_na=False, columns=None, encode_all_categoricals=False, drop_first=False)

参数

prefix
默认值: None
prefix_sep
默认值: _
dummy_na
默认值: False
columns
默认值: None
encode_all_categoricals
默认值: False
drop_first
默认值: False

方法

fit

在输入数据上拟合二值化。

transform

通过编码器转换请求的列。

fit

在输入数据上拟合二值化。

fit(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet, y: Optional[numpy.ndarray] = None) -> azureml.automl.runtime.featurizer.transformer.timeseries.category_binarizer.CategoryBinarizer

参数

X
DataFrame
必需

输入数据

y
必需

已忽略。 管道兼容性所必需的

返回

拟合转换

返回类型

<xref:azureml.automl.runtime.featurizer.transformer.timeseries.CategoryBinarizer>

transform

通过编码器转换请求的列。

transform(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet, y: Optional[numpy.ndarray] = None) -> azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet

参数

X
DataFrame
必需

输入数据

y
必需

已忽略。 管道兼容性所必需的

返回

使用虚拟编码分类的数据

返回类型

属性

columns

要视为分类的列的名称。

如果 columns=None,则将编码所有具有对象或分类数据类型的列。

columns_in_fit

只读属性,它包含从上次拟合以来编码的列的列表。

在某些情况下,columns_in_fit 和 columns 不同。 例如,如果在调用拟合时,columns=None,拟合将在 columns_in_fit 属性中保存 dtype=object 或 dtype=category 的所有列的列表。 然后,这些列将通过转换进行编码。