data_transformer_utils 模块

函数

generate_new_column_names

生成新的列前缀,以在工程特征名称中使用。 如果用户未指定列名称,则将生成格式为“C”的列名称,其中“索引”为递增模式。

generate_new_column_names(columns: List[str]) -> Tuple[List[str], List[str]]

参数

columns
必需

输入列名称。

返回

原始特征名称和新列名称的元组。

get_feature_that_avoids_refitting

返回将导致跳过拟合的所提供特征的副本。 默认情况下,DataFrameMapper 对具有 NoneType 转换器列表的特征执行此操作,因此我们将只替换该列表。

get_feature_that_avoids_refitting(feature: Tuple[Union[str, List[str]], List[sklearn.base.TransformerMixin], Dict[str, str]]) -> Tuple[Union[str, List[str]], None, Dict[str, str]]

参数

feature
必需

要跳过的特征。

返回

特征的副本(修改为跳过)。

get_pandas_columns_types_mapping

get_pandas_columns_types_mapping(df: pandas.core.frame.DataFrame) -> Dict[str, numpy.dtype]

参数

df