featurization_utilities 模块

用于特征提取器的实用程序方法。

函数

does_property_hold_for_featurizer

返回特征提取器是否包含启用了所提供的属性的元素。

does_property_hold_for_featurizer(featurizer: Union[sklearn.pipeline.Pipeline, List[Any]], prop: str) -> bool

参数

featurizer
必需

要检查的特征提取器。

prop
必需

要检查的属性,例如 is_distributable。

返回

布尔标志,指示特征提取器的属性是否为 true。

get_prediction_transform_type

get_prediction_transform_type(featurization_config: Any) -> Any

参数

featurization_config

get_transform_names

以字符串列表形式获取转换名称。

get_transform_names(transforms: Optional[Any] = None) -> List[str]

参数

transforms
默认值: None

返回

转换名称的列表。

get_transformer_column_groups

获取根据转换器参数分组的列列表 :param transformer: 转换器名称 :param columns_to_transform: 使用此转换器进行转换的列列表 :param transformer_params: 参数字典,其中键是转换器名称,值是参数信息 :return: 要一起转换的列组列表

get_transformer_column_groups(transformer: str, columns_to_transform: List[str], transformer_params: Dict[str, Any]) -> List[List[Any]]

参数

transformer
columns_to_transform
transformer_params

get_transformer_factory_method_and_type

get_transformer_factory_method_and_type(transformer: str) -> Optional[Tuple[str, str]]

参数

transformer

get_transformer_params_by_column_names

获取用于针对指定列进行自定义的转换器参数。

get_transformer_params_by_column_names(transformer: str, cols: Optional[List[str]] = None, featurization_config: Optional[Any] = None) -> Dict[str, Any]

参数

transformer
必需

转换器名称。

cols
默认值: None

列名;如果针对所有列进行自定义,则为空列表。

featurization_config
默认值: None

特征化配置对象。

返回

转换器参数设置

get_transformers_method_mappings

get_transformers_method_mappings(transformer_list: List[str]) -> List[Tuple[str, str]]

参数

transformer_list

if_package_exists

检查是否已安装包。

如果存在,则调用包装的函数。 否则,记录错误并返回 None。

if_package_exists(feature_name: str, packages: List[str]) -> Callable[[…], Callable[[…], Optional[ReturnFeaturizerT]]]

参数

feature_name
必需

将根据包可用性启用或禁用的功能名称。

packages
必需

要检查的包

返回

包装的函数调用。

is_transformer_param_overridden

is_transformer_param_overridden(featurization_config: Any) -> Any

参数

featurization_config

log_featurization_config

记录特征化配置的无 PII 部分

打印具有已更新的参数的转换器名称 打印已阻止的转换器的名称

在 update_customized_feature_types() 中实际更新列后,将打印类型被覆盖和删除的列

log_featurization_config(featurization_config: azureml.automl.core.featurization.featurizationconfig.FeaturizationConfig) -> None

参数

featurization_config
必需

skip_featurization

skip_featurization(featurization_setting: Union[str, azureml.automl.core.featurization.featurizationconfig.FeaturizationConfig], is_timeseries: bool = False) -> bool

参数

featurization_setting
is_timeseries
默认值: False

transformer_fnc_to_customer_name

transformer_fnc_to_customer_name(transformer_fnc: str, featurizer_type: str) -> str

参数

transformer_fnc
featurizer_type

transformers_in_blocked_list

transformers_in_blocked_list(transformer_fncs: List[str], blocked_list: List[str]) -> List[str]

参数

transformer_fncs
blocked_list

update_customized_feature_types

update_customized_feature_types(stats_and_column_purposes: List[Tuple[azureml.automl.runtime.stats_computation.raw_stats.RawFeatureStats, str, str]], featurization_config: azureml.automl.core.featurization.featurizationconfig.FeaturizationConfig) -> None

参数

stats_and_column_purposes
featurization_config