VerifierManager 类

继承
builtins.object
VerifierManager

构造函数

VerifierManager()

方法

add_data_fault

向错误字典添加错误。

data_faults_dict 包含数据错误及其验证结果的列表。 有关 AutoML 验证的可能数据错误,请参阅 VerifiedFaultsTypes。 :param 错误名称:数据错误的名称 :param 结果:错误验证的结果 :param 参数:要与错误 :param 一起显示的其他参数 is_child_run_specific:此错误是否特定于子运行 :return:

add_data_fault_parameter
change_data_fault_result

更改一个特定数据错误的状态。 如果错误不存在,将会引发。

get_elaborate_dicts
has_fault_member
update_data_verifier_aggregation

添加数据聚合护栏。

update_data_verifier_for_class_balancing_validation

检测类不平衡并使用错误更新 VerifierManager 对象。

update_data_verifier_for_cv

使用交叉验证中的折叠数更新 VerifierManager 对象数据错误。

update_data_verifier_for_high_cardinal_features

检测 DataTransformer 中的高基数功能,并使用错误更新 VerifierManager 对象。

update_data_verifier_for_missing_values

检测 DataTransformer 中的缺失值输入,并更新 VerifierManager 对象的缺失值策略。

并通过转换为稀疏矩阵 :return 进行处理:无

update_data_verifier_for_missing_values_dataframe

使用数据帧和特征化配置中的缺失值更新数据验证程序。

update_data_verifier_for_train_test_validation

使用训练/测试采样率更新 VerifierManager 对象数据错误。

update_data_verifier_frequency_inference

检测是否推断出了数据的频率,以及数据是否据此进行了分类。

update_data_verifier_lookback_feature

检测是否由于内存限制删除了回看功能。

update_data_verifier_short_grain_handling

检测数据集是否包含短粒度且已得到更正。

update_data_verifier_time_series_id_detection_handling

检测数据集是否有时序标识符。

write_result_file

add_data_fault

向错误字典添加错误。

data_faults_dict 包含数据错误及其验证结果的列表。 有关 AutoML 验证的可能数据错误,请参阅 VerifiedFaultsTypes。 :param 错误名称:数据错误的名称 :param 结果:错误验证的结果 :param 参数:要与错误 :param 一起显示的其他参数 is_child_run_specific:此错误是否特定于子运行 :return:

add_data_fault(fault_name: str, result: str, parameters: Optional[List[Dict[str, Any]]] = None, is_child_run_specific: Optional[bool] = False) -> None

参数

fault_name
必需
result
必需
parameters
默认值: None
is_child_run_specific
默认值: False

add_data_fault_parameter

add_data_fault_parameter(fault_name: str, parameters: Dict[str, str]) -> None

参数

fault_name
必需
parameters
必需

change_data_fault_result

更改一个特定数据错误的状态。 如果错误不存在,将会引发。

change_data_fault_result(fault_name: str, to_result: str) -> None

参数

fault_name
必需

错误的名称。

to_result
必需

新状态。

get_elaborate_dicts

get_elaborate_dicts(friendly_desc: Dict[str, Any]) -> List[Any]

参数

friendly_desc
必需

has_fault_member

has_fault_member(fault_name: str) -> bool

参数

fault_name
必需

update_data_verifier_aggregation

添加数据聚合护栏。

update_data_verifier_aggregation(data_corrected: bool, aggregation_function: str, freqstr: str) -> None

参数

data_corrected
必需

如果更正了数据,显示标记。

aggregation_function
必需

用于聚合的函数。

freqstr
必需

用于聚合时序的预测频率。

update_data_verifier_for_class_balancing_validation

检测类不平衡并使用错误更新 VerifierManager 对象。

update_data_verifier_for_class_balancing_validation(enable_class_balancing: bool, class_balancing_fixed: bool, size_of_smallest_class: int, name_of_smallest_class: str, num_of_samples: int) -> None

参数

enable_class_balancing
必需

布尔值显示是否进行重新采样

min_size_of_class
必需

最小类中的样本数

size_of_smallest_class
必需
name_of_smallest_class
必需
num_of_samples
必需

返回

update_data_verifier_for_cv

使用交叉验证中的折叠数更新 VerifierManager 对象数据错误。

update_data_verifier_for_cv(number_of_folds: int) -> None

参数

number_of_folds
必需

交叉验证中的折叠数。

返回

update_data_verifier_for_high_cardinal_features

检测 DataTransformer 中的高基数功能,并使用错误更新 VerifierManager 对象。

update_data_verifier_for_high_cardinal_features(stats_and_column_purpose: Optional[List[Tuple[azureml.automl.runtime.stats_computation.raw_stats.RawFeatureStats, str, str]]]) -> None

参数

stats_and_column_purpose
必需

有关数据转换器中列的统计信息和其他信息。

返回

update_data_verifier_for_missing_values

检测 DataTransformer 中的缺失值输入,并更新 VerifierManager 对象的缺失值策略。

并通过转换为稀疏矩阵 :return 进行处理:无

update_data_verifier_for_missing_values(data_transformer: Optional[azureml.automl.runtime.featurization.data_transformer.DataTransformer] = None, verifier_result: Optional[str] = None) -> None

参数

data_transformer
默认值: None

DataTransformer 对象。

verifier_result
默认值: None

缺失值验证的结果

update_data_verifier_for_missing_values_dataframe

使用数据帧和特征化配置中的缺失值更新数据验证程序。

update_data_verifier_for_missing_values_dataframe(input_df: pandas.core.frame.DataFrame, numerical_columns: List[str], featurization_config: Optional[azureml.automl.core.featurization.featurizationconfig.FeaturizationConfig] = None, drop_column_names: Optional[List[str]] = None) -> None

参数

input_df
必需

输入数据帧。

numerical_columns
必需

错误验证程序中会包含的所有列名。

featurization_config
默认值: None

包含所有自定义特征化程序的特征化配置。

drop_column_names
默认值: None

训练中不会考虑的所有列名。

update_data_verifier_for_train_test_validation

使用训练/测试采样率更新 VerifierManager 对象数据错误。

update_data_verifier_for_train_test_validation(train_row_count: int, test_row_count: int) -> None

参数

train_row_count
必需

训练集内的样本计数。

test_row_count
必需

验证集内的样本计数。

返回

update_data_verifier_frequency_inference

检测是否推断出了数据的频率,以及数据是否据此进行了分类。

update_data_verifier_frequency_inference(inference_failed: bool, data_corrected: bool) -> None

参数

inference_failed
必需

如果为 True,则无需输出临界滑轨。

data_corrected
必需

如果为 True,根据检测到的频率更正了数据。

update_data_verifier_lookback_feature

检测是否由于内存限制删除了回看功能。

update_data_verifier_lookback_feature(lags: bool, rw: bool, passed: bool) -> None

参数

lags
必需

如果为 true,需要滞后功能。

rw
必需

如果为 true,需要滚动窗口功能。

passed
必需

返回

update_data_verifier_short_grain_handling

检测数据集是否包含短粒度且已得到更正。

update_data_verifier_short_grain_handling(padded: List[Union[Tuple[str], str, List[str]]], dropped: List[Union[Tuple[str], str, List[str]]]) -> None

参数

padded
必需

由填充修补的短序列的列表。

dropped
必需

删除的短序列的列表。

grain_names
必需

已处理的粒度的名称。

update_data_verifier_time_series_id_detection_handling

检测数据集是否有时序标识符。

update_data_verifier_time_series_id_detection_handling(time_series_id_column_names: List[str], duplicate_num: int, is_time_series_id_column_names_detected: bool) -> None

参数

time_series_id_column_names
必需

time_series_id_column_name 的列表。 要么是用户定义的,要么是自动检测到的。

duplicate_num
必需

数据中重复的时间索引行的数量。

is_time_series_id_column_names_detected
必需

如果在数据集中自动检测到 time_series_id_column_names,则为 true。

write_result_file

write_result_file(run_context: azureml.automl.runtime.automl_run_context.AutoMLAbstractRunContext, remote_path: str = '', working_directory: Optional[str] = None) -> None

参数

run_context
必需
remote_path
working_directory
默认值: None

属性

data_faults_names

PACKAGE_NAME

PACKAGE_NAME = 'azureml.automl.runtime'

REFERENCE_FILE_PATH

REFERENCE_FILE_PATH = 'C:\\hostedtoolcache\\windows\\Python\\3.7.9\\x64\\lib\\site-packages\\azureml\\automl\\runtime\\faults_verifier_message.json'