VerifierManager 类
- 继承
-
builtins.objectVerifierManager
构造函数
VerifierManager()
方法
| add_data_fault |
向错误字典添加错误。 data_faults_dict 包含数据错误及其验证结果的列表。 有关 AutoML 验证的可能数据错误,请参阅 VerifiedFaultsTypes。 :param 错误名称:数据错误的名称 :param 结果:错误验证的结果 :param 参数:要与错误 :param 一起显示的其他参数 is_child_run_specific:此错误是否特定于子运行 :return: |
| add_data_fault_parameter | |
| change_data_fault_result |
更改一个特定数据错误的状态。 如果错误不存在,将会引发。 |
| get_elaborate_dicts | |
| has_fault_member | |
| update_data_verifier_aggregation |
添加数据聚合护栏。 |
| update_data_verifier_for_class_balancing_validation |
检测类不平衡并使用错误更新 VerifierManager 对象。 |
| update_data_verifier_for_cv |
使用交叉验证中的折叠数更新 VerifierManager 对象数据错误。 |
| update_data_verifier_for_high_cardinal_features |
检测 DataTransformer 中的高基数功能,并使用错误更新 VerifierManager 对象。 |
| update_data_verifier_for_missing_values |
检测 DataTransformer 中的缺失值输入,并更新 VerifierManager 对象的缺失值策略。 并通过转换为稀疏矩阵 :return 进行处理:无 |
| update_data_verifier_for_missing_values_dataframe |
使用数据帧和特征化配置中的缺失值更新数据验证程序。 |
| update_data_verifier_for_train_test_validation |
使用训练/测试采样率更新 VerifierManager 对象数据错误。 |
| update_data_verifier_frequency_inference |
检测是否推断出了数据的频率,以及数据是否据此进行了分类。 |
| update_data_verifier_lookback_feature |
检测是否由于内存限制删除了回看功能。 |
| update_data_verifier_short_grain_handling |
检测数据集是否包含短粒度且已得到更正。 |
| update_data_verifier_time_series_id_detection_handling |
检测数据集是否有时序标识符。 |
| write_result_file |
add_data_fault
向错误字典添加错误。
data_faults_dict 包含数据错误及其验证结果的列表。 有关 AutoML 验证的可能数据错误,请参阅 VerifiedFaultsTypes。 :param 错误名称:数据错误的名称 :param 结果:错误验证的结果 :param 参数:要与错误 :param 一起显示的其他参数 is_child_run_specific:此错误是否特定于子运行 :return:
add_data_fault(fault_name: str, result: str, parameters: Optional[List[Dict[str, Any]]] = None, is_child_run_specific: Optional[bool] = False) -> None
参数
- fault_name
- result
- parameters
- is_child_run_specific
add_data_fault_parameter
add_data_fault_parameter(fault_name: str, parameters: Dict[str, str]) -> None
参数
- fault_name
- parameters
change_data_fault_result
更改一个特定数据错误的状态。 如果错误不存在,将会引发。
change_data_fault_result(fault_name: str, to_result: str) -> None
参数
- fault_name
错误的名称。
- to_result
新状态。
get_elaborate_dicts
get_elaborate_dicts(friendly_desc: Dict[str, Any]) -> List[Any]
参数
- friendly_desc
has_fault_member
has_fault_member(fault_name: str) -> bool
参数
- fault_name
update_data_verifier_aggregation
添加数据聚合护栏。
update_data_verifier_aggregation(data_corrected: bool, aggregation_function: str, freqstr: str) -> None
参数
- data_corrected
如果更正了数据,显示标记。
- aggregation_function
用于聚合的函数。
- freqstr
用于聚合时序的预测频率。
update_data_verifier_for_class_balancing_validation
检测类不平衡并使用错误更新 VerifierManager 对象。
update_data_verifier_for_class_balancing_validation(enable_class_balancing: bool, class_balancing_fixed: bool, size_of_smallest_class: int, name_of_smallest_class: str, num_of_samples: int) -> None
参数
- enable_class_balancing
布尔值显示是否进行重新采样
- min_size_of_class
最小类中的样本数
- size_of_smallest_class
- name_of_smallest_class
- num_of_samples
返回
无
update_data_verifier_for_cv
使用交叉验证中的折叠数更新 VerifierManager 对象数据错误。
update_data_verifier_for_cv(number_of_folds: int) -> None
参数
- number_of_folds
交叉验证中的折叠数。
返回
无
update_data_verifier_for_high_cardinal_features
检测 DataTransformer 中的高基数功能,并使用错误更新 VerifierManager 对象。
update_data_verifier_for_high_cardinal_features(stats_and_column_purpose: Optional[List[Tuple[azureml.automl.runtime.stats_computation.raw_stats.RawFeatureStats, str, str]]]) -> None
参数
- stats_and_column_purpose
有关数据转换器中列的统计信息和其他信息。
返回
无
update_data_verifier_for_missing_values
检测 DataTransformer 中的缺失值输入,并更新 VerifierManager 对象的缺失值策略。
并通过转换为稀疏矩阵 :return 进行处理:无
update_data_verifier_for_missing_values(data_transformer: Optional[azureml.automl.runtime.featurization.data_transformer.DataTransformer] = None, verifier_result: Optional[str] = None) -> None
参数
- data_transformer
DataTransformer 对象。
- verifier_result
缺失值验证的结果
update_data_verifier_for_missing_values_dataframe
使用数据帧和特征化配置中的缺失值更新数据验证程序。
update_data_verifier_for_missing_values_dataframe(input_df: pandas.core.frame.DataFrame, numerical_columns: List[str], featurization_config: Optional[azureml.automl.core.featurization.featurizationconfig.FeaturizationConfig] = None, drop_column_names: Optional[List[str]] = None) -> None
参数
- input_df
输入数据帧。
- numerical_columns
错误验证程序中会包含的所有列名。
- featurization_config
包含所有自定义特征化程序的特征化配置。
- drop_column_names
训练中不会考虑的所有列名。
update_data_verifier_for_train_test_validation
使用训练/测试采样率更新 VerifierManager 对象数据错误。
update_data_verifier_for_train_test_validation(train_row_count: int, test_row_count: int) -> None
参数
- train_row_count
训练集内的样本计数。
- test_row_count
验证集内的样本计数。
返回
无
update_data_verifier_frequency_inference
检测是否推断出了数据的频率,以及数据是否据此进行了分类。
update_data_verifier_frequency_inference(inference_failed: bool, data_corrected: bool) -> None
参数
- inference_failed
如果为 True,则无需输出临界滑轨。
- data_corrected
如果为 True,根据检测到的频率更正了数据。
update_data_verifier_lookback_feature
检测是否由于内存限制删除了回看功能。
update_data_verifier_lookback_feature(lags: bool, rw: bool, passed: bool) -> None
参数
- lags
如果为 true,需要滞后功能。
- rw
如果为 true,需要滚动窗口功能。
- passed
返回
无
update_data_verifier_short_grain_handling
检测数据集是否包含短粒度且已得到更正。
update_data_verifier_short_grain_handling(padded: List[Union[Tuple[str], str, List[str]]], dropped: List[Union[Tuple[str], str, List[str]]]) -> None
参数
- padded
由填充修补的短序列的列表。
- dropped
删除的短序列的列表。
- grain_names
已处理的粒度的名称。
update_data_verifier_time_series_id_detection_handling
检测数据集是否有时序标识符。
update_data_verifier_time_series_id_detection_handling(time_series_id_column_names: List[str], duplicate_num: int, is_time_series_id_column_names_detected: bool) -> None
参数
- time_series_id_column_names
time_series_id_column_name 的列表。 要么是用户定义的,要么是自动检测到的。
- duplicate_num
数据中重复的时间索引行的数量。
- is_time_series_id_column_names_detected
如果在数据集中自动检测到 time_series_id_column_names,则为 true。
write_result_file
write_result_file(run_context: azureml.automl.runtime.automl_run_context.AutoMLAbstractRunContext, remote_path: str = '', working_directory: Optional[str] = None) -> None
参数
- run_context
- remote_path
- working_directory
属性
data_faults_names
PACKAGE_NAME
PACKAGE_NAME = 'azureml.automl.runtime'
REFERENCE_FILE_PATH
REFERENCE_FILE_PATH = 'C:\\hostedtoolcache\\windows\\Python\\3.7.9\\x64\\lib\\site-packages\\azureml\\automl\\runtime\\faults_verifier_message.json'
反馈
提交和查看相关反馈