forecasting_heuristic_utils 模块
用于推断自动功能的实用程序。
函数
analyze_pacf_one_grain
输出建议的滞后 (p) 和滚动窗口 (k) 设置
输入:具有一列和基于时间的索引的数据帧
analyze_pacf_one_grain(series: pandas.core.series.Series) -> Tuple[Optional[int], Optional[int]]
参数
- series
analyze_pacf_per_grain
分析数据帧中的所有粒度并建议滞后和 RW 设置
analyze_pacf_per_grain(dataframe: pandas.core.frame.DataFrame, time_colname: str, target_colname: str, grain_colnames: Optional[Union[str, List[str]]] = None, max_grains: int = 100) -> Tuple[int, int]
参数
- dataframe
列中具有时间索引的数据帧。
- time_colname
时间列名称。
- grain_colnames
粒度列名称(如果有)。
- target_colname
目标列名称。
- max_grains
返回
滞后和 RW 设置。
auto_cv_one_series
输出建议的 cv 设置(n_cross_validations 和 cv_step_size)
输入:具有一列和基于时间的索引的数据帧
auto_cv_one_series(grain_length: int, max_horizon: int, lags: List[int], window_size: int, n_cross_validations: Union[int, str], cv_step_size: Union[int, str], freq: Optional[str] = None) -> Tuple[int, int]
参数
- grain_length
- max_horizon
- lags
- window_size
- n_cross_validations
- cv_step_size
- freq
auto_cv_per_series
根据数据帧中的所有粒度建议 n_cross_validations 和 cv_step_size 以及 short_grain_handling 设置。
auto_cv_per_series(dataframe: pandas.core.frame.DataFrame, time_colname: str, target_colname: str, max_horizon: int, lags: List[int], window_size: int, n_cross_validations: Union[int, str], cv_step_size: Union[int, str], short_grain_handling_config: Optional[str], freq: Optional[str] = None, grain_colnames: Optional[Union[str, List[str]]] = None) -> Tuple[int, int]
参数
- dataframe
列中具有时间索引的数据帧。
- time_colname
时间列名称。
- grain_colnames
粒度列名称(如果有)。
- target_colname
目标列名称。
- lags
- window_size
- n_cross_validations
- cv_step_size
- short_grain_handling_config
- freq
- grain_colnames
返回
n_cross_validations 和 cv_step_size。
frequency_based_lags
返回应添加到滞后列表的基于频率的滞后。
如果无法估算滞后,则返回 0。 :param freq: 应确定滞后的频率。 :return: 给定频率的滞后值或 0。
frequency_based_lags(freq: pandas._libs.tslibs.offsets.DateOffset) -> int
参数
- freq
get_frequency_safe
确定时间索引的频率。
get_frequency_safe(time_index: Any) -> pandas._libs.tslibs.offsets.DateOffset
参数
- time_index
索引,需要确定频率。
返回
频率值。
get_heuristic_max_horizon
估算给定数据帧的启发式最大范围。
注意:如果无法建立频率,则将返回默认值。 :param data: 用于估算启发式的数据帧。 :time_colname: 时间列的名称。
get_heuristic_max_horizon(data: pandas.core.frame.DataFrame, time_colname: str, grain_column_names: Optional[List[str]]) -> int
参数
- data
- time_colname
- grain_column_names
timedelta_to_freq_safe
将 pd.Timedelta 安全地转换为 pd.DateOffset
timedelta_to_freq_safe(delta: pandas._libs.tslibs.timedeltas.Timedelta) -> pandas._libs.tslibs.offsets.DateOffset
参数
- delta
timedelta。
try_get_auto_parameters
返回应以启发式估算的参数。
现在为 2022/01/28,它包含滞后、window_size、max_horizon、n_cross_validations 和 cv_step_size。 :param automl_settings: 运行的设置。 :param X: 输入数据帧。 如果输入类型不是数据帧,则不会估算启发式。 :param y: 预期的数据。 :return: 元组,包含滞后列表、目标滚动窗口大小、最大范围、
n_cross_validations 和 cv_step_size。
try_get_auto_parameters(automl_settings: azureml.automl.core.automl_base_settings.AutoMLBaseSettings, X: Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix, azureml.dataprep.api.dataflow.Dataflow], y: Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix, azureml.dataprep.api.dataflow.Dataflow], freq: Optional[str] = None) -> Tuple[List[int], int, int, Optional[int], Optional[int]]
参数
- automl_settings
- X
- y
- freq
反馈
提交和查看相关反馈