forecasting_heuristic_utils 模块

用于推断自动功能的实用程序。

函数

analyze_pacf_one_grain

输出建议的滞后 (p) 和滚动窗口 (k) 设置

输入:具有一列和基于时间的索引的数据帧

analyze_pacf_one_grain(series: pandas.core.series.Series) -> Tuple[Optional[int], Optional[int]]

参数

series

analyze_pacf_per_grain

分析数据帧中的所有粒度并建议滞后和 RW 设置

analyze_pacf_per_grain(dataframe: pandas.core.frame.DataFrame, time_colname: str, target_colname: str, grain_colnames: Optional[Union[str, List[str]]] = None, max_grains: int = 100) -> Tuple[int, int]

参数

dataframe
必需

列中具有时间索引的数据帧。

time_colname
必需

时间列名称。

grain_colnames
必需

粒度列名称(如果有)。

target_colname
默认值: None

目标列名称。

max_grains
默认值: 100

返回

滞后和 RW 设置。

auto_cv_one_series

输出建议的 cv 设置(n_cross_validations 和 cv_step_size)

输入:具有一列和基于时间的索引的数据帧

auto_cv_one_series(grain_length: int, max_horizon: int, lags: List[int], window_size: int, n_cross_validations: Union[int, str], cv_step_size: Union[int, str], freq: Optional[str] = None) -> Tuple[int, int]

参数

grain_length
max_horizon
lags
window_size
n_cross_validations
cv_step_size
freq
默认值: None

auto_cv_per_series

根据数据帧中的所有粒度建议 n_cross_validations 和 cv_step_size 以及 short_grain_handling 设置。

auto_cv_per_series(dataframe: pandas.core.frame.DataFrame, time_colname: str, target_colname: str, max_horizon: int, lags: List[int], window_size: int, n_cross_validations: Union[int, str], cv_step_size: Union[int, str], short_grain_handling_config: Optional[str], freq: Optional[str] = None, grain_colnames: Optional[Union[str, List[str]]] = None) -> Tuple[int, int]

参数

dataframe
必需

列中具有时间索引的数据帧。

time_colname
必需

时间列名称。

grain_colnames
必需

粒度列名称(如果有)。

target_colname
必需

目标列名称。

lags
window_size
n_cross_validations
cv_step_size
short_grain_handling_config
freq
默认值: None
grain_colnames
默认值: None

返回

n_cross_validations 和 cv_step_size。

frequency_based_lags

返回应添加到滞后列表的基于频率的滞后。

如果无法估算滞后,则返回 0。 :param freq: 应确定滞后的频率。 :return: 给定频率的滞后值或 0。

frequency_based_lags(freq: pandas._libs.tslibs.offsets.DateOffset) -> int

参数

freq

get_frequency_safe

确定时间索引的频率。

get_frequency_safe(time_index: Any) -> pandas._libs.tslibs.offsets.DateOffset

参数

time_index
必需

索引,需要确定频率。

返回

频率值。

get_heuristic_max_horizon

估算给定数据帧的启发式最大范围。

注意:如果无法建立频率,则将返回默认值。 :param data: 用于估算启发式的数据帧。 :time_colname: 时间列的名称。

get_heuristic_max_horizon(data: pandas.core.frame.DataFrame, time_colname: str, grain_column_names: Optional[List[str]]) -> int

参数

data
time_colname
grain_column_names

timedelta_to_freq_safe

将 pd.Timedelta 安全地转换为 pd.DateOffset

timedelta_to_freq_safe(delta: pandas._libs.tslibs.timedeltas.Timedelta) -> pandas._libs.tslibs.offsets.DateOffset

参数

delta
必需

timedelta。

try_get_auto_parameters

返回应以启发式估算的参数。

现在为 2022/01/28,它包含滞后、window_size、max_horizon、n_cross_validations 和 cv_step_size。 :param automl_settings: 运行的设置。 :param X: 输入数据帧。 如果输入类型不是数据帧,则不会估算启发式。 :param y: 预期的数据。 :return: 元组,包含滞后列表、目标滚动窗口大小、最大范围、

n_cross_validations 和 cv_step_size。

try_get_auto_parameters(automl_settings: azureml.automl.core.automl_base_settings.AutoMLBaseSettings, X: Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix, azureml.dataprep.api.dataflow.Dataflow], y: Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix, azureml.dataprep.api.dataflow.Dataflow], freq: Optional[str] = None) -> Tuple[List[int], int, int, Optional[int], Optional[int]]

参数

automl_settings
X
y
freq
默认值: None