time_index_featurizer 模块

从时间索引派生并选择特征,例如“星期几”。

TimeIndexFeaturizer

用于计算(主要是分类)特征的转换类。

这旨在用作预测管道内的特征化步骤。

此转换返回一个新的 TimeSeriesDataSet,其中包含所有原始列,外加 18 个具有基于日期/时间特征的列。 创建了以下特征:

  • year - 日历年
  • year_iso - ISO 年份,详情见后文
  • half - 半年,如果日期在 7 月 1 日之前为 1,否则为 2
  • quarter - 日历季,1 到 4
  • month - 日历月,1 到 12
  • month_lbl - 字符串形式的日历月,“一月”到“十二月”
  • day - 一个月中的日历日,1 到 31
  • hour - 一天中的小时,0 到 23
  • minute - 一天中的分钟,0 到 59
  • second - 一天中的秒,0 到 59
  • am_pm - 如果时间在中午(中午 12 点)之前,为 0;否则为 1
  • am_pm_lbl - 如果时间在中午(中午 12 点)之前,为“上午”;否则为“下午”
  • hour12 - 每天 12 小时,不分上午/下午时段
  • wday - 一周的某一日,0(星期一)到 6(星期日)
  • wday_lbl - 以字符串形式表示星期几
  • qday - 一季的某一日,1 到 92
  • yday - 一年的某一日,1 到 366
  • week - ISO 周,有关详细信息,请参阅下文

ISO 年和周在 ISO 8601 中定义,有关详细信息,请参阅 Wikipedia.ISO。 简而言之,ISO 周始终从星期一开始,持续 7 天。 ISO 年从一年中头一个有星期二的那一周开始算。 这意味着,如果 1 月 1 日是星期五,ISO 年将仅从 1 月 4 日开始。 因此,ISO 年可能不同于日历年。