time_series_data_frame 模块

包含 TimeSeriesDataFrame 类的定义的模块。

此类迎合在单个多索引数据帧中处理多个时序。

TimeSeriesDataFrame

具有用于时序分析和预测的附加属性的 pandas.DataFrame 的子类。

具有用于时序分析和预测的附加属性的 pandas.DataFrame 的子类。

示例:

data1 = {'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [15, 25, 30], 'd': [1, 1, 2], ... 'date': pd.to_datetime(['2017-01-01', '2017-01-02', '2017-01-03'])} df1 = TimeSeriesDataFrame(data1, grain_colnames = ['a','b'], time_colname = 'date', ... ts_value_colname = 'c', group_colnames = 'd') data2 = {'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [15, 25, 30], 'd': [1, 1, 2], ... 'date': pd.date_range('2017-01-01', periods = 3, freq = 'D')} df2 = TimeSeriesDataFrame(data2, grain_colnames = 'a', time_colname = 'date', ... ts_value_colname = 'a', group_colnames = ['b','c']) data3 = {'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [15, 25, 30], 'd': [1, 1, 2], ... 'month': pd.PeriodIndex(['2012-01', '2012-02', '2012-03'], ... dtype = 'period[M]', freq = 'M')} df3 = TimeSeriesDataFrame(data3, grain_colnames = ['a', 'b'], time_colname = 'month', ... ts_value_colname = 'b') data4 = {'a': [1,2,3], 'b': [4,5,6], 'c': [15, 25, 30], 'd': [1, 1, 2], ... 'month': [pd.Period('2012-01'), pd.Period('2012-02'), pd.Period('2012-03')]} df4 = TimeSeriesDataFrame(data4, grain_colnames = 'a', time_colname = 'month', ... ts_value_colname = 'b', group_colnames =['c','d'])

函数

construct_tsdf

构造时序数据帧。

construct_tsdf(X: Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix, azureml.dataprep.api.dataflow.Dataflow], y: Optional[Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical, azureml.dataprep.api.dataflow.Dataflow]], target_column_name: str, time_column_name: str, origin_column_name: str, grain_column_names: List[str], boolean_column_names: List[str]) -> azureml.automl.runtime.shared.time_series_data_frame.TimeSeriesDataFrame

参数

X
<xref:DataInputType>
必需

要转换为 tsdf 的数据集。

y
<xref:DataSingleColumnInputType>
必需

要转换为 tsdf 的目标列。 这可由调用方排除。

target_column_name
str
必需

目标列的所需名称。

time_column_name
str
必需

X 内的时间列的名称。

origin_column_name
str
必需

源列的所需名称。

grain_column_names
<xref:List>[str]
必需

X 内共同构成粒度的列。

boolean_column_names
<xref:List>[str]
必需

X 内类型为布尔值的列。