dataset_partition_prep 模块

包含用于指定数据集分区准备工作的功能。

在你使用某个需要数据分区的 opendatasets 类(如 NycTlcGreen 类)时,分区准备会自动进行。

函数

prep_partition_datetime

准备分区路径“year=\d+/month=\d+/”。

prep_partition_datetime(dflow: azureml.dataprep.api.dataflow.Dataflow, start_date: datetime.datetime, end_date: datetime.datetime, pattern: List[str])

参数

dflow
<xref:azureml.dataprep.Dataflow>
必需

dataprep.Dataflow 的实例。

start_date
datetime
必需

数据集的开始日期/时间。

end_date
datetime
必需

数据集的结束日期/时间。

pattern
list
必需

日期/时间模式。

prep_partition_puYear_puMonth

准备分区路径“year=\d+/month=\d+/”。

prep_partition_puYear_puMonth(dflow: azureml.dataprep.api.dataflow.Dataflow, start_date: datetime.datetime, end_date: datetime.datetime, *, pattern: List[str] = ['puYear', 'puMonth'])

参数

dflow
<xref:azureml.dataprep.Dataflow>
必需

dataprep.Dataflow 的实例。

start_date
datetime
必需

数据集的开始日期/时间。

end_date
datetime
必需

数据集的结束日期/时间。

pattern
list
必需

日期/时间模式。

prep_partition_year

准备分区路径“year=\d+/month=\d+/”。

prep_partition_year(dflow: azureml.dataprep.api.dataflow.Dataflow, start_date: datetime.datetime, end_date: datetime.datetime, *, pattern: List[str] = ['year'])

参数

dflow
<xref:azureml.dataprep.Dataflow>
必需

dataprep.Dataflow 的实例。

start_date
datetime
必需

数据集的开始日期/时间。

end_date
datetime
必需

数据集的结束日期/时间。

pattern
list
必需

日期/时间模式。

prep_partition_year_month

准备分区路径“year=\d+/month=\d+/”。

prep_partition_year_month(dflow: azureml.dataprep.api.dataflow.Dataflow, start_date: datetime.datetime, end_date: datetime.datetime, *, pattern: List[str] = ['year', 'month'])

参数

dflow
<xref:azureml.dataprep.Dataflow>
必需

dataprep.Dataflow 的实例。

start_date
datetime
必需

数据集的开始日期/时间。

end_date
datetime
必需

数据集的结束日期/时间。

pattern
list
必需

日期/时间模式。

prep_partition_year_month_day

准备分区路径“year=\d+/month=\d+/”。

prep_partition_year_month_day(dflow: azureml.dataprep.api.dataflow.Dataflow, start_date: datetime.datetime, end_date: datetime.datetime, *, pattern: List[str] = ['year', 'month', 'day'])

参数

dflow
<xref:azureml.dataprep.Dataflow>
必需

dataprep.Dataflow 的实例。

start_date
datetime
必需

数据集的开始日期/时间。

end_date
datetime
必需

数据集的结束日期/时间。

pattern
list
必需

日期/时间模式。