dataset_partition_prep 模組

包含指定資料集分割準備的功能。

當您使用 opendatasets 需要資料分割的類別,例如 NycTlcGreen 類別時,就會自動進行資料分割準備。

函數

prep_partition_datetime

準備分割區路徑 'year=\d+/month=\d+/'。

prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])

參數

名稱 Description
dflow
必要
<xref:azureml.dataprep.Dataflow>

dataprep 的實例。資料流程。

start_date
必要

資料集的開始日期時間。

end_date
必要

資料集的結束日期時間。

pattern
必要

日期時間模式。

prep_partition_puYear_puMonth

準備分割區路徑 'year=\d+/month=\d+/'。

prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])

參數

名稱 Description
dflow
必要
<xref:azureml.dataprep.Dataflow>

dataprep 的實例。資料流程。

start_date
必要

資料集的開始日期時間。

end_date
必要

資料集的結束日期時間。

pattern
必要

日期時間模式。

僅限關鍵字的參數

名稱 Description
pattern
預設值: ['puYear', 'puMonth']

prep_partition_year

準備分割區路徑 'year=\d+/month=\d+/'。

prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])

參數

名稱 Description
dflow
必要
<xref:azureml.dataprep.Dataflow>

dataprep 的實例。資料流程。

start_date
必要

資料集的開始日期時間。

end_date
必要

資料集的結束日期時間。

pattern
必要

日期時間模式。

僅限關鍵字的參數

名稱 Description
pattern
預設值: ['year']

prep_partition_year_month

準備分割區路徑 'year=\d+/month=\d+/'。

prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])

參數

名稱 Description
dflow
必要
<xref:azureml.dataprep.Dataflow>

dataprep 的實例。資料流程。

start_date
必要

資料集的開始日期時間。

end_date
必要

資料集的結束日期時間。

pattern
必要

日期時間模式。

僅限關鍵字的參數

名稱 Description
pattern
預設值: ['year', 'month']

prep_partition_year_month_day

準備分割區路徑 'year=\d+/month=\d+/'。

prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])

參數

名稱 Description
dflow
必要
<xref:azureml.dataprep.Dataflow>

dataprep 的實例。資料流程。

start_date
必要

資料集的開始日期時間。

end_date
必要

資料集的結束日期時間。

pattern
必要

日期時間模式。

僅限關鍵字的參數

名稱 Description
pattern
預設值: ['year', 'month', 'day']