PublicHolidays 類別

代表公用假日公用資料集。

此資料集包含來自 PyPI 假日套件和 Wikipedia 的全球公開假日資料,涵蓋 1970 到 2099 年 38 個國家/地區。 每個資料列都會載明假日資訊,指出特定日期、國家或地區,以及多數人是否具有帶薪休假。 如需此資料集的詳細資訊,包括資料行描述、存取資料集的不同方式,以及範例,請參閱 Microsoft Azure 開放資料集目錄中的 公開假日

初始化篩選欄位。

繼承
PublicHolidays

建構函式

PublicHolidays(country_or_region: str = '', start_date: datetime = datetime.datetime(2008, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 2, 7, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)

參數

country_or_region
str
必要

要傳回資料的國家或地區。

start_date
datetime
預設值: 2008-01-01 00:00:00

開始載入資料的日期,包含。 如果為 None,則會 default_start_date 使用 。

end_date
datetime
預設值: 2024-02-07 00:00:00

結束載入資料的日期,包含。 如果為 None,則會 default_end_date 使用 。

cols
list[str]
預設值: None

要從資料集載入的資料行名稱清單。 如果為 None,則會載入所有資料行。 如需此資料集中可用資料行的資訊,請參閱 公用假日

enable_telemetry
bool
預設值: True

是否要在此資料集上啟用遙測。

country_or_region
str
必要

您想要查詢的國家或地區。

start_date
datetime
必要

您想要以包容性方式查詢的開始日期。

end_date
datetime
必要

您想要以包容性方式查詢的結束日期。

cols
Optional[List[str]]
必要

您想要擷取的資料行名稱清單。 無 會取得所有資料行。

enable_telemetry
bool
必要

指出是否要傳送遙測。

備註

下列範例示範如何存取資料集。


   from azureml.opendatasets import PublicHolidays
   from datetime import datetime
   from dateutil.relativedelta import relativedelta


   end_date = datetime.today()
   start_date = datetime.today() - relativedelta(months=1)
   hol = PublicHolidays(start_date=start_date, end_date=end_date)
   hol_df = hol.to_pandas_dataframe()

方法

filter

篩選時間。

filter

篩選時間。

filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)

參數

env
RuntimeEnv
必要

執行時間環境。

min_date
datetime
必要

最小日期。

max_date
必要

最大日期。

傳回

篩選的資料框架。

屬性

country_or_region_column_name

country_or_region_column_name = 'countryOrRegion'

countrycode_column_name

countrycode_column_name = 'countryRegionCode'

default_end_date

default_end_date = datetime.datetime(2024, 2, 7, 0, 0)

default_max_end_date

default_max_end_date = datetime.datetime(2099, 1, 1, 0, 0)

default_start_date

default_start_date = datetime.datetime(2008, 1, 1, 0, 0)