PublicHolidays 类

表示公共假日公共数据集。

数据集包含来自 PyPI holidays 数据包和维基百科的全球公共假日数据,其中包括 1970 年至 2099 年的 38 个国家或地区。 每一行表示某一特定日期、国家/地区的假日信息,以及大多数人是否带薪休假。 有关此数据集的详细信息(包括列说明、访问数据集的不同方法以及示例),请参阅 Microsoft Azure 开放数据集目录中的公共假日

继承
PublicHolidays

构造函数

PublicHolidays(country_or_region: str = '', start_date: datetime.datetime = datetime.datetime(2008, 1, 1, 0, 0), end_date: datetime.datetime = datetime.datetime(2022, 6, 30, 0, 0), cols: Optional[List[str]] = None, enable_telemetry: bool = True)

参数

country_or_region
str
必需

要为其返回数据的国家或地区。

start_date
datetime
默认值: 2008-01-01 00:00:00

开始加载数据的日期(含)。 如果为“无”,则使用 default_start_date

end_date
datetime
默认值: 2022-06-30 00:00:00

结束加载数据的日期(含)。 如果为“无”,则使用 default_end_date

cols
list[str]
默认值: None

要从数据集加载的列名称的列表。 如果为 None,则加载所有列。 若要了解此数据集中的可用列,请参阅公共假日

enable_telemetry
bool
默认值: True

是否对此数据集启用遥测。

注解

下面的示例演示如何访问数据集。


   from azureml.opendatasets import PublicHolidays
   from datetime import datetime
   from dateutil.relativedelta import relativedelta


   end_date = datetime.today()
   start_date = datetime.today() - relativedelta(months=1)
   hol = PublicHolidays(start_date=start_date, end_date=end_date)
   hol_df = hol.to_pandas_dataframe()

方法

filter

筛选器时间。

filter

筛选器时间。

filter(env: Union[azureml.opendatasets.environ.SparkEnv, azureml.opendatasets.environ.PandasEnv], min_date: datetime.datetime, max_date: datetime.datetime)

参数

env
RuntimeEnv
必需

运行时环境。

min_date
datetime
必需

最小日期。

max_date
必需

最大日期。

返回

筛选的数据帧。

属性

country_or_region_column_name

country_or_region_column_name = 'countryOrRegion'

countrycode_column_name

countrycode_column_name = 'countryRegionCode'

default_end_date

default_end_date = datetime.datetime(2022, 6, 30, 0, 0)

default_max_end_date

default_max_end_date = datetime.datetime(2099, 1, 1, 0, 0)

default_start_date

default_start_date = datetime.datetime(2008, 1, 1, 0, 0)