Государственные праздники

Данные о государственных праздниках 38 стран или регионов с 1970 по 2099 гг. из Википедии и пакета данных PyPI.

В каждой строке указаны сведения о празднике для определенной даты, страны или региона, а также о том, является ли этот выходной день оплачиваемым для большинства занятого населения.

Примечание.

Корпорация Майкрософт предоставляет Открытые наборы данных Azure как есть. Корпорация Майкрософт не предоставляет никаких гарантий (явных или подразумеваемых) и не определяет никаких условий в связи с использованием этих наборов данных. В рамках, допускаемых местным законодательством, корпорация Майкрософт отказывается от ответственности за ущерб и убытки (в том числе прямые, косвенные, специальные, опосредованные, случайные и штрафные), понесенные в результате использования вами этих наборов данных.

Этот набор данных предоставляется на тех же условиях, на которых корпорация Майкрософт получила исходные данные. Этот набор может включать данные, полученные от корпорации Майкрософт.

Объем данных и их хранение

Этот набор данных хранится в формате Parquet. Это моментальный снимок со сведениями о праздниках с 1 января 1970 г. по 1 января 2099 г. Размер данных составляет примерно 500 КБ.

Расположение хранилища

Этот набор данных хранится в регионе Azure "Восточная часть США". Мы рекомендуем размещать вычислительные ресурсы в восточной части США для соответствия.

Дополнительная информация:

В этом наборе представлены данные из Википедии (WikiMedia Foundation Inc.) и пакета PyPI с данными о праздниках.

Объединенный набор данных предоставляется в рамках лицензии Creative Commons Attribution-ShareAlike 3.0 Unported License.

Если у вас есть вопросы об источнике данных, напишите на адрес aod@microsoft.com.

Столбцы

Имя. Тип данных Уникальный Значения (пример) Description
countryOrRegion строка 38 Sweden Norway Полное название страны или региона.
countryRegionCode строка 35 SE NO Код страны или региона в нужном формате можно найти здесь.
Дата TIMESTAMP 20665 2074-01-01 00:00:00 2025-12-25 00:00:00 Дата праздника.
holidayName строка 483 Søndag Söndag Полное название праздника.
isPaidTimeOff boolean 3 Истина Указывает, имеет ли большинство населения оплачиваемый выходной, который приходится на эту дату (сейчас доступно только для США, Великобритании и Индии). Если указано значение NULL, значит, данных нет.
normalizeHolidayName строка 438 Søndag Söndag Нормализованное название праздника.

Предварительная версия

countryOrRegion holidayName normalizeHolidayName countryRegionCode Дата
Норвегия Søndag Søndag Нет 12/28/2098 12:00:00 AM
Швеция Söndag Söndag SE 12/28/2098 12:00:00 AM
Австралия Boxing Day Boxing Day AU 12/26/2098 12:00:00 AM
Венгрия Karácsony másnapja Karácsony másnapja HU 12/26/2098 12:00:00 AM
Австрия Stefanitag Stefanitag AT 12/26/2098 12:00:00 AM
Канада Boxing Day Boxing Day Целостности и доступности 12/26/2098 12:00:00 AM
Хорватия Sveti Stjepan Sveti Stjepan HR 12/26/2098 12:00:00 AM
чешский 2. svátek vánoční 2. svátek vánoční CZ 12/26/2098 12:00:00 AM

Доступ к данным

Записные книжки Azure

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Следующие шаги

Ознакомьтесь с другими наборами в каталоге Открытых наборов данных.