Helgdagar

Information om allmänna helgdagar över hela världen från PyPI-paketet för helgdagar och Wikipedia, som omfattar 38 länder och regioner från 1970 till 2099.

Varje rad visar helgdagsinformation för ett specifikt datum, land/region och om de flesta invånarna har betald ledighet.

Kommentar

Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.

Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.

Volym och kvarhållning

Datamängden lagras i Parquet-format. Det är en ögonblicksbild med semesterinformation från 1 januari 1970 till 1 januari 2099. Datastorleken är cirka 500 KB.

Lagringsplats

Datamängden lagras i Azure-regionen Östra USA. Vi rekommenderar att du letar upp beräkningsresurser i USA, östra för tillhörighet.

Ytterligare information

Datamängden kombinerar data från Wikipedia (WikiMedia Foundation Inc) och PyPI-paketet för helgdagar.

Den kombinerade datamängden finns under Creative Commons Attribution-ShareAlike 3.0 Unported License.

Du kan skicka ett e-postmeddelande till aod@microsoft.com om du har frågor om datakällan.

Kolumner

Name Datatyp Unik Värden (exempel) beskrivning
countryOrRegion sträng 38 Sverige Norge Landets eller regionens fullständiga namn.
countryRegionCode sträng 35 SE NEJ Lands- eller regionskod i det här formatet.
datum timestamp 20,665 2074-01-01 00:00:00 2025-12-25 00:00:00 Datum för helgdagen.
holidayName sträng 483 Søndag Söndag Fullständigt namn på helgdagen.
isPaidTimeOff boolean 3 Sant Ange om de flesta har betalat jour den här dagen (endast tillgängligt för USA, GB och Indien nu). Om det är NULL, innebär det att det inte är känt.
normalizeHolidayName sträng 438 Søndag Söndag Normaliserat namn på helgdagen.

Förhandsgranskning

countryOrRegion holidayName normalizeHolidayName countryRegionCode datum
Norge Søndag Søndag NEJ 12/28/2098 12:00:00
Sverige Söndag Söndag SE 12/28/2098 12:00:00
Australien Annandag jul Annandag jul AU 12/26/2098 12:00:00
Ungern Karácsony másnapja Karácsony másnapja HU 12/26/2098 12:00:00
Österrike Stefanitag Stefanitag AT 12/26/2098 12:00:00
Kanada Annandag jul Annandag jul CA 12/26/2098 12:00:00
Kroatien Sveti Stjepan Sveti Stjepan Personal 12/26/2098 12:00:00
Tjeckiska 2. svátek vánoční 2. svátek vánoční CZ 12/26/2098 12:00:00

Dataåtkomst

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Nästa steg

Visa resten av datauppsättningarna i katalogen Öppna datamängder.