Munkaszüneti

A PyPI szabadnapos csomagja és a Wikipedia alapján készült nyilvános szabadnapi adatok, 38 országra vagy régióra vonatkozóan, 1970. és 2099 között.

Minden sor egy adott dátum és ország vagy régió szabadnapjaira vonatkozó adatait tartalmazza, illetve azt, hogy a legtöbb ember kap-e fizetett szabadságot.

Megjegyzés

A Microsoft Azure Open Datasets "a megfelelő" alapon biztosítja a hozzáférést. A Microsoft nem vállal semmilyen kifejezett vagy hallgatólagos garanciát vagy feltételt az adatkészletek használatára. A Microsoft az Ön helyi törvénye által megengedett mértékig felelősséget vállal az adatkészletek használatának közvetlen, következményes, különleges, közvetett, véletlen vagy költségkisértésből eredő károkért és veszteségekért.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Kötet és megőrzés

Az adatkészlet Parketta formátumban van tárolva. Ez egy olyan pillanatkép, amely 1970. január 1. és 2099. január 1. között ünnepi információkat tartalmaz. Az adatok mérete körülbelül 500 KB.

Tárolási hely

Az adatkészlet tárolási helye a Kelet-USA Azure-régió. Az affinitás érdekében javasoljuk, hogy az USA keleti régiója régiója felé keressen számítási erőforrásokat.

További információ

Ez az adatkészlet a Wikipédiából (WikiMedia Foundation Inc) származó adatokat és a PyPI-ünnepcsomagot egyesíti.

Az egyesített adatkészlet a Creative Commons Attribution-ShareAlike 3.0 portnélküli licenc alapján terjeszthető.

Az adatforrással kapcsolatos kérdéseket e-mailben teheti fel ezen a címen: aod@microsoft.com.

Oszlopok

Name Adattípus Egyedi Értékek (minta) Leírás
countryOrRegion (ország/régió) sztring 38 Németország Ország vagy régió teljes neve.
countryRegionCode sztring 35 SE NEM Ország vagy régiókód ebben a formátumban.
dátum időbélyeg 20,665 2074-01-01 00:00:00 2025-12-25 00:00:00 Az ünnep dátuma.
holidayName (ünnepi név) sztring 483 Sndag Söndag Az ünnep teljes neve.
isPaidTimeOff boolean 3 Igaz Jelezze, hogy a legtöbben ezen a napon fizetettek-e ki idő után (jelenleg csak az Egyesült Egyesült Értünk, a GB-on és Indiában érhető el). Ha az értéke NULL, akkor az adat ismeretlen.
normalizeHolidayName sztring 438 Sndag Söndag Az ünnep normalizált neve.

Előnézet

countryOrRegion (ország/régió) holidayName (ünnepi név) normalizeHolidayName countryRegionCode dátum
Norvégia Sndag Sndag NO 2098.12.28., 12:00:00
Svédország Söndag Söndag SE 2098.12.28., 12:00:00
Ausztrália Boxing Day Boxing Day AU 2098.12.26., 12:00:00
Magyarország A 2017-hez A 2017-hez HU 2098.12.26., 12:00:00
Ausztria Amitatag Amitatag AT 2098.12.26., 12:00:00
Kanada Boxing Day Boxing Day CA 2098.12.26., 12:00:00
Horvátország Sveti Stjepan Sveti Stjepan HR 2098.12.26., 12:00:00
Cseh 2. svátek vánoemet 2. svátek vánoemet CZ 2098.12.26., 12:00:00

Az adatok elérése

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://docs.microsoft.com/en-us/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Következő lépések

Tekintse meg a katalógusban található többi adatkészletet Open Datasets katalógusban.