Święta

Dane dotyczące świąt na całym świecie pobrane z pakietu PyPI holidays oraz witryny Wikipedia, obejmujące 38 krajów i regionów w latach 1970–2099.

Każdy wiersz wskazuje informacje na temat świąt dotyczące konkretnej daty, kraju lub regionu i tego, czy większość osób ma wówczas płatny dzień wolny.

Uwaga

Firma Microsoft Azure Open Datasets na zasadzie "jak jest". Firma Microsoft nie udziela żadnych gwarancji, jawnych ani dorozumianych, ani nie udziela żadnych warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym przez prawo lokalne Microsoft zrzeka się wszelkiej odpowiedzialności za wszelkie szkody lub straty, w tym szkody bezpośrednie, wynikowe, specjalne, pośrednie, pośrednie, przypadkowe lub karalne wynikające z używania zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Wolumin i przechowywanie

Ten zestaw danych jest przechowywany w formacie Parquet. Jest to migawka z informacjami o świętach od 1 stycznia 1970 r. do 1 stycznia 2099 r. Rozmiar danych to około 500 KB.

Lokalizacja magazynu

Ten zestaw danych jest przechowywany w regionie platformy Azure Wschodnie stany USA. Zalecamy lokalizowanie zasobów obliczeniowych w lokalizacji Wschodnie wystąpienia USA w celu koligacji.

Dodatkowe informacje

Ten zestaw danych łączy dane pozyskane z witryny Wikipedia (WikiMedia Foundation Inc.) i pakietu PyPI Holidays.

Ten połączony zestaw danych jest udostępniany w ramach licencji Creative Commons Attribution-ShareAlike 3.0 Unported License.

Jeśli masz pytania dotyczące tego zestawu danych, napisz wiadomość e-mail na adres aod@microsoft.com.

Kolumny

Nazwa Typ danych Unikatowe Wartości (przykład) Opis
countryOrRegion (kraj lub region) ciąg 38 Holandia Pełna nazwa kraju lub regionu.
countryRegionCode ciąg 35 SE NIE Kod kraju lub regionu zgodny z formatem podanym tutaj.
data sygnatura czasowa 20,665 2074-01-01 00:00:00 2025-12-25 00:00:00 Data święta.
holidayName ciąg 483 Søndag Söndag Pełna nazwa święta.
isPaidTimeOff boolean 3 Prawda Wskaż, czy większość osób ma płatny urlop w tym dniu (obecnie jest dostępny tylko dla Stanów Zjednoczonych, Gb i Indiach). Wartość NULL oznacza „nie wiadomo”.
normalizeIdayName ciąg 438 Søndag Söndag Znormalizowana nazwa święta.

Wersja zapoznawcza

countryOrRegion (kraj lub region) holidayName normalizeIdayName countryRegionCode data
Norwegia Sghndag Sghndag NO 28.12.2098 12:00:00
Szwecja Söndag Söndag SE 28.12.2098 12:00:00
Australia Boxing Day Boxing Day AU 26.12.2098 12:00:00
Węgry Karácsony másnapja Karácsony másnapja HU 26.12.2098 12:00:00
Austria Przejmij 2018 r. Przejmij 2018 r. AT 26.12.2098 12:00:00
Kanada Boxing Day Boxing Day CA 26.12.2098 12:00:00
Chorwacja Sveti Stjepan Sveti Stjepan HR 26.12.2098 12:00:00
Czeski 2. svátek vánoáná 2. svátek vánoáná CZ 26.12.2098 12:00:00

Dostęp do danych

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://docs.microsoft.com/en-us/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets katalogu.