Avrupa Hastalık Önleme ve Kontrol Merkezi (ECDC) COVID-19 Vakaları
Avrupa Hastalık Önleme ve Kontrol Merkezi'nden (ECDC) dünya çapında COVID-19 vakalarının coğrafi dağılımıyla ilgili en son genel veriler . Her satır/girdi, ülke veya bölge başına günlük olarak bildirilen yeni vaka sayısını içerir.
Not
Microsoft, Azure Açık Veri Kümelerini "olduğu gibi" temel alarak sağlar. Microsoft, veri kümelerini kullanımınızla ilgili olarak açık veya zımni hiçbir garanti veya koşul sağlamaz. Yerel yasalarınız kapsamında izin verilen ölçüde, Microsoft veri kümelerini kullanmanızdan kaynaklanan doğrudan, neticede, özel, dolaylı, arızi veya cezai dahil olmak üzere her türlü zarar veya kayıpla ilgili tüm sorumluluğu kabul etmez.
Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.
Veri kümeleri
Veri kümesinin değiştirilen sürümleri CSV, JSON, JSON-Lines ve Parquet biçiminde sunulur ve günlük olarak güncelleştirilir:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Değiştirilen tüm sürümlerde iso_country_region kodları ile yükleme süreleri bulunur ve alt çizgi ayıraçlar ile küçük harf sütun adları kullanılır.
Ham veriler: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Değiştirilen ve ham verilerin önceki sürümleri: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Veri hacmi
28 Mayıs 2020 itibarıyla 19.876 satır (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB) içerir.
Veri kaynağı
Ham veriler , ECDC csv dosyasından günlük olarak alınmaktadır. Kaynakları da dahil olmak üzere bu veri kümesi hakkında daha fazla bilgi için ECDC veri toplama sayfasına bakın.
Veri kalitesi
ECDC, verilerin doğruluğunu veya zamanında sunulduğunu garanti etmez. Yasal uyarıyı okuyun.
Lisans ve kullanım hakları ilişkilendirmesi
Bu veriler, burada belirtilen ECDC telif hakkı ilkesi altında izin verilen şekilde kullanıma sunulur ve kullanılabilir. Telif hakkının bir üçüncü tarafa ait olduğu belgeler için yeniden oluşturma izni, telif hakkı sahibinden alınmalıdır.
ECDC her zaman bu verilerin özgün kaynağı olarak kabul edilmelidir. Bu tür bir bildirim, malzemenin her kopyasına dahil edilmelidir.
İletişim
Bu veya COVID-19 Data Lake’teki diğer veri kümeleri hakkında sorularınız veya geri bildiriminiz için lütfen askcovid19dl@microsoft.com ile iletişime geçin.
Sütunlar
Name | Veri türü | Benzersiz | Değerler (örnek) | Açıklama |
---|---|---|---|---|
Durumda | smallint | 5,515 | 1 2 | Bildirilen vaka sayısı |
continent_exp | string | 6 | Avrupa Afrika | Kıta adı |
countries_and_territories | string | 214 | Kanada Belçika | Ülke veya bölge adı |
country_territory_code | string | 213 | KOR ISL | Üç harfli ülke veya bölge kodu |
date_rep | date | 350 | 2020-12-11 2020-11-22 | Rapor tarihi |
gün | smallint | 31 | 14 13 | Ayın kaçıncı günü olduğu |
Ölüm | smallint | 1,049 | 1 2 | Bildirilen ölü sayısı |
geo_id | string | 214 | CA SE | Coğrafi tanımlayıcı |
iso_country | string | 214 | SE US | ISO 3166 ülke veya bölge kodu |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | Verilerin Azure’a yüklendiği tarih |
ay | smallint | 12 | 10 8 | Ay numarası |
yıl | smallint | 2 | 2020 2019 | Yıl |
Önizleme
date_rep | gün | ay | yıl | Durumda | Ölüm | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
Veri erişimi
Azure Notebooks
Bu not defteri, Azure Blob Depolama üzerinde barındırılan farklı veri kümesi dosya biçimlerinin Avrupa Hastalık Önleme ve Kontrol Merkezi (ECDC) Covid-19 Vakaları veri kümesi URL'lerine erişmek için URL'leri ve örnek kodu belgelemektedir:¶ CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Pandas'ta bir http URL'sinden yerleşik özellik indirmesini kullanarak veri kümesi dosyasını indirin. Pandas'ın çeşitli dosya biçimleri için okuyucuları vardır:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Örnek bu platform/paket birleşimi için kullanılamıyor.
Azure Synapse
Örnek bu platform/paket birleşimi için kullanılamıyor.
Örnekler
Bu veri kümesinin nasıl kullanılabileceğini gösteren örneklere bakın:
- Synapse SQL sunucusuz uç noktası ile COVID verilerini analiz etme
- Azure Synapse Analytics'te SQL uç noktasını kullanarak COVID verileri üzerinde doğrusal regresyon analizi
Sonraki adımlar
Açık Veri Kümeleri kataloğundaki diğer veri kümelerini görüntüleyin.