Bing COVID-19

Bing 新型冠狀病毒 (COVID-19) 資料每日更新,提供來自所有區域的確診、死亡及治癒病例數。 這份資料反映於 Bing 新型冠狀病毒 (COVID-19) 追蹤程式

Bing 會從多個受信任的可靠來源收集資料,包括 世界衛生組織(WHO)、疾病控制和預防中心(CDC) 國家/地區和國家公共衛生部門、BNO 新聞 24/7 牆街 維琪百科

注意

Microsoft 會以「如目前」為基礎提供 Azure 開放資料集。 Microsoft 不會就您使用資料集做出任何明示或默示擔保或條件。 根據當地法律所允許的範圍,Microsoft 會免除因使用資料集而產生的任何損害或損失的所有責任,包括直接、衍生、特殊、間接、附帶或懲罰性。

此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。

資料集

已修改的資料集可在 CSV、JSON、JSON-Lines 和 Parquet 中使用。

所有已修改的資料集皆新增了 ISO 3166 次級行政區代碼和載入時間,並使用以底線分隔的小寫資料行名稱。

未經處理資料:https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

已修改及未經處理的舊版資料:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

資料量

所有資料集都會每天更新。 自 2020 年 5 月 11 日起,它們包含 125,576 個數據列(CSV 16.1 MB、JSON 40.0 MB、JSONL 39.6 MB、Parquet 1.1 MB)。

授權和使用權利屬性

這項資料嚴格適用于教育和學術目的,例如醫學研究、政府機構和學術機構, 根據條款及條件

發行集中使用或引用的資料應包含 「Bing COVID-19 追蹤器」的屬性,以及 www.bing.com/covid 的連結

連絡人

對於新型冠狀病毒 (COVID-19) Data Lake 中的這個資料集或其他資料集如有任何問題,請連絡 askcovid19dl@microsoft.com。

資料行

名稱 資料類型 唯一 Values (sample) 描述
admin_region_1 string 864 德克薩斯州佐治亞州 country_region 中的地區
admin_region_2 string 3,143 華盛頓縣傑弗遜縣 admin_region_1 中的地區
證實 int 120,692 1 2 地區的確診人數
confirmed_change int 12,120 1 2 與前一天相比的確診人數變化
country_region string 237 美國印度 國家/地區
死亡 int 20,616 1 2 地區的死亡人數
deaths_change smallint 1,981 1 2 與前一天相比的死亡人數變化
id int 1,783,534 742546 69019298 唯一識別碼
iso_subdivision string 484 US-TX US-GA 由兩部分組成的 ISO 次級行政區代碼
iso2 string 226 美國 IN 2 個字母的國碼 (地區碼) 識別碼
iso3 string 226 USA IND 3 個字母的國碼 (地區碼) 識別碼
緯度 double 5,675 42.28708 19.59852 地區中心的緯度
load_time timestamp 1 2021-04-26 00:06:34.719000 從 GitHub 上 Bing 來源載入檔案的日期與時間
經度 double 5,693 -2.5396 -155.5186 地區中心的經度
恢復 int 73,287 1 2 地區的康復人數
recovered_change int 10,441 1 2 與前一天相比的康復人數變化
已更新 date 457 2021-04-23 2021-04-22 記錄的截止日期

預覽

id 已更新 證實 死亡 iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null 全球 null null null 2021/4/26 上午 12:06:34
338996 2020-01-22 313 0 null null 全球 null null null 2021/4/26 上午 12:06:34 51 0
338997 2020 年 1 月 23 日 578 0 null null 全球 null null null 2021/4/26 上午 12:06:34 265 0
338998 2020-01-24 841 0 null null 全球 null null null 2021/4/26 上午 12:06:34 263 0
338999 2020-01-25 1320 0 null null 全球 null null null 2021/4/26 上午 12:06:34 479 0
339000 2020-01-26 2014 0 null null 全球 null null null 2021/4/26 上午 12:06:34 694 0
339001 2020-01-27 2798 0 null null 全球 null null null 2021/4/26 上午 12:06:34 784 0
339002 2020 年 1 月 28 日 4593 0 null null 全球 null null null 2021/4/26 上午 12:06:34 1795 0
339003 2020-01-29 6065 0 null null 全球 null null null 2021/4/26 上午 12:06:34 1472 0
339004 2020-01-30 7818 0 null null 全球 null null null 2021/4/26 上午 12:06:34 1753 0

資料存取

Azure Notebooks

此筆記本記載 URL 和範例程式碼,以存取 Bing COVID-19 資料集

使用下列 URL 來取得裝載于Azure Blob 儲存體的特定檔案格式:

CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSON:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

使用 Pandas 中的 HTTP URL 下載內建功能下載資料集檔案。 Pandas 具有各種檔案格式的讀取器:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

讓我們檢查各種欄位的資料類型,並確認更新的資料行為 datetime 格式

df.dtypes

我們現在將探討全球資料,並繪製一些簡單的圖表,以視覺化資料

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

此平臺/套件組合無法使用的範例。

Azure Synapse

此平臺/套件組合無法使用的範例。

下一步

檢視開放式資料集目錄中 的其餘資料集