Bing COVID-19

I dati su COVID-19 di Bing includono i casi confermati, letali e di guarigione da tutte le aree geografiche, aggiornati ogni giorno. Questi dati sono rispecchiati in Bing COVID-19 Tracker.

Bing raccoglie dati da più origini attendibili e affidabili, tra cui l'Organizzazione mondiale della sanità (OMS), Center for Disease Control and Prevention (CDC), i reparti sanitari pubblici nazionali/regionali e statali, BNO News, 24/7 Wall St. e Wikipedia.

Nota

Microsoft fornisce i set di dati aperti di Azure "così come sono". Microsoft non fornisce alcuna garanzia, espressa o implicita, né alcuna condizione in merito all'uso dei set di dati da parte dell'utente. Nella misura consentita dalle leggi locali, Microsoft declina ogni responsabilità per eventuali danni o perdite, inclusi danni diretti, consequenziali, particolari, indiretti, accidentali o indennizzi, derivanti dall'uso dei set di dati da parte dell'utente.

Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.

Set di dati

I set di dati modificati sono disponibili in CSV, JSON, JSON-Lines e Parquet.

A tutti i set di dati modificati sono stati aggiunti codici di suddivisione ISO 3166 e tempi di caricamento e i set di dati usano nomi di colonna minuscoli con caratteri di sottolineatura come separatori.

Dati non elaborati: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

Versioni precedenti di dati modificati e non elaborati: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Volume dei dati

Tutti i set di dati vengono aggiornati ogni giorno. A partire dall'11 maggio 2020, contengono 125.576 righe (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).

Attribuzione dei diritti di licenza e utilizzo

Questi dati sono disponibili esclusivamente per scopi didattici e accademici, ad esempio per la ricerca medica, le agenzie governative e gli istituti accademici, in base a condizioni.

I dati usati o citati nelle pubblicazioni devono includere un'attribuzione a 'Bing COVID-19 Tracker' con un collegamento a www.bing.com/covid.

Contatto

Se hai domande o feedback su questo o su altri set di dati nel data lake per COVID-19, contatta askcovid19dl@microsoft.com.

Colonne

Nome Tipo di dati Unica Valori (esempio) Descrizione
admin_region_1 string 864 Texas Georgia Area geografica in country_region
admin_region_2 string 3143 Washington County Jefferson County Area geografica in admin_region_1
confermato int 120.692 1 2 Conteggio di casi confermati per l'area geografica
confirmed_change int 12.120 1 2 Modifica del conteggio di casi confermati rispetto al giorno precedente
country_region string 237 Stati Uniti India Paese/area geografica
morti int 20.616 1 2 Conteggio di casi letali per l'area geografica
deaths_change smallint 1.981 1 2 Modifica del conteggio di casi letali rispetto al giorno precedente
id int 1.783.534 742546 69019298 Identificatore univoco
iso_subdivision string 484 US-TX US-GA Codice di suddivisione ISO in due parti
iso2 string 226 US IN Codice paese a 2 lettere
iso3 string 226 USA IND Codice paese a 3 lettere
latitude double 5.675 42.28708 19.59852 Latitudine del centroide dell'area geografica
load_time timestamp 1 2021-04-26 00:06:34.719000 Data e ora del caricamento del file dall'origine Bing in GitHub
longitude double 5.693 -2.5396 -155.5186 Longitudine del centroide dell'area geografica
guariti int 73.287 1 2 Conteggio di casi di guarigione per l'area geografica
recovered_change int 10.441 1 2 Modifica del conteggio di casi di guarigione rispetto al giorno precedente
informazioni aggiornate data 457 2021-04-23 2021-04-22 Data specifica per il record

Anteprima

id informazioni aggiornate confermato morti iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM
338996 2020-01-22 313 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM 51 0
338997 23-01-2020 578 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM 265 0
338998 2020-01-24 841 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM 263 0
338999 2020-01-25 1320 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM 479 0
339000 2020-01-26 2014 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM 694 0
339001 2020-01-27 2798 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM 784 0
339002 28-01-2020 4593 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM 1795 0
339003 2020-01-29 6065 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM 1472 0
339004 2020-01-30 7818 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 AM 1753 0

Accesso ai dati

Azure Notebooks

Questo notebook documenta gli URL e il codice di esempio per accedere al set di dati Bing COVID-19

Usare gli URL seguenti per ottenere formati di file specifici ospitati in Archiviazione BLOB di Azure:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Scaricare il file del set di dati usando il download delle funzionalità predefinite da un URL HTTP in Pandas. Pandas include lettori per diversi formati di file:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

A questo punto è necessario esaminare i tipi di dati dei vari campi e verificare che la colonna aggiornata sia in formato datetime.

df.dtypes

Verranno ora esaminati i dati in tutto il mondo e verranno tracciati alcuni semplici grafici per visualizzare i dati

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

Esempio non disponibile per questa combinazione di piattaforma/pacchetto.

Azure Synapse

Esempio non disponibile per questa combinazione di piattaforma/pacchetto.

Passaggi successivi

Visualizzare il resto dei set di dati nel catalogo dei set di dati aperti.