Bing COVID-19
I dati su COVID-19 di Bing includono i casi confermati, letali e di guarigione da tutte le aree geografiche, aggiornati ogni giorno. Questi dati sono rispecchiati in Bing COVID-19 Tracker.
Bing raccoglie dati da più origini attendibili e affidabili, tra cui l'Organizzazione mondiale della sanità (OMS), Center for Disease Control and Prevention (CDC), i reparti sanitari pubblici nazionali/regionali e statali, BNO News, 24/7 Wall St. e Wikipedia.
Nota
Microsoft fornisce i set di dati aperti di Azure "così come sono". Microsoft non fornisce alcuna garanzia, espressa o implicita, né alcuna condizione in merito all'uso dei set di dati da parte dell'utente. Nella misura consentita dalle leggi locali, Microsoft declina ogni responsabilità per eventuali danni o perdite, inclusi danni diretti, consequenziali, particolari, indiretti, accidentali o indennizzi, derivanti dall'uso dei set di dati da parte dell'utente.
Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.
Set di dati
I set di dati modificati sono disponibili in CSV, JSON, JSON-Lines e Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet
A tutti i set di dati modificati sono stati aggiunti codici di suddivisione ISO 3166 e tempi di caricamento e i set di dati usano nomi di colonna minuscoli con caratteri di sottolineatura come separatori.
Dati non elaborati: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv
Versioni precedenti di dati modificati e non elaborati: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/
Volume dei dati
Tutti i set di dati vengono aggiornati ogni giorno. A partire dall'11 maggio 2020, contengono 125.576 righe (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).
Attribuzione dei diritti di licenza e utilizzo
Questi dati sono disponibili esclusivamente per scopi didattici e accademici, ad esempio per la ricerca medica, le agenzie governative e gli istituti accademici, in base a condizioni.
I dati usati o citati nelle pubblicazioni devono includere un'attribuzione a 'Bing COVID-19 Tracker' con un collegamento a www.bing.com/covid.
Contatto
Se hai domande o feedback su questo o su altri set di dati nel data lake per COVID-19, contatta askcovid19dl@microsoft.com.
Colonne
Nome | Tipo di dati | Unica | Valori (esempio) | Descrizione |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Area geografica in country_region |
admin_region_2 | string | 3143 | Washington County Jefferson County | Area geografica in admin_region_1 |
confermato | int | 120.692 | 1 2 | Conteggio di casi confermati per l'area geografica |
confirmed_change | int | 12.120 | 1 2 | Modifica del conteggio di casi confermati rispetto al giorno precedente |
country_region | string | 237 | Stati Uniti India | Paese/area geografica |
morti | int | 20.616 | 1 2 | Conteggio di casi letali per l'area geografica |
deaths_change | smallint | 1.981 | 1 2 | Modifica del conteggio di casi letali rispetto al giorno precedente |
id | int | 1.783.534 | 742546 69019298 | Identificatore univoco |
iso_subdivision | string | 484 | US-TX US-GA | Codice di suddivisione ISO in due parti |
iso2 | string | 226 | US IN | Codice paese a 2 lettere |
iso3 | string | 226 | USA IND | Codice paese a 3 lettere |
latitude | double | 5.675 | 42.28708 19.59852 | Latitudine del centroide dell'area geografica |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | Data e ora del caricamento del file dall'origine Bing in GitHub |
longitude | double | 5.693 | -2.5396 -155.5186 | Longitudine del centroide dell'area geografica |
guariti | int | 73.287 | 1 2 | Conteggio di casi di guarigione per l'area geografica |
recovered_change | int | 10.441 | 1 2 | Modifica del conteggio di casi di guarigione rispetto al giorno precedente |
informazioni aggiornate | data | 457 | 2021-04-23 2021-04-22 | Data specifica per il record |
Anteprima
id | informazioni aggiornate | confermato | morti | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | ||
338996 | 2020-01-22 | 313 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | 51 | 0 |
338997 | 23-01-2020 | 578 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | 784 | 0 |
339002 | 28-01-2020 | 4593 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | Null | Null | Tutto il mondo | Null | Null | Null | 4/26/2021 12:06:34 AM | 1753 | 0 |
Accesso ai dati
Azure Notebooks
Questo notebook documenta gli URL e il codice di esempio per accedere al set di dati Bing COVID-19
Usare gli URL seguenti per ottenere formati di file specifici ospitati in Archiviazione BLOB di Azure:
Scaricare il file del set di dati usando il download delle funzionalità predefinite da un URL HTTP in Pandas. Pandas include lettori per diversi formati di file:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
A questo punto è necessario esaminare i tipi di dati dei vari campi e verificare che la colonna aggiornata sia in formato datetime.
df.dtypes
Verranno ora esaminati i dati in tutto il mondo e verranno tracciati alcuni semplici grafici per visualizzare i dati
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Azure Databricks
Esempio non disponibile per questa combinazione di piattaforma/pacchetto.
Azure Synapse
Esempio non disponibile per questa combinazione di piattaforma/pacchetto.
Passaggi successivi
Visualizzare il resto dei set di dati nel catalogo dei set di dati aperti.