Progetto di rilevamento COVID

Il set di dati COVID Tracking Project offre i numeri più aggiornati relativi a test, casi confermati, ospedalizzazioni e risultati per i pazienti da ogni stato e territorio degli Stati Uniti.

Per altre informazioni su questo set di dati, vedere il repository GitHub del progetto.

Nota

Microsoft fornisce set di dati aperti di Azure “così come sono”. Microsoft non fornisce alcuna garanzia, espressa o implicita, né alcuna condizione in merito all'uso dei set di dati da parte dell'utente. Nella misura consentita dalle leggi locali, Microsoft declina ogni responsabilità per eventuali danni o perdite, inclusi danni diretti, consequenziali, speciali, indiretti, accidentali o punitivi, derivanti dall'uso dei set di dati da parte dell'utente.

Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.

Set di dati

Versioni modificate del set di dati sono disponibili in formato CSV, JSON, JSON-Lines e Parquet.

A tutte le versioni modificate sono stati aggiunti codici di suddivisione ISO 3166 e tempi di caricamento e i set di dati usano nomi di colonna minuscoli con caratteri di sottolineatura come separatori.

Dati non elaborati: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'

Versioni precedenti di dati modificati e non elaborati: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Volume dei dati

Tutti i set di dati vengono aggiornati ogni giorno. In data 13 maggio 2020 contenevano 4.100 righe (CSV 574 KB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 KB).

Origine dati

Questi dati sono stati pubblicati originariamente da COVID Tracking Project in The Atlantic. I dati non elaborati vengono inseriti dal repository GitHub di rilevamento COVID usando il file states_daily_4p_et.csv. Per altre informazioni su questo set di dati, incluse le origini dell'API del progetto di rilevamento del COVID, vedere il repository GitHub del progetto.

Qualità dei dati

Il COVID Tracking Project classifica la qualità dei dati per ogni stato e fornisce ulteriori informazioni sulla valutazione della qualità dei dati. Per altre informazioni, vedere la pagina dei dati del COVID Tracking Project. I dati nel repository di GitHub potrebbero essere in ritardo di un'ora rispetto all'API. L'uso dell'API è necessario per accedere ai dati più recenti.

Attribuzione dei diritti di licenza e utilizzo

Questi dati sono concessi in licenza in base a termini e condizioni della Licenza Apache 2.0.

Qualsiasi utilizzo dei dati deve mantenere tutti gli avvisi di copyright, brevetto, marchio e attribuzione.

Contatto

Per eventuali domande o commenti su questo o altri set di dati nel Data lake COVID-19, contattare askcovid19dl@microsoft.com.

Colonne

Nome Tipo di dati Unica Valori (esempio) Descrizione
data data 420 10-11-2020 30-01-2021 Data per cui sono stati raccolti i totali giornalieri.
date_checked string 9,487 01-12-2020T00:00:00Z 01-09-2020T00:00:00Z Deprecato
morte smallint 7,327 2 5 Numero totale di persone decedute per COVID-19 a oggi.
death_increase smallint 429 1 2 Deprecato
fips smallint 56 26 55 Codice FIPS del censimento per lo stato.
fips_code string 60 53 25 Codice FIPS del censimento per lo stato.
hash string 20,780 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Hash per questo record
ospedalizzati int 7,641 89995 4 Deprecato
hospitalized_cumulative int 7,641 89995 4 Numero totale di persone che sono state ricoverate in ospedale per COVID-19 a oggi, incluse le persone che sono successivamente guarite o decedute.
hospitalized_currently smallint 3,886 8 13 Numero di persone ricoverate in ospedale per COVID-19 nella giornata specifica.
hospitalized_increase smallint 615 1 2 Deprecato
in_icu_cumulative smallint 2,295 990 220 Numero totale di persone che sono state ricoverate in terapia intensiva per COVID-19 a oggi, incluse le persone che sono successivamente guarite o decedute.
in_icu_currently smallint 1,643 2 8 Numero totale di persone in terapia intensiva per COVID-19 nella giornata specifica.
iso_country string 1 Stati Uniti Codice ISO 3166 del paese o dell'area geografica
iso_subdivision string 57 US-UM US-WA Codice ISO 3166 di suddivisione
last_update_et timestamp 9,487 01-12-2020 00:00:00 01-09-2020 00:00:00 Ora dell'ultimo aggiornamento dei dati del giorno
load_time timestamp 1 26-04-2021 00:06:49.883000 Data e ora del caricamento dei dati in Azure dall'origine
negativo int 10,864 305972 2140 Numero totale di persone con test negativo per COVID-19 a oggi.
negative_increase int 7,328 6 17 Deprecato
on_ventilator_cumulative smallint 677 411 412 Numero totale di persone che hanno usato un ventilatore per COVID-19 a oggi, incluse le persone che sono successivamente guarite o decedute.
on_ventilator_currently smallint 837 4 10 Numero di persone che usano un ventilatore per COVID-19 nella giornata specifica.
in sospeso smallint 944 2 17 Numero di test i cui risultati devono ancora essere determinati.
pos_neg int 18,282 2140 2 Deprecato
positivo int 16,837 2 1 Numero totale di persone con test positivo per COVID-19 a oggi.
positive_increase smallint 4,754 1 2 Deprecato
guariti int 8,286 29 19 Numero totale di persone guarite da COVID-19 a oggi.
state string 56 MI PA Codice di due lettere per lo stato.
total int 18,283 2140 2 Deprecato
total_test_results int 18,648 2140 3 Totale dei risultati di test forniti dallo stato
total_test_results_increase int 13,463 1 2 Deprecato

Anteprima

data state positivo hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hash date_checked morte ospedalizzati total total_test_results pos_neg fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negativo in_icu_cumulative on_ventilator_cumulative guariti in_icu_currently
07-03-2021 AK 56886 33 1293 2 Null 05/03/2021 3:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 05/03/2021 3:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 26/04/2021 12:06:49 Stati Uniti
07-03-2021 AL 499819 494 45976 Null 07/03/2021 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 07/03/2021 11:00:00 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 26/04/2021 12:06:49 Stati Uniti 1931711 2676 1515 295690
07-03-2021 AR 324818 335 14926 65 Null 07/03/2021 12:00:00 50921aeefba3e30d31623aa495b47fb2ecc72fae 07/03/2021 12:00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 26/04/2021 12:06:49 Stati Uniti 2480716 1533 315517 141
07-03-2021 AS 0 Null 01/12/2020 12:00:00 96d23f888c995b9a7f3b4b864de6414f45c728ff 01/12/2020 12:00:00 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 26/04/2021 12:06:49 Stati Uniti 2140
07-03-2021 AZ 826454 963 57907 143 Null 07/03/2021 12:00:00 0437a7a96f4471666f775e63e86923eb5cbd8cdf 07/03/2021 12:00:00 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 26/04/2021 12:06:49 Stati Uniti 3073010 273
07-03-2021 CA 3501394 4291 Null 07/03/2021 2:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 07/03/2021 2:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 26/04/2021 12:06:49 Stati Uniti 1159
07-03-2021 CO 436602 326 23904 Null 07/03/2021 1:59:00 444746cda3a596f183f3fa3269c8cab68704e819 07/03/2021 1:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 26/04/2021 12:06:49 Stati Uniti 2199458
07-03-2021 CT 285330 428 12257 Null 04/03/2021 23:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 04/03/2021 23:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 26/04/2021 12:06:49 Stati Uniti
07-03-2021 Controller di dominio 41419 150 16 Null 06/03/2021 12:00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 06/03/2021 12:00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 26/04/2021 12:06:49 Stati Uniti 29570 38
07-03-2021 DE 88354 104 Null 06/03/2021 18:00:00 059d870e689d5cc19c35f5eb398214d7d9856373 06/03/2021 18:00:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 26/04/2021 12:06:49 Stati Uniti 545070 13

Accesso ai dati

Azure Notebooks

URL di formati di file di set di dati diversi ospitati nell’Archiviazione BLOB di Azure:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Scaricare il file del set di dati usando il download delle funzionalità predefinite da un URL HTTP in Pandas. Pandas include lettori per diversi formati di file:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Campione non disponibile per questa combinazione di piattaforma/pacchetto.

Azure Synapse

Campione non disponibile per questa combinazione di piattaforma/pacchetto.

Passaggi successivi

Visualizzare il resto dei set di dati nel catalogo dei set di dati aperti.