Progetto di rilevamento COVID
Il set di dati COVID Tracking Project offre i numeri più aggiornati relativi a test, casi confermati, ospedalizzazioni e risultati per i pazienti da ogni stato e territorio degli Stati Uniti.
Per altre informazioni su questo set di dati, vedere il repository GitHub del progetto.
Nota
Microsoft fornisce set di dati aperti di Azure “così come sono”. Microsoft non fornisce alcuna garanzia, espressa o implicita, né alcuna condizione in merito all'uso dei set di dati da parte dell'utente. Nella misura consentita dalle leggi locali, Microsoft declina ogni responsabilità per eventuali danni o perdite, inclusi danni diretti, consequenziali, speciali, indiretti, accidentali o punitivi, derivanti dall'uso dei set di dati da parte dell'utente.
Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.
Set di dati
Versioni modificate del set di dati sono disponibili in formato CSV, JSON, JSON-Lines e Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
A tutte le versioni modificate sono stati aggiunti codici di suddivisione ISO 3166 e tempi di caricamento e i set di dati usano nomi di colonna minuscoli con caratteri di sottolineatura come separatori.
Dati non elaborati: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'
Versioni precedenti di dati modificati e non elaborati: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Volume dei dati
Tutti i set di dati vengono aggiornati ogni giorno. In data 13 maggio 2020 contenevano 4.100 righe (CSV 574 KB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 KB).
Origine dati
Questi dati sono stati pubblicati originariamente da COVID Tracking Project in The Atlantic. I dati non elaborati vengono inseriti dal repository GitHub di rilevamento COVID usando il file states_daily_4p_et.csv. Per altre informazioni su questo set di dati, incluse le origini dell'API del progetto di rilevamento del COVID, vedere il repository GitHub del progetto.
Qualità dei dati
Il COVID Tracking Project classifica la qualità dei dati per ogni stato e fornisce ulteriori informazioni sulla valutazione della qualità dei dati. Per altre informazioni, vedere la pagina dei dati del COVID Tracking Project. I dati nel repository di GitHub potrebbero essere in ritardo di un'ora rispetto all'API. L'uso dell'API è necessario per accedere ai dati più recenti.
Attribuzione dei diritti di licenza e utilizzo
Questi dati sono concessi in licenza in base a termini e condizioni della Licenza Apache 2.0.
Qualsiasi utilizzo dei dati deve mantenere tutti gli avvisi di copyright, brevetto, marchio e attribuzione.
Contatto
Per eventuali domande o commenti su questo o altri set di dati nel Data lake COVID-19, contattare askcovid19dl@microsoft.com.
Colonne
Nome | Tipo di dati | Unica | Valori (esempio) | Descrizione |
---|---|---|---|---|
data | data | 420 | 10-11-2020 30-01-2021 | Data per cui sono stati raccolti i totali giornalieri. |
date_checked | string | 9,487 | 01-12-2020T00:00:00Z 01-09-2020T00:00:00Z | Deprecato |
morte | smallint | 7,327 | 2 5 | Numero totale di persone decedute per COVID-19 a oggi. |
death_increase | smallint | 429 | 1 2 | Deprecato |
fips | smallint | 56 | 26 55 | Codice FIPS del censimento per lo stato. |
fips_code | string | 60 | 53 25 | Codice FIPS del censimento per lo stato. |
hash | string | 20,780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Hash per questo record |
ospedalizzati | int | 7,641 | 89995 4 | Deprecato |
hospitalized_cumulative | int | 7,641 | 89995 4 | Numero totale di persone che sono state ricoverate in ospedale per COVID-19 a oggi, incluse le persone che sono successivamente guarite o decedute. |
hospitalized_currently | smallint | 3,886 | 8 13 | Numero di persone ricoverate in ospedale per COVID-19 nella giornata specifica. |
hospitalized_increase | smallint | 615 | 1 2 | Deprecato |
in_icu_cumulative | smallint | 2,295 | 990 220 | Numero totale di persone che sono state ricoverate in terapia intensiva per COVID-19 a oggi, incluse le persone che sono successivamente guarite o decedute. |
in_icu_currently | smallint | 1,643 | 2 8 | Numero totale di persone in terapia intensiva per COVID-19 nella giornata specifica. |
iso_country | string | 1 | Stati Uniti | Codice ISO 3166 del paese o dell'area geografica |
iso_subdivision | string | 57 | US-UM US-WA | Codice ISO 3166 di suddivisione |
last_update_et | timestamp | 9,487 | 01-12-2020 00:00:00 01-09-2020 00:00:00 | Ora dell'ultimo aggiornamento dei dati del giorno |
load_time | timestamp | 1 | 26-04-2021 00:06:49.883000 | Data e ora del caricamento dei dati in Azure dall'origine |
negativo | int | 10,864 | 305972 2140 | Numero totale di persone con test negativo per COVID-19 a oggi. |
negative_increase | int | 7,328 | 6 17 | Deprecato |
on_ventilator_cumulative | smallint | 677 | 411 412 | Numero totale di persone che hanno usato un ventilatore per COVID-19 a oggi, incluse le persone che sono successivamente guarite o decedute. |
on_ventilator_currently | smallint | 837 | 4 10 | Numero di persone che usano un ventilatore per COVID-19 nella giornata specifica. |
in sospeso | smallint | 944 | 2 17 | Numero di test i cui risultati devono ancora essere determinati. |
pos_neg | int | 18,282 | 2140 2 | Deprecato |
positivo | int | 16,837 | 2 1 | Numero totale di persone con test positivo per COVID-19 a oggi. |
positive_increase | smallint | 4,754 | 1 2 | Deprecato |
guariti | int | 8,286 | 29 19 | Numero totale di persone guarite da COVID-19 a oggi. |
state | string | 56 | MI PA | Codice di due lettere per lo stato. |
total | int | 18,283 | 2140 2 | Deprecato |
total_test_results | int | 18,648 | 2140 3 | Totale dei risultati di test forniti dallo stato |
total_test_results_increase | int | 13,463 | 1 2 | Deprecato |
Anteprima
data | state | positivo | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hash | date_checked | morte | ospedalizzati | total | total_test_results | pos_neg | fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negativo | in_icu_cumulative | on_ventilator_cumulative | guariti | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
07-03-2021 | AK | 56886 | 33 | 1293 | 2 | Null | 05/03/2021 3:59:00 | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 05/03/2021 3:59:00 | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 26/04/2021 12:06:49 | Stati Uniti | |||||
07-03-2021 | AL | 499819 | 494 | 45976 | Null | 07/03/2021 11:00:00 | 997207b430824ea40b8eb8506c19a93e07bc972e | 07/03/2021 11:00:00 | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 26/04/2021 12:06:49 | Stati Uniti | 1931711 | 2676 | 1515 | 295690 | ||
07-03-2021 | AR | 324818 | 335 | 14926 | 65 | Null | 07/03/2021 12:00:00 | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 07/03/2021 12:00:00 | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 26/04/2021 12:06:49 | Stati Uniti | 2480716 | 1533 | 315517 | 141 | |
07-03-2021 | AS | 0 | Null | 01/12/2020 12:00:00 | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 01/12/2020 12:00:00 | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 26/04/2021 12:06:49 | Stati Uniti | 2140 | ||||||||
07-03-2021 | AZ | 826454 | 963 | 57907 | 143 | Null | 07/03/2021 12:00:00 | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 07/03/2021 12:00:00 | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 26/04/2021 12:06:49 | Stati Uniti | 3073010 | 273 | |||
07-03-2021 | CA | 3501394 | 4291 | Null | 07/03/2021 2:59:00 | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 07/03/2021 2:59:00 | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 26/04/2021 12:06:49 | Stati Uniti | 1159 | ||||||||
07-03-2021 | CO | 436602 | 326 | 23904 | Null | 07/03/2021 1:59:00 | 444746cda3a596f183f3fa3269c8cab68704e819 | 07/03/2021 1:59:00 | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 26/04/2021 12:06:49 | Stati Uniti | 2199458 | |||||
07-03-2021 | CT | 285330 | 428 | 12257 | Null | 04/03/2021 23:59:00 | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 04/03/2021 23:59:00 | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 26/04/2021 12:06:49 | Stati Uniti | ||||||
07-03-2021 | Controller di dominio | 41419 | 150 | 16 | Null | 06/03/2021 12:00:00 | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 06/03/2021 12:00:00 | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 26/04/2021 12:06:49 | Stati Uniti | 29570 | 38 | |||||
07-03-2021 | DE | 88354 | 104 | Null | 06/03/2021 18:00:00 | 059d870e689d5cc19c35f5eb398214d7d9856373 | 06/03/2021 18:00:00 | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 26/04/2021 12:06:49 | Stati Uniti | 545070 | 13 |
Accesso ai dati
Azure Notebooks
URL di formati di file di set di dati diversi ospitati nell’Archiviazione BLOB di Azure:
Scaricare il file del set di dati usando il download delle funzionalità predefinite da un URL HTTP in Pandas. Pandas include lettori per diversi formati di file:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Campione non disponibile per questa combinazione di piattaforma/pacchetto.
Azure Synapse
Campione non disponibile per questa combinazione di piattaforma/pacchetto.
Passaggi successivi
Visualizzare il resto dei set di dati nel catalogo dei set di dati aperti.