Centro europeo per la prevenzione e il controllo delle malattie (ECDC) CASI DI COVID-19

I dati pubblici più recenti disponibili sulla distribuzione geografica dei casi di COVID-19 in tutto il mondo dal Centro europeo per la prevenzione e il controllo delle malattie (ECDC). Ogni riga/voce contiene il numero di nuovi casi segnalati al giorno e in ogni paese o area.

Nota

Microsoft fornisce set di dati aperti di Azure su base "così come è". Microsoft non garantisce, esplicitamente o implicitamente, garanzie o condizioni in relazione all'uso dei set di dati. Nella misura consentita dalla legge locale, Microsoft dichiara tutte le responsabilità per eventuali danni o perdite, tra cui diretto, consequenziale, speciale, indiretto, incidentale o incidentale, risultante dall'uso dei set di dati.

Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.

Set di dati

Versioni modificate del set di dati sono disponibili in formato CSV, JSON, JSON-Lines e Parquet e vengono aggiornate ogni giorno:

A tutte le versioni modificate sono stati aggiunti codici iso_country_region e tempi di caricamento e i set di dati usano nomi di colonna minuscoli con caratteri di sottolineatura come separatori.

Dati non elaborati: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Versioni precedenti di dati modificati e non elaborati: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Volume dati

In data 28 maggio 2020 contenevano 19.876 righe (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).

Origine dati

I dati non elaborati vengono inseriti ogni giorno dal file CSV ECDC. Per altre informazioni su questo set di dati, incluse le relative origini, vedere la pagina della raccolta dati ECDC.

Qualità dei dati

ECDC non garantisce l'accuratezza o la tempestività dei dati. Leggere la dichiarazione di non responsabilità.

Attribuzione dei diritti di licenza e utilizzo

Questi dati vengono resi disponibili e ne è consentito l'uso in base ai criteri per il copyright di ECDC, disponibili qui. Per eventuali documenti con copyright di terze parti, è necessario ottenere l'autorizzazione per la riproduzione dal proprietario del copyright.

È necessario indicare sempre ECDC come fonte originale dei dati. Tale riconoscimento deve essere incluso in ogni copia del materiale.

Contatto

Se hai domande o feedback su questo o su altri set di dati nel data lake per COVID-19, contatta askcovid19dl@microsoft.com.

Colonne

Nome Tipo di dati Univoco Valori (esempio) Descrizione
cases SMALLINT 5,515 1 2 Numero di casi segnalati
continent_exp string 6 Europa Africa Nome del continente
countries_and_territories string 214 Canada Belgio Nome del paese o del territorio
country_territory_code string 213 KOR ISL Codice di tre lettere per il paese o il territorio
date_rep data 350 2020-12-11 2020-11-22 Data del report
day SMALLINT 31 14 13 Giorno del mese
Morti SMALLINT 1,049 1 2 Numero di decessi segnalati
geo_id string 214 Edizione Standard CA Identificatore geografico
iso_country string 214 edizione Standard Stati Uniti Codice ISO 3166 del paese o dell'area geografica
load_date timestamp 1 2021-04-26 00:06:22.123000 Data del caricamento dei dati in Azure
month SMALLINT 12 10 8 Numero del mese
anno SMALLINT 2 2020 2019 Year

Anteprima

date_rep day month anno cases Morti countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afghanistan AF AFG Asia 26/4/2021 12:06:22 AF
2020-12-13 13 12 2020 298 9 Afghanistan AF AFG Asia 26/4/2021 12:06:22 AF
2020-12-12 12 12 2020 113 11 Afghanistan AF AFG Asia 26/4/2021 12:06:22 AF
2020-12-11 11 12 2020 63 10 Afghanistan AF AFG Asia 26/4/2021 12:06:22 AF
2020-12-10 10 12 2020 202 16 Afghanistan AF AFG Asia 26/4/2021 12:06:22 AF
2020-12-09 9 12 2020 135 13 Afghanistan AF AFG Asia 26/4/2021 12:06:22 AF
2020-12-08 8 12 2020 200 6 Afghanistan AF AFG Asia 26/4/2021 12:06:22 AF
2020-12-07 7 12 2020 210 26 Afghanistan AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-06 6 12 2020 234 10 Afghanistan AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-05 5 12 2020 235 18 Afghanistan AF AFG Asia 4/26/2021 12:06:22 AM AF

Accesso ai dati

Azure Notebooks

Questo notebook documenta gli URL e il codice di esempio per accedere al Centro europeo per la prevenzione e il controllo delle malattie (ECDC) Covid-19 Case set di dati URL di set di dati diversi ospitati in Archiviazione BLOB di Azure:++ CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Scaricare il file del set di dati usando la funzionalità predefinita scaricata da un URL http in Pandas. Pandas ha lettori per vari formati di file:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Esempio non disponibile per questa combinazione di piattaforma/pacchetto.

Azure Synapse

Esempio non disponibile per questa combinazione di piattaforma/pacchetto.

Esempio

Vedere esempi di come è possibile usare questo set di dati:

Passaggi successivi

Visualizzare il resto dei set di dati nel catalogo Open Datasets.