Casos de COVID-19 del Centro europeo para la prevención y el control de enfermedades (ECDC)

Datos públicos más recientes disponibles sobre la distribución geográfica de los casos de COVID-19 en todo el mundo proporcionados por el Centro europeo para la prevención y el control de enfermedades (ECDC). Cada fila o entrada contiene el número de casos nuevos notificados cada día por países o regiones.

Nota

Microsoft proporciona Azure Open Datasets "tal cual". Microsoft no ofrece ninguna garantía, expresa o implícita, ni condición con respecto al uso que usted haga de los conjuntos de datos. En la medida en la que lo permita su legislación local, Microsoft declina toda responsabilidad por posibles daños o pérdidas, incluidos los daños directos, consecuenciales, especiales, indirectos, incidentales o punitivos, que resulten de su uso de los conjuntos de datos.

Este conjunto de datos se proporciona bajo los términos originales con los que Microsoft recibió los datos de origen. El conjunto de datos puede incluir datos procedentes de Microsoft.

Conjuntos de datos

Las versiones modificadas del conjunto de datos están disponibles con los formatos CSV, JSON, JSON-Lines y Parquet, y se actualizan a diario.

Todas las versiones modificadas tienen códigos iso_country_region y los tiempos de carga agregados, y utilizan minúsculas para los nombres de las columnas con guiones bajos como separadores.

Datos sin procesar: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Versiones anteriores de datos modificados y sin procesar: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/ https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Volumen de datos

El 28 de mayo de 2020 contenían 19 876 filas (CSV: 1,5 MB, JSON: 4,9 MB, JSONL: 4,9 MB, Parquet: 54,1 MB).

Origen de datos

Los datos sin procesar se ingieren diariamente desde el archivo CSV del ECDC. Para más información sobre este conjunto de datos, incluidos sus orígenes, consulte la página de recopilación de datos del ECDC.

Calidad de los datos

El ECDC no garantiza la precisión de los datos ni que estén actualizados. Lea la declinación de responsabilidades.

Atribución de licencias y derechos de uso

Estos datos se ofrecen y se pueden usar conforme a la directiva de propiedad intelectual del ECDC, disponible aquí. En el caso de los documentos cuya propiedad intelectual sea de un tercero, debe obtenerse el permiso del titular de tal propiedad intelectual para poder reproducirlos.

Siempre debe reconocerse al ECDC como origen de estos datos. Dicho reconocimiento se debe incluir en todas las copias del material.

Contacto

Si tiene alguna duda o desea aportar algún comentario sobre este u otros conjuntos de datos del lago de datos COVID-19, póngase en contacto con askcovid19dl@microsoft.com.

Columnas

Nombre Tipo de datos Único Valores (ejemplo) Descripción
cases SMALLINT 5515 1 2 Número de casos notificados.
continent_exp string 6 Europa África Nombre del continente.
countries_and_territories string 214 Canadá Bélgica Nombre del país o territorio.
country_territory_code string 213 KOR ISL Código de tres letras del país o el territorio.
date_rep date 350 2020-12-11 2020-11-22 Fecha del informe.
day SMALLINT 31 14 13 Día del mes.
deaths SMALLINT 1049 1 2 Número de fallecimientos notificados.
geo_id string 214 CA SE Identificador geográfico.
iso_country string 214 SE US Código de país o región conforme a la norma ISO 3166.
load_date timestamp 1 2021-04-26 00:06:22.123000 Fecha en la que se cargaron los datos en Azure.
month SMALLINT 12 10 8 Número de mes.
year SMALLINT 2 2020 2019 Year

Vista previa

date_rep day month year cases deaths countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-13 13 12 2020 298 9 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-12 12 12 2020 113 11 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-11 11 12 2020 63 10 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-10 10 12 2020 202 16 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-09 9 12 2020 135 13 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-08 8 12 2020 200 6 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-07 7 12 2020 210 26 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-06 6 12 2020 234 10 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF
2020-12-05 5 12 2020 235 18 Afganistán AF AFG Asia 4/26/2021 12:06:22 AM AF

Acceso a datos

Azure Notebooks

Este cuaderno documenta las direcciones URL y el código de ejemplo para acceder al Centro europeo para la prevención y el control de enfermedades (ECDC). Direcciones URL de diferentes formatos de archivo del conjunto de datos de casos de Covid-19 hospedados en Azure Blob Storage:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Descargue el archivo del conjunto de datos mediante la funcionalidad integrada de descarga desde una dirección URL HTTP de Pandas. Pandas tiene lectores para varios formatos de archivo:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Ejemplo no disponible para esta combinación de plataforma y paquete.

Azure Synapse

Ejemplo no disponible para esta combinación de plataforma y paquete.

Ejemplos

Consulte ejemplos de cómo se puede usar este conjunto de datos:

Pasos siguientes

Consulte el resto de los conjuntos de datos en el catálogo de Open Datasets.