COVID Tracking Project

O conjunto de dados do COVID Tracking Project fornece os números mais recentes sobre testes, casos confirmados, hospitalizações e resultados de pacientes de cada estado e território dos EUA.

Para obter mais informações sobre esses conjuntos de dados, consulte o projeto repositório GitHub.

Observação

A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.

Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.

Conjunto de dados

As versões alteradas do conjunto de dados estão disponíveis em CSV, JSON, JSON-Lines e Parquet.

Todas as versões alteradas têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados e usam nomes de coluna em minúsculas com sublinhados como separadores.

Dados brutos: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json '

Versões anteriores de dados brutos e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Volume de dados

Todos os conjuntos de dados são atualizados diariamente. Em 13 de maio de 2020, eles continham 4.100 linhas (com 574 KB em CSV, com 1,8 MB em JSON, com 1,8 MB em JSONL e com 334 KB em Parquet).

Fonte de dados

Esses dados foram publicados originalmente pelo COVID Tracking Project do Atlantic. Os dados brutos são ingeridos do repositório COVID Tracking GitHub usando o arquivo states_daily_4p_et.csv. Para obter mais informações sobre esses conjuntos de dados, incluindo suas origens da API do COVID Tracking Project, consulte o projeto repositório GitHub.

Qualidade dos dados

O COVID Tracking Project classifica a qualidade dos dados de cada estado e fornece mais informações sobre essa classificação. Para obter mais informações, consulte a página de dados do COVID Tracking Project. Os dados no repositório GitHub podem ter um atraso de uma hora em relação à API; o uso da API é necessário para acessar os dados mais recentes.

Atribuição de licença e direitos de uso

Esses dados são licenciados de acordo com os termos e condições do Apache License 2.0.

Qualquer uso dos dados precisa reter todas as notificações de direitos autorais, de marca, de patente e de atribuição.

Contact

Para dúvidas ou comentários sobre este ou outros conjuntos de dados no Data Lake COVID-19, entre em contato com askcovid19dl@microsoft.com.

Colunas

Nome Tipo de dados Exclusivo Valores (exemplo) Descrição
date date 420 2020-11-10 2021-01-30 Data para a qual os totais diários foram coletados.
date_checked string 9\.487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Preterido
morte SMALLINT 7\.327 2 5 Número total de pessoas que faleceram por COVID-19 até o momento.
death_increase SMALLINT 429 1 2 Preterido
fips SMALLINT 56 26 55 Código FIPS do estado para o censo.
fips_code string 60 53 25 Código FIPS do estado para o censo.
hash string 20.780 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Um hash para este registro
hospitalizado INT 7\.641 89995 4 Preterido
hospitalized_cumulative INT 7\.641 89995 4 Número total de pessoas que foram hospitalizadas por COVID-19 até o momento, incluindo aquelas que se recuperaram ou faleceram desde então.
hospitalized_currently SMALLINT 3\.886 8 13 Número de pessoas hospitalizadas por COVID-19 nesse dia.
hospitalized_increase SMALLINT 615 1 2 Preterido
in_icu_cumulative SMALLINT 2\.295 990 220 Número total de pessoas que foram internadas na UTI por COVID-19 até o momento, incluindo aquelas que se recuperaram ou faleceram desde então.
in_icu_currently SMALLINT 1\.643 2 8 Número total de pessoas na UTI por COVID-19 nesse dia.
iso_country string 1 EUA Código do país ou da região ISO 3166
iso_subdivision string 57 US-UM US-WA Código de subdivisão ISO 3166
last_update_et timestamp 9\.487 2020-12-01 00:00:00 2020-09-01 00:00:00 Última vez que os dados do dia foram atualizados
load_time timestamp 1 2021-04-26 00:06:49.883000 Data e hora em que os dados foram carregados no Azure por meio da fonte
negativo INT 10.864 305972 2140 Número total de pessoas que testaram negativo para a COVID-19 até o momento.
negative_increase INT 7\.328 6 17 Preterido
on_ventilator_cumulative SMALLINT 677 411 412 Número total de pessoas que usaram um ventilador para tratamento da COVID-19 até o momento, incluindo aquelas que se recuperaram ou faleceram desde então.
on_ventilator_currently SMALLINT 837 4 10 Número de pessoas que estão usando um ventilador pulmonar para tratamento da COVID-19 nesse dia.
pending SMALLINT 944 2 17 Número de testes cujos resultados ainda não foram determinados.
pos_neg INT 18.282 2140 2 Preterido
positivo INT 16.837 2 1 Número total de pessoas que testaram positivo para a COVID-19 até o momento.
positive_increase SMALLINT 4\.754 1 2 Preterido
recuperados INT 8\.286 29 19 Número total de pessoas que se recuperaram da COVID-19 até o momento.
state string 56 PA MI Código de duas letras do estado.
total INT 18.283 2140 2 Preterido
total_test_results INT 18.648 2140 3 Total de resultados de teste fornecidos pelo Estado
total_test_results_increase INT 13.463 1 2 Preterido

Versão Prévia

date state positivo hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hash date_checked morte hospitalizado total total_test_results pos_neg fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negativo in_icu_cumulative on_ventilator_cumulative recuperados in_icu_currently
2021-03-07 AK 56886 33 1293 2 null 05/03/2021 03:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 05/03/2021 03:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 26/04/2021 00:06:49 EUA
2021-03-07 AL 499819 494 45976 nulo 07/03/2021 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 07/03/2021 11:00:00 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 26/04/2021 00:06:49 EUA 1931711 2676 1515 295690
2021-03-07 AR 324818 335 14926 65 nulo 07/03/2021 00:00:00 50921aeefba3e30d31623aa495b47fb2ecc72fae 07/03/2021 00:00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 26/04/2021 00:06:49 EUA 2480716 1533 315517 141
2021-03-07 AS 0 nulo 01/12/2020 00:00:00 96d23f888c995b9a7f3b4b864de6414f45c728ff 01/12/2020 00:00:00 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 26/04/2021 00:06:49 EUA 2140
2021-03-07 AZ 826454 963 57907 143 nulo 07/03/2021 00:00:00 0437a7a96f4471666f775e63e86923eb5cbd8cdf 07/03/2021 00:00:00 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 26/04/2021 00:06:49 EUA 3073010 273
2021-03-07 CA 3501394 4291 nulo 07/03/2021 02:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 07/03/2021 02:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 26/04/2021 00:06:49 EUA 1159
2021-03-07 CO 436602 326 23904 nulo 07/03/2021 01:59:00 444746cda3a596f183f3fa3269c8cab68704e819 07/03/2021 01:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 26/04/2021 00:06:49 EUA 2199458
2021-03-07 CT 285330 428 12257 nulo 04/03/2021 23:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 04/03/2021 23:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 26/04/2021 00:06:49 EUA
2021-03-07 DC 41419 150 16 nulo 06/03/2021 00:00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 06/03/2021 00:00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 26/04/2021 00:06:49 EUA 29570 38
2021-03-07 DE 88354 104 nulo 06/03/2021 18:00:00 059d870e689d5cc19c35f5eb398214d7d9856373 06/03/2021 18:00:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 26/04/2021 00:06:49 EUA 545070 13

Acesso de dados

Azure Notebooks

URLs de diferentes formatos de arquivo de conjuntos de dados hospedados no Armazenamento de Blobs do Azure:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Baixe o arquivo do conjunto de arquivos usando o download de recurso interno de uma URL http no Pandas. O Pandas tem leitores para vários formatos de arquivo:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Exemplo não disponível para essa combinação de plataforma/pacote.

Azure Synapse

Exemplo não disponível para essa combinação de plataforma/pacote.

Próximas etapas

Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.