Bing COVID-19

Os dados de COVID-19 do Bing incluem os casos confirmados, fatais e recuperados de todas as regiões, atualizados diariamente. Esses dados são refletidos no Rastreador de COVID-19 do Bing.

O Bing coleta dados de diversas fontes seguras e confiáveis, incluindo a Organização Mundial da Saúde (OMS), os Centros de Controle e Prevenção de Doenças (CDC), os departamentos de saúde pública nacionais/regionais e estaduais, o BNO News, o 24/7 Wall St. e a Wikipedia.

Observação

A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.

Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.

Conjunto de dados

Os conjuntos de dados modificados estão disponíveis em CSV, JSON, JSON-Lines e Parquet.

Todos os conjuntos de dados modificados têm códigos da subdivisão ISO 3166 e tempos de carregamento adicionados, além de usarem nomes de coluna em minúsculas com sublinhados como separadores.

Dados brutos: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

Versões anteriores de dados brutos e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Volume de dados

Todos os conjuntos de dados são atualizados diariamente. Em 11 de maio de 2020, eles continham 125.576 linhas (CSV com 16,1 MB, JSON com 40 MB, JSONL com 39,6 MB, Parquet com 1,1 MB).

Atribuição de licença e direitos de uso

Esses dados estão disponíveis estritamente para fins educacionais e acadêmicos, como pesquisa médica, agências governamentais e instituições acadêmicas, em termos e condições.

Os dados usados ou citados em publicações devem incluir uma atribuição ao "Bing COVID-19 Tracker" com um link para www.bing.com/covid.

Contact

Caso tenha perguntas ou comentários sobre este ou outros conjuntos de dados do Data Lake COVID-19, entre em contato com askcovid19dl@microsoft.com.

Colunas

Nome Tipo de dados Exclusivo Valores (exemplo) Descrição
admin_region_1 string 864 Texas Georgia Região em country_region
admin_region_2 string 3.143 Condado de Jefferson do Condado de Washington Região em admin_region_1
confirmado INT 120.692 1 2 Contagem dos casos confirmados na região
confirmed_change INT 12.120 1 2 Alteração na contagem de casos confirmados do dia anterior
country_region string 237 Estados Unidos Índia País/Região
mortes INT 20.616 1 2 Contagem dos casos de mortes por região
deaths_change SMALLINT 1\.981 1 2 Alteração na contagem de mortes do dia anterior
id INT 1\.783.534 742546 69019298 Identificador exclusivo
iso_subdivision string 484 US-TX US-GA Código de subdivisão ISO de duas partes
iso2 string 226 US IN Identificador de código do país de duas letras
iso3 string 226 USA IND Identificador de código do país de três letras
latitude double 5\.675 42.28708 19.59852 Latitude do centroide da região
load_time timestamp 1 2021-04-26 00:06:34.719000 A data e hora em que o arquivo foi carregado da origem do Bing no GitHub
longitude double 5\.693 -2.5396 -155.5186 Longitude do centroide da região
recuperados INT 73.287 1 2 Contagem dos recuperados na região
recovered_change INT 10.441 1 2 Alteração na contagem de casos recuperados do dia anterior
atualizado date 457 2021-04-23 2021-04-22 A data no momento do registro

Versão Prévia

id atualizado confirmado mortes iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 21/01/2020 262 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34
338996 22/01/2020 313 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 51 0
338997 23/01/2020 578 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 265 0
338998 24/01/2020 841 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 263 0
338999 25/01/2020 1320 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 479 0
339000 26/01/2020 2014 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 694 0
339001 27/01/2020 2798 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 784 0
339002 28/01/2020 4593 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 1795 0
339003 29/01/2020 6065 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 1.472 0
339004 30/01/2020 7818 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 1753 0

Acesso de dados

Azure Notebooks

Este notebook documenta as URLs e o código de exemplo para acessar conjunto de dados Bing COVID-19

Use as seguintes URLs para obter formatos de arquivo específicos hospedados no Armazenamento de Blobs do Azure:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Baixe o arquivo do conjunto de arquivos usando o download de recurso interno de uma URL http no Pandas. O Pandas tem leitores para vários formatos de arquivo:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Permite verificar os tipos de dados dos vários campos e verificar se a coluna atualizada é do formato DATETIME

df.dtypes

Agora, vamos analisar dados em todo o mundo e plotar alguns gráficos simples para visualizar os dados

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

Exemplo não disponível para essa combinação de plataforma/pacote.

Azure Synapse

Exemplo não disponível para essa combinação de plataforma/pacote.

Próximas etapas

Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.