Bing COVID-19

Os dados COVID-19 do Bing incluem casos confirmados, fatais e recuperados de todas as regiões, que são atualizados diariamente. Estes dados estão refletidos no Monitorizador da COVID-19 do Bing.

O Bing coleta dados de várias fontes confiáveis e confiáveis, incluindo a Organização Mundial da Saúde (OMS), Centros de Controle e Prevenção de Doenças (CDC), departamentos de saúde pública nacionais/regionais e estaduais, BNO News, Wall St. 24/7 e Wikipedia.

Nota

A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.

Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.

Conjuntos de Dados

Os conjuntos de dados modificados estão disponíveis em CSV, JSON, JSON-Lines e Parquet.

Todos os conjuntos de dados modificados têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados, e utilizam nomes de colunas em minúsculas com separadores de caráter de sublinhado.

Dados não processados: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

Versões anteriores de dados não processados e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Volume de dados

Todos os conjuntos de dados são atualizados diariamente. Em 11 de maio de 2020, eles continham 125.576 linhas (CSV 16.1 MB, JSON 40.0 MB, JSONL 39.6 MB, Parquet 1.1 MB).

Atribuição de licenças e direitos de utilização

Esses dados estão disponíveis estritamente para fins educacionais e acadêmicos, como pesquisa médica, agências governamentais e instituições acadêmicas, sob termos e condições.

Os dados usados ou citados em publicações devem incluir uma atribuição ao 'Bing COVID-19 Tracker' com um link para www.bing.com/covid.

Contacto

Se tiver questões ou comentários sobre este ou outros conjuntos de dados no COVID-19 Data Lake, contacte askcovid19dl@microsoft.com.

Colunas

Name Tipo de dados Exclusivo Values (sample) Description
admin_region_1 string 864 Texas Geórgia Região em country_region
admin_region_2 string 3143 Condado de Washington Condado de Jefferson Região em admin_region_1
confirmado número inteiro 120,692 1 2 Número de casos confirmados da região
confirmed_change número inteiro 12,120 1 2 Alteração do número de casos confirmados do dia anterior
country_region string 237 Estados Unidos Índia País/Região
Óbitos número inteiro 20,616 1 2 Número de casos de morte da região
deaths_change smallint 1,981 1 2 Alteração do número de mortes do dia anterior
ID número inteiro 1,783,534 742546 69019298 Identificador exclusivo
iso_subdivision string 484 EUA-TX EUA-GA Código de subdivisão ISO em duas partes
ISO2 string 226 EUA EM Identificador do código do país de 2 letras
ISO3 string 226 EUA IND Identificador do código do país de 3 letras
latitude duplo 5,675 42.28708 19.59852 Latitude do centroide da região
load_time carimbo de data/hora 1 2021-04-26 00:06:34.719000 A data e a hora de carregamento do ficheiro da origem do Bing no GitHub
longitude duplo 5,693 -2.5396 -155.5186 Longitude do centroide da região
recuperados número inteiro 73,287 1 2 Número de casos recuperados da região
recovered_change número inteiro 10,441 1 2 Alteração do número de casos recuperados do dia anterior
atualizado data 457 2021-04-23 2021-04-22 A data do registo

Pré-visualizar

ID atualizado confirmado Óbitos ISO2 ISO3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34
338996 2020-01-22 313 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 51 0
338997 2020-01-23 578 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 265 0
338998 2020-01-24 841 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 263 0
338999 2020-01-25 1320 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 479 0
339000 2020-01-26 2014 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 694 0
339001 2020-01-27 2798 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 784 0
339002 2020-01-28 4593 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 1795 0
339003 2020-01-29 6065 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 1472 0
339004 2020-01-30 7818 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 1753 0

Acesso a dados

Azure Notebooks

Este bloco de anotações documenta as URLs e o código de exemplo para acessar o conjunto de dados do Bing COVID-19

Use as seguintes URLs para obter formatos de arquivo específicos hospedados no Armazenamento de Blobs do Azure:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Transfira o ficheiro do conjunto de dados utilizando a capacidade de transferência incorporada a partir de um URL http no Pandas. Pandas tem leitores para vários formatos de arquivo:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Permite verificar os tipos de dados dos vários campos e verificar se a coluna atualizada é o formato datetime

df.dtypes

Vamos agora olhar para os dados mundiais e plotar alguns gráficos simples para visualizar os dados

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

Amostra não disponível para esta combinação de plataforma/pacote.

Azure Synapse

Amostra não disponível para esta combinação de plataforma/pacote.

Próximos passos

Exiba o restante dos conjuntos de dados no catálogo Open Datasets.