Bing COVID-19
Os dados de COVID-19 do Bing incluem os casos confirmados, fatais e recuperados de todas as regiões, atualizados diariamente. Esses dados são refletidos no Rastreador de COVID-19 do Bing.
O Bing coleta dados de diversas fontes seguras e confiáveis, incluindo a Organização Mundial da Saúde (OMS), os Centros de Controle e Prevenção de Doenças (CDC), os departamentos de saúde pública nacionais/regionais e estaduais, o BNO News, o 24/7 Wall St. e a Wikipedia.
Observação
A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.
Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.
Conjunto de dados
Os conjuntos de dados modificados estão disponíveis em CSV, JSON, JSON-Lines e Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet
Todos os conjuntos de dados modificados têm códigos da subdivisão ISO 3166 e tempos de carregamento adicionados, além de usarem nomes de coluna em minúsculas com sublinhados como separadores.
Dados brutos: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv
Versões anteriores de dados brutos e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/
Volume de dados
Todos os conjuntos de dados são atualizados diariamente. Em 11 de maio de 2020, eles continham 125.576 linhas (CSV com 16,1 MB, JSON com 40 MB, JSONL com 39,6 MB, Parquet com 1,1 MB).
Atribuição de licença e direitos de uso
Esses dados estão disponíveis estritamente para fins educacionais e acadêmicos, como pesquisa médica, agências governamentais e instituições acadêmicas, em termos e condições.
Os dados usados ou citados em publicações devem incluir uma atribuição ao "Bing COVID-19 Tracker" com um link para www.bing.com/covid.
Contact
Caso tenha perguntas ou comentários sobre este ou outros conjuntos de dados do Data Lake COVID-19, entre em contato com askcovid19dl@microsoft.com.
Colunas
Nome | Tipo de dados | Exclusivo | Valores (exemplo) | Descrição |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Região em country_region |
admin_region_2 | string | 3.143 | Condado de Jefferson do Condado de Washington | Região em admin_region_1 |
confirmado | INT | 120.692 | 1 2 | Contagem dos casos confirmados na região |
confirmed_change | INT | 12.120 | 1 2 | Alteração na contagem de casos confirmados do dia anterior |
country_region | string | 237 | Estados Unidos Índia | País/Região |
mortes | INT | 20.616 | 1 2 | Contagem dos casos de mortes por região |
deaths_change | SMALLINT | 1\.981 | 1 2 | Alteração na contagem de mortes do dia anterior |
id | INT | 1\.783.534 | 742546 69019298 | Identificador exclusivo |
iso_subdivision | string | 484 | US-TX US-GA | Código de subdivisão ISO de duas partes |
iso2 | string | 226 | US IN | Identificador de código do país de duas letras |
iso3 | string | 226 | USA IND | Identificador de código do país de três letras |
latitude | double | 5\.675 | 42.28708 19.59852 | Latitude do centroide da região |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | A data e hora em que o arquivo foi carregado da origem do Bing no GitHub |
longitude | double | 5\.693 | -2.5396 -155.5186 | Longitude do centroide da região |
recuperados | INT | 73.287 | 1 2 | Contagem dos recuperados na região |
recovered_change | INT | 10.441 | 1 2 | Alteração na contagem de casos recuperados do dia anterior |
atualizado | date | 457 | 2021-04-23 2021-04-22 | A data no momento do registro |
Versão Prévia
id | atualizado | confirmado | mortes | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 21/01/2020 | 262 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | ||
338996 | 22/01/2020 | 313 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 51 | 0 |
338997 | 23/01/2020 | 578 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 265 | 0 |
338998 | 24/01/2020 | 841 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 263 | 0 |
338999 | 25/01/2020 | 1320 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 479 | 0 |
339000 | 26/01/2020 | 2014 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 694 | 0 |
339001 | 27/01/2020 | 2798 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 784 | 0 |
339002 | 28/01/2020 | 4593 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 1795 | 0 |
339003 | 29/01/2020 | 6065 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 1.472 | 0 |
339004 | 30/01/2020 | 7818 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 1753 | 0 |
Acesso de dados
Azure Notebooks
Este notebook documenta as URLs e o código de exemplo para acessar conjunto de dados Bing COVID-19
Use as seguintes URLs para obter formatos de arquivo específicos hospedados no Armazenamento de Blobs do Azure:
Baixe o arquivo do conjunto de arquivos usando o download de recurso interno de uma URL http no Pandas. O Pandas tem leitores para vários formatos de arquivo:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Permite verificar os tipos de dados dos vários campos e verificar se a coluna atualizada é do formato DATETIME
df.dtypes
Agora, vamos analisar dados em todo o mundo e plotar alguns gráficos simples para visualizar os dados
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Azure Databricks
Exemplo não disponível para essa combinação de plataforma/pacote.
Azure Synapse
Exemplo não disponível para essa combinação de plataforma/pacote.
Próximas etapas
Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.