Bing COVID-19
Os dados COVID-19 do Bing incluem casos confirmados, fatais e recuperados de todas as regiões, que são atualizados diariamente. Estes dados estão refletidos no Monitorizador da COVID-19 do Bing.
O Bing coleta dados de várias fontes confiáveis e confiáveis, incluindo a Organização Mundial da Saúde (OMS), Centros de Controle e Prevenção de Doenças (CDC), departamentos de saúde pública nacionais/regionais e estaduais, BNO News, Wall St. 24/7 e Wikipedia.
Nota
A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.
Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.
Conjuntos de Dados
Os conjuntos de dados modificados estão disponíveis em CSV, JSON, JSON-Lines e Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet
Todos os conjuntos de dados modificados têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados, e utilizam nomes de colunas em minúsculas com separadores de caráter de sublinhado.
Dados não processados: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv
Versões anteriores de dados não processados e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/
Volume de dados
Todos os conjuntos de dados são atualizados diariamente. Em 11 de maio de 2020, eles continham 125.576 linhas (CSV 16.1 MB, JSON 40.0 MB, JSONL 39.6 MB, Parquet 1.1 MB).
Atribuição de licenças e direitos de utilização
Esses dados estão disponíveis estritamente para fins educacionais e acadêmicos, como pesquisa médica, agências governamentais e instituições acadêmicas, sob termos e condições.
Os dados usados ou citados em publicações devem incluir uma atribuição ao 'Bing COVID-19 Tracker' com um link para www.bing.com/covid.
Contacto
Se tiver questões ou comentários sobre este ou outros conjuntos de dados no COVID-19 Data Lake, contacte askcovid19dl@microsoft.com.
Colunas
Name | Tipo de dados | Exclusivo | Values (sample) | Description |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Geórgia | Região em country_region |
admin_region_2 | string | 3143 | Condado de Washington Condado de Jefferson | Região em admin_region_1 |
confirmado | número inteiro | 120,692 | 1 2 | Número de casos confirmados da região |
confirmed_change | número inteiro | 12,120 | 1 2 | Alteração do número de casos confirmados do dia anterior |
country_region | string | 237 | Estados Unidos Índia | País/Região |
Óbitos | número inteiro | 20,616 | 1 2 | Número de casos de morte da região |
deaths_change | smallint | 1,981 | 1 2 | Alteração do número de mortes do dia anterior |
ID | número inteiro | 1,783,534 | 742546 69019298 | Identificador exclusivo |
iso_subdivision | string | 484 | EUA-TX EUA-GA | Código de subdivisão ISO em duas partes |
ISO2 | string | 226 | EUA EM | Identificador do código do país de 2 letras |
ISO3 | string | 226 | EUA IND | Identificador do código do país de 3 letras |
latitude | duplo | 5,675 | 42.28708 19.59852 | Latitude do centroide da região |
load_time | carimbo de data/hora | 1 | 2021-04-26 00:06:34.719000 | A data e a hora de carregamento do ficheiro da origem do Bing no GitHub |
longitude | duplo | 5,693 | -2.5396 -155.5186 | Longitude do centroide da região |
recuperados | número inteiro | 73,287 | 1 2 | Número de casos recuperados da região |
recovered_change | número inteiro | 10,441 | 1 2 | Alteração do número de casos recuperados do dia anterior |
atualizado | data | 457 | 2021-04-23 2021-04-22 | A data do registo |
Pré-visualizar
ID | atualizado | confirmado | Óbitos | ISO2 | ISO3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 1753 | 0 |
Acesso a dados
Azure Notebooks
Este bloco de anotações documenta as URLs e o código de exemplo para acessar o conjunto de dados do Bing COVID-19
Use as seguintes URLs para obter formatos de arquivo específicos hospedados no Armazenamento de Blobs do Azure:
Transfira o ficheiro do conjunto de dados utilizando a capacidade de transferência incorporada a partir de um URL http no Pandas. Pandas tem leitores para vários formatos de arquivo:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Permite verificar os tipos de dados dos vários campos e verificar se a coluna atualizada é o formato datetime
df.dtypes
Vamos agora olhar para os dados mundiais e plotar alguns gráficos simples para visualizar os dados
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Azure Databricks
Amostra não disponível para esta combinação de plataforma/pacote.
Azure Synapse
Amostra não disponível para esta combinação de plataforma/pacote.
Próximos passos
Exiba o restante dos conjuntos de dados no catálogo Open Datasets.