Conjuntos de dados de diabetes

O conjunto de dados Diabetes tem 442 amostras com dez recursos, tornando-o ideal para começar a usar algoritmos de aprendizado de máquina. É um dos conjuntos de dados mais populares do Scikit Learn Toy.

Descrição do conjunto de dados original | Arquivo de dados original

Observação

A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.

Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.

Colunas

Nome Tipo de dados Exclusivo Valores (exemplo)
IDADE BIGINT 58 53 60
BMI double 163 24,1 23,5
BP double 100 93,0 83,0
S1 BIGINT 141 162 184
S2 double 302 125,8 114,8
S3 double 63 46,0 38,0
S4 double 66 3.0 4.0
S5 double 184 4,4427 4,3041
S6 BIGINT 56 92 96
SEXO BIGINT 2 1 2
Y BIGINT 214 72 200

Visualização

IDADE SEXO BMI BP S1 S2 S3 S4 S5 S6 Y
59 2 32,1 101 157 93,2 38 4 4,8598 87 151
48 1 21,6 87 183 103,2 70 3 3,8918 69 75
72 2 30,5 93 156 93,6 41 4 4,6728 85 141
24 1 25,3 84 198 131,4 40 5 4,8903 89 206
50 1 23 101 192 125,4 52 4 4,2905 80 135
23 1 22,6 89 139 64,8 61 2 4,1897 68 97
36 2 22 90 160 99,6 50 3 3,9512 82 138
66 2 26,2 114 255 185 56 4.55 4,2485 92 63
60 2 32,1 83 179 119,4 42 4 4,4773 94 110
29 1 30 85 180 93,4 43 4 5,3845 88 310

Acesso a dados

Use os códigos de exemplo a seguir para acessar esse conjunto de dados no Azure Notebooks, no Azure Databricks ou no Azure Synapse.

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_pandas_dataframe()

diabetes_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_spark_dataframe()

display(diabetes_df.limit(5))

Azure Synapse

Exemplo não disponível para essa combinação de plataforma/pacote.

Próximas etapas

Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.