Conjunto de datos sobre diabetes

El conjunto de datos de Diabetes tiene 442 muestras con 10 características, por lo que es ideal para comenzar con algoritmos de aprendizaje automático. Es uno de los conjuntos de datos de Scikit Learn Toy más conocidos.

Descripción del conjunto de datos original | Archivo de datos original

Nota

Microsoft proporciona Azure Open Datasets "tal cual". Microsoft no ofrece ninguna garantía, expresa o implícita, ni condición con respecto al uso que usted haga de los conjuntos de datos. En la medida en la que lo permita su legislación local, Microsoft declina toda responsabilidad por posibles daños o pérdidas, incluidos los daños directos, consecuenciales, especiales, indirectos, incidentales o punitivos, que resulten de su uso de los conjuntos de datos.

Este conjunto de datos se proporciona bajo los términos originales con los que Microsoft recibió los datos de origen. El conjunto de datos puede incluir datos procedentes de Microsoft.

Columnas

Nombre Tipo de datos Único Valores (ejemplo)
AGE bigint 58 53 60
BMI double 163 24.1 23.5
BP double 100 93.0 83.0
S1 bigint 141 162 184
S2 double 302 125.8 114.8
S3 double 63 46.0 38.0
S4 double 66 3.0 4.0
S5 double 184 4.4427 4.3041
S6 bigint 56 92 96
SEX bigint 2 1 2
Y bigint 214 72 200

Vista previa

AGE SEX BMI BP S1 S2 S3 S4 S5 S6 Y
59 2 32,1 101 157 93.2 38 4 4.8598 87 151
48 1 21.6 87 183 103.2 70 3 3.8918 69 75
72 2 30,5 93 156 93.6 41 4 4.6728 85 141
24 1 25,3 84 198 131.4 40 5 4.8903 89 206
50 1 23 101 192 125,4 52 4 4.2905 80 135
23 1 22.6 89 139 64,8 61 2 4.1897 68 97
36 2 22 90 160 99.6 50 3 3.9512 82 138
66 2 26,2 114 255 185 56 4.55 4.2485 92 63
60 2 32,1 83 179 119.4 42 4 4.4773 94 110
29 1 30 85 180 93,4 43 4 5.3845 88 310

Acceso a datos

Use los siguientes ejemplos de código para acceder a este conjunto de datos en Azure Notebooks, Azure Databricks o Azure Synapse.

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_pandas_dataframe()

diabetes_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_spark_dataframe()

display(diabetes_df.limit(5))

Azure Synapse

Ejemplo no disponible para esta combinación de plataforma y paquete.

Pasos siguientes

Consulte el resto de los conjuntos de datos en el catálogo de Open Datasets.