„Diabetes“-Dataset

Das „Diabetes“-Dataset besitzt 442 Beispiele mit 10 Features, wodurch es einfach ist, mit Algorithmen für maschinelles Lernen zu beginnen. Es ist eines der beliebtesten Scikit Learn Toy Datasets.

Beschreibung des ursprünglichen Datasets | Ursprüngliche Datendatei

Hinweis

Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.

Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.

Spalten

Name Datentyp Eindeutig Beispielwerte
AGE BIGINT 58 53 60
BMI double 163 24.1 23.5
BP double 100 93.0 83.0
S1 BIGINT 141 162 184
S2 double 302 125.8 114.8
S3 double 63 46.0 38.0
S4 double 66 3.0 4.0
S5 double 184 4.4427 4.3041
S6 BIGINT 56 92 96
SEX BIGINT 2 1 2
J BIGINT 214 72 200

Vorschau

AGE SEX BMI BP S1 S2 S3 S4 S5 S6 J
59 2 32,1 101 157 93.2 38 4 4.8598 87 151
48 1 21.6 87 183 103.2 70 3 3.8918 69 75
72 2 30.5 93 156 93.6 41 4 4.6728 85 141
24 1 25.3 84 198 131.4 40 5 4.8903 89 206
50 1 23 101 192 125,4 52 4 4.2905 80 135
23 1 22.6 89 139 64,8 61 2 4.1897 68 97
36 2 22 90 160 99.6 50 3 3.9512 82 138
66 2 26.2 114 255 185 56 4.55 4.2485 92 63
60 2 32,1 83 179 119.4 42 4 4.4773 94 110
29 1 30 85 180 93,4 43 4 5.3845 88 310

Datenzugriff

Verwenden Sie die folgenden Codebeispiele, um in Azure Notebooks, Azure Databricks oder Azure Synapse auf dieses Dataset zuzugreifen.

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_pandas_dataframe()

diabetes_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_spark_dataframe()

display(diabetes_df.limit(5))

Azure Synapse

Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.

Nächste Schritte

Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.