Verwenden von Scikit-learn in Azure Databricks
Diese Seite enthält Beispiele für die Verwendung des scikit-learn
-Pakets zum Trainieren von Machine Learning-Modellen in Azure Databricks. Scikit-learn ist eine der beliebtesten Python-Bibliotheken für das maschinelle Lernen mit einem einzelnen Knoten und ist in Databricks Runtime sowie Databricks Runtime for Machine Learning enthalten. Weitere Informationen zur Version der scikit-learn-Bibliothek, die in Ihrer Clusterruntime enthalten ist, finden Sie in den Versionshinweisen zu Databricks Runtime.
Sie können diese Notebooks importieren und in Ihrem Azure Databricks-Arbeitsbereich ausführen.
Weitere Beispielnotebooks für den schnellen Einstieg in Azure Databricks finden Sie unter Tutorials: Erste Schritte mit ML.
Grundlegendes Beispiel mit Scikit-learn
Dieses Notebook bietet eine kurze Übersicht über das Machine Learning-Modell-Training auf Azure Databricks. Es verwendet das scikit-learn
-Paket, um ein einfaches Klassifizierungsmodell zu trainieren. Zudem veranschaulicht es die Verwendung von MLflow zum Nachverfolgen des Modellentwicklungsprozesses und Hyperopt zum Automatisieren der Hyperparameteroptimierung.
Scikit-learn-Klassifizierungsnotebook
End-to-End-Beispiel mit scikit-learn in Azure Databricks
Dieses Notebook veranschaulicht anhand von scikit-learn ein vollständiges End-to-End-Beispiel für das Laden von Daten, das Modelltraining, die verteilte Hyperparameteroptimierung und den Modellrückschluss. Außerdem veranschaulicht es die Modelllebenszyklusverwaltung mithilfe der MLflow-Modellregistrierung, um Ihre Modelle zu protokollieren und zu registrieren.