在 Azure Databricks 中开始使用 scikit-learn

此10分钟教程介绍了如何在 Databricks 中进行机器学习。 它使用热门机器学习包 scikit-learn 中的算法以及 MLflow 来跟踪模型开发过程,并使用 Hyperopt 来自动执行超参数优化。

要求

Databricks Runtime 7.0 ML 或更高版本。

示例笔记本

如果使用的是 Databricks Runtime 7.3 LTS ML 或更高版本,Databricks 建议使用 MLflow autologging,如此笔记本中所示。

scikit-learn 和 MLflow autologging 笔记本入门

获取笔记本

可以在 Databricks Runtime 7.0 ML 或更高版本中使用以下笔记本。 此笔记本使用手动 MLflow logging 来跟踪模型开发。

scikit-learn 笔记本入门

获取笔记本