10 分钟教程:Azure Databricks 上的机器学习入门
本部分中的笔记本旨在帮助你快速开始使用 Azure Databricks 上的机器学习。 这些笔记本演示了如何在整个机器学习生命周期中使用 Azure Databricks - 生命周期涵盖数据加载和准备,模型训练、优化和推理,以及模型部署和管理。 它们演示了一些有用的工具,例如用于自动超参数优化的 Hyperopt、用于模型开发的 MLflow 跟踪和自动日志记录,以及用于模型管理的模型注册表。
scikit-learn 笔记本
| 笔记本 |
要求 |
功能 |
| 机器学习快速入门 |
Databricks Runtime 7.5 ML 或更高版本 |
分类模型、MLflow、通过 Hyperopt 和 MLflow 实现的自动超参数优化 |
| 使用模型注册表的机器学习 |
Databricks Runtime ML |
分类模型、MLflow、通过 Hyperopt 和 MLflow 实现的自动超参数优化、模型注册表 |
| 端到端示例 |
Databricks Runtime ML |
分类模型、MLflow、通过 Hyperopt 和 MLflow 实现的自动超参数优化、XGBoost、模型注册表、模型处理 |
Apache Spark MLlib 笔记本
| 笔记本 |
要求 |
功能 |
| 使用 MLlib 的机器学习 |
Databricks Runtime 7.3 LTS ML 或更高版本 |
逻辑回归模型、Spark 管道,使用 MLlib API 的自动超参数优化 |
深度学习笔记本
| 笔记本 |
要求 |
功能 |
| 使用 TensorFlow Keras 的深度学习 |
Databricks Runtime 7.0 ML 或更高版本 |
神经网络模型、内联 TensorBoard、通过 Hyperopt 和 MLflow 实现的自动超参数优化、自动日志记录、模型注册表 |