你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Team Data Science Process 生命周期部署阶段
本文概述了与 Team Data Science Process (TDSP) 的部署相关联的目标、任务和可交付结果。 此过程提供团队可用于构建数据科学项目的建议生命周期。 生命周期概述了团队执行的主要阶段(通常以迭代方式进行):
- 了解业务
- 数据采集和理解
- 建模
- 部署
- 客户验收
此处直观地展示了 TDSP 生命周期:
目标
部署阶段的目标是将具有数据管道的模型部署到生产环境或类似生产环境,以供最终客户验收。
如何完成任务
此阶段的主要任务是操作模型。 将模型和管道部署到生产或类似生产的环境中供应用程序操作。
操作模型
如果拥有一组运行良好的模型,你的团队可操作这些模型,以供其他应用程序使用。 根据具体的业务需求,实时作出预测或基于批处理作出预测。 若要部署模型,请使用 API 接口公开模型。 通过接口,用户可在各种应用程序中轻松使用模型,例如:
- 网站
- 电子表格
- 仪表板
- 业务线应用程序
- 后端应用程序
有关 Azure 机器学习的模型操作化的示例,请参阅将机器学习模型部署到 Azure。 将监视功能构建到部署的生产模型和数据管道中是一种最佳做法。 此做法有助于后续进行系统状态报告和故障排除。
与 MLflow 集成
为了协助支持此阶段,可以合并以下 Azure 机器学习功能:
模型管理:若要准备部署,请将模型放入生产环境或操作环境。 MLflow 会管理部署就绪模型并对其进行版本控制,这有助于改进操作化。
模型服务和部署:MLflow 的模型服务功能有助于部署过程,因此你可以轻松地在各种环境中为模型提供服务。
Artifacts
在此阶段,你的团队提供:
显示系统运行状况和关键指标的状态仪表板。 建议使用 Power BI 创建仪表板。
具有部署详细信息的最终建模报表。
最终解决方案体系结构文档。
同行评审的文献
研究人员在经过同行评审的文献中发表了有关 TDSP 的研究。 引文提供了调查 TDSP 的其他应用程序或类似想法的机会,包括部署生命周期阶段。
作者
本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。
首席作者:
- Mark Tabladillo | 高级云解决方案架构师
若要查看非公开的 LinkedIn 个人资料,请登录到 LinkedIn。
相关资源
这些文章介绍了 TDSP 生命周期的其他阶段:
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈