您现在访问的是微软AZURE全球版技术文档网站,若需要访问由世纪互联运营的MICROSOFT AZURE中国区技术文档网站,请访问 https://docs.azure.cn.

什么是 Azure 机器学习设计器?

Azure 机器学习设计器是一个拖放界面,用于在 Azure 机器学习中训练和部署模型。 本文介绍可在设计器中执行的任务。

Azure 机器学习设计器示例

设计器使用 Azure 机器学习工作区来整理共享资源,例如:

模型训练和部署

使用可视化画布生成端到端机器学习工作流。 在设计器中训练、测试和部署模型:

  • 数据集组件拖放到画布上。
  • 连接组件以创建管道草稿
  • 使用 Azure 机器学习工作区中的计算资源提交管道运行
  • 将训练管道转换为推理管道 。
  • 将管道发布到 REST 管道终结点,以提交具有不同参数和数据集的新管道运行。
    • 发布训练管道,在更改参数和数据集时重用单个管道训练多个模型。
    • 发布批量推理管道,通过使用以前训练的模型针对新数据进行预测。
  1. 将实时推理管道部署到实时终结点,以便针对新数据进行实时预测。

设计器中的训练、批量推理和实时推理的工作流示意图

管道

管道包含连接的数据集和分析组件。 管道有许多用途:可以创建训练单个模型的管道,或训练多个模型的管道。 可以创建实时或批量进行预测的管道,或者创建仅清理数据的管道。 借助管道,可以重复使用你的工作并组织你的项目。

管道草稿

在设计器中编辑管道时,你的进度会保存为管道草稿。 可以通过添加或删除组件、配置计算目标、创建参数等,随时编辑管道草稿。

有效管道具有以下特征:

  • 数据集只能连接到组件。
  • 组件只能连接到数据集或其他组件。
  • 组件的所有输入端口必须与数据流建立某种连接。
  • 必须设置每个组件的所有必需参数。

若准备好运行管道草稿,请提交管道运行。

管道运行

每次运行管道时,管道及其结果的配置都作为管道运行存储在工作区中。 出于故障排除或审核目的,可以返回任何管道运行以对其进行检查。 克隆管道运行,可创建新的管道草稿以供编辑。

管道运行被分入试验以整理运行历史记录。 可以为每个管道运行设置试验。

数据集

使用机器学习数据集可以轻松地访问和处理数据。 此设计器中包含多个示例数据集供你进行试验。 你可以根据需要注册更多数据集。

组件

组件是可对数据执行的算法。 设计器有多个组件,涵盖数据引入函数、训练、评分和验证过程。

组件可能提供一组可用于配置组件的内部算法的参数。 在画布上选择组件时,组件的参数会显示在画布右侧的“属性”窗格中。 可以在该窗格中修改参数来调整模型。 可以在设计器中设置各个组件的计算资源。

组件属性

有关在可用的机器学习算法库中导航的某些帮助,请参阅算法和组件参考概述。 有关选择算法的帮助,请参阅 Azure 机器学习算法速查表

计算资源

使用工作区中的计算资源来运行管道,并将已部署的模型作为实时终结点或管道终结点托管(用于批量推理)。 支持的计算目标为:

计算目标 培训 部署
Azure 机器学习计算
Azure Kubernetes 服务

计算目标会附加到 Azure 机器学习工作区。 可在 Azure 机器学习工作室的工作区中管理计算目标。

部署

若要执行实时推理,必须将管道部署为 实时终结点。 实时终结点在外部应用程序和评分模型之间创建接口。 对实时端点的调用会将预测结果实时返回至应用程序。 若要调用实时终结点,请传递部署终结点时创建的 API 密钥。 该终结点基于 REST,这是一种流行的 Web 编程项目的体系结构。

必须将实时终结点部署到 Azure Kubernetes 服务群集。

若要了解如何部署模型,请参阅教程:使用设计器部署机器学习模型

备注

Azure 机器学习终结点(预览版)提供更简单的已改进部署体验。 终结点同时支持实时和批量推理场景。 终结点提供了一个统一的接口,以用于跨计算类型调用和管理模型部署。 请参阅什么是 Azure 机器学习终结点(预览版)?

发布

还可以将管道发布到管道终结点。 与实时终结点类似,借助管道终结点,可以使用 REST 调用从外部应用程序提交新的管道运行。 但是,无法使用管道终结点实时发送或接收数据。

已发布的管道是灵活的,它们可用于训练或重新训练模型、执行批量推断、处理新数据等。 可以将多个管道发布到单个管道终结点,并指定要运行的管道版本。

已发布的管道在每个组件的管道草稿中定义的计算资源上运行。

设计器创建与 SDK 相同的 PublishedPipeline 对象。

后续步骤