你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

适用于 Python 的 Azure ML 包客户端库 - 版本 1.12.1

我们很高兴推出 Azure 机器学习 Python SDK v2 的正式版。 Python SDK v2 引入了新的 SDK 功能,例如独立的本地作业、管道的可重用组件和托管的联机/批处理推理。 使用 Python SDK v2,可以轻松地以增量方式从简单任务迁移到复杂任务。 这是通过使用通用对象模型实现的,该模型在各种任务之间实现操作的概念重用和一致性。 SDK v2 与 CLI v2 共享其基础,CLI v2 也是正式版。

源代码 | 包 (PyPI) | 包 (Conda) | API 参考文档 | 产品文档 | 样品

此包已使用 Python 3.7、3.8、3.9 和 3.10 进行测试。

有关一组更完整的 Azure 库,请参阅 https://aka.ms/azsdk/python/all

入门

先决条件

安装包

使用 pip 安装适用于 Python 的 Azure ML 客户端库:

pip install azure-ai-ml
pip install azure-identity

验证客户端

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)

关键概念

Azure 机器学习 Python SDK v2 附带了许多新功能,例如独立的本地作业、用于管道的可重用组件和托管联机/批处理推理。 SDK v2 在平台的所有资产之间实现一致性和易用性。 Python SDK v2 提供以下功能:

  • 运行 独立作业 - 以作业身份运行离散 ML 活动。 此作业可以在本地运行,也可以在云上运行。 我们目前支持以下类型的作业:
    • 命令 - (Python、R、Windows 命令、Linux Shell 等 )
    • 扫描 - 对命令运行超参数扫描
  • 使用改进的管道运行多个作业
    • 运行一系列拼结到管道中的命令 (新建)
    • 组件 - 使用可重用组件 () 运行管道
  • 使用模型进行 托管联机推理 ()
  • 使用模型进行托管 批处理推理
  • 管理 AML 资源 - 工作区、计算、数据存储
  • 管理 AML 资产 - 数据集、环境、模型
  • AutoML - 针对各种 ml-tasks 运行独立的 AutoML 训练:
    • 分类 (表格数据)
    • 回归 (表格数据)
    • 时序预测 (表格数据)
    • 图像分类 (多类) (新建)
    • 图像分类 (多标签) (新建)
    • 图像对象检测 ()
    • 映像实例分段 ()
    • NLP 文本分类 (多类) ()
    • NLP 文本分类 (多标签) ()
    • NLP 文本命名实体识别 (NER) ()

示例

疑难解答

常规

Azure ML 客户端会引发 Azure Core 中定义的异常。

from azure.core.exceptions import HttpResponseError

try:
    ml_client.compute.get("cpu-cluster")
except HttpResponseError as error:
    print("Request failed: {}".format(error.message))

日志记录

此库使用标准 日志记录 库进行日志记录。 有关 HTTP 会话 (URL、标头等的基本信息,) 在 INFO 级别记录。

可以使用 参数在客户端 logging_enable 上启用详细的调试级别日志记录,包括请求/响应正文和未处理标头。

请参阅此处提供示例的完整 SDK 日志记录文档。

遥测

Azure ML Python SDK 包含一项遥测功能,该功能收集有关 SDK 的使用情况和故障数据,并在仅在Jupyter Notebook中使用该 SDK 时将其发送给 Microsoft。 不会收集遥测数据,以便在 Jupyter Notebook之外使用 Python SDK。

遥测数据可帮助 SDK 团队了解 SDK 的使用方式,以便对其进行改进,有关故障的信息可帮助团队解决问题和修复 bug。 SDK 遥测功能默认为Jupyter Notebook使用启用,不能为非 Jupyter 方案启用。 若要选择退出 Jupyter 方案中的遥测功能,请在 enable_telemetry=False 构造 MLClient 对象时传入 。

后续步骤

贡献

本项目欢迎贡献和建议。 大多数贡献要求你同意贡献者许可协议 (CLA),并声明你有权(并且确实有权)授予我们使用你的贡献的权利。 有关详细信息,请访问 cla.microsoft.com

提交拉取请求时,CLA 机器人将自动确定你是否需要提供 CLA,并相应地修饰 PR(例如标签、注释)。 直接按机器人提供的说明操作。 只需使用 CLA 对所有存储库执行一次这样的操作。

此项目采用了 Microsoft 开放源代码行为准则。 有关详细信息,请参阅行为准则常见问题解答,或如果有任何其他问题或意见,请与 联系。