你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是机器学习?

机器学习是一项数据科学技术,使计算机可以根据现有的数据预测将来的行为、结果和趋势。 使用机器学习时,计算机可以在无需显式编程的情况下进行学习。 机器学习工具使用 AI 系统,这些系统可以识别模式,并从与数据的体验中创建关联。

自动化机器学习预测可以使应用程序和设备更加智能。 例如,在网上购物时,机器学习可根据购买的产品帮助推荐其他产品。 或者,在轻扫信用卡时,机器学习会将事务与事务数据库进行比较,并帮助检测欺诈行为。 当吸尘器机器人打扫房间时,机器学习可帮助它确定作业是否已完成。

适用于每个任务的机器学习工具

Azure 机器学习为其机器学习工作流提供了开发人员和数据科学家所需的所有工具,包括:

若要生成端到端工作流管道,甚至可以使用 Kubeflow

使用 Python 或 R 生成机器学习模型

使用 Azure 机器学习 Python SDKR 在本地计算机上开始训练。然后,可以横向扩展到云。 借助许多可用的计算目标(例如 Azure 机器学习计算和 Azure Databricks)以及高级超参数优化服务,可以利用云的强大功能更快地生成更好的模型。 使用 SDK,还可以 自动执行模型训练和优化

使用无代码工具生成机器学习模型

对于无代码或低代码训练和部署,请尝试:

  • Azure 机器学习设计器

    使用设计器在不编写代码的情况下准备数据、训练、测试、部署、管理和跟踪机器学习模型。 无需编程;可以直观地连接数据集和模块来构造模型。 尝试在工作室中创建管道。

    有关详细信息,请参阅 Azure 机器学习设计器概述文章

  • 自动化机器学习 (AutoML) SDK

    在易于使用的界面中,了解如何创建 AutoML 试验

MLOps:部署和生命周期管理

机器学习操作 (MLOps) 基于可提高工作流效率的 DevOps 原理和做法。 例如持续集成、持续交付和持续部署。 MLOps 将这些原则应用于机器学习过程,目标是:

  • 更快地试验和开发模型
  • 更快地将模型部署到生产环境
  • 质量保证

如果模型正确,可以在联机终结点中轻松使用它。 有关详细信息,请参阅使用 Azure 机器学习部署模型

然后,可以使用适用于 Python 的 Azure 机器学习 SDKAzure 机器学习工作室Azure 机器学习 CLI 来管理已部署的模型。

可以使用这些模型实时返回预测,或者在有大量数据的情况下异步返回预测。

使用高级机器学习管道,可以在每一步(从数据准备、模型训练和评估一直到部署)进行协作。 使用 Pipelines 可以:

  • 自动完成云中的端到端机器学习过程
  • 重用组件并仅在需要时重新运行步骤
  • 在每个步骤中使用不同的计算资源
  • 运行批量评分任务

如果要使用脚本自动执行机器学习工作流,Azure 机器学习 CLI 提供了执行常见任务(如提交训练运行或部署模型)的命令行工具。

若要开始使用Azure 机器学习,请参阅后续步骤

自动化机器学习

数据科学家在试验期间花费大量时间循环访问模型。 尝试不同的算法和超参数组合,直到生成可接受的模型,对于数据科学家来说,由于工作的单调性和非具有挑战性的性质,因此对数据科学家非常征税。 虽然本练习在模型有效性方面取得了巨大的收益,但有时在时间和资源方面成本过高,因此可能会产生负面的投资回报(ROI)。

因此可以使用自动化机器学习 (AutoML)。 它使用研究论文中关于概率矩阵分解的概念。 它实现一个自动化管道,该管道基于所呈现数据的启发法(考虑到给定的问题或方案)尝试智能选择的算法和超值设置。 此管道的结果是一组最适合给定问题和数据集的模型。

有关 AutoML 的详细信息,请参阅 AutoML 和 MLOps 与 Azure 机器学习

托管解决方案

Azure 机器学习提供完全托管的资源,例如:

  • 计算实例: 使用 SDK 和常用数据科学工具(如 Jupyter Notebook 和 JupyterLab)预配置基于云的 VM。 有关详细信息,请参阅 创建和管理计算实例
  • 计算群集: 使用动态缩放 Azure 虚拟机的群集来大规模训练模型。 有关详细信息,请参阅 创建和管理计算群集
  • 无服务器计算群集: 在动态创建的、动态缩放 Azure 虚拟机的群集上训练模型。 有关详细信息,请参阅无服务器计算的模型训练(预览版)。
  • 无服务器 Apache Spark: 使用动态创建的 Apache Spark 群集进行交互式数据整理或训练机器学习模型。 有关详细信息,请参阅 无服务器 Spark 计算
  • 托管联机终结点: 将模型部署为客户端应用程序可以使用的 Web 服务。 有关详细信息,请参阅 联机终结点
  • 托管虚拟网络:为Azure 机器学习托管资源和其他Azure 机器学习依赖的 Azure 服务提供网络隔离。 有关详细信息,请参阅工作区托管网络隔离

负责的 ML

信任必须在整个 AI 系统的开发和使用过程中处于核心。 具体包括信任平台、过程和模型。 随着 AI 和自治系统越来越多地融入社会结构,积极主动地努力预测和缓解这些技术带来的意外后果是很重要的。

  • 了解模型并构建公平性: 解释模型行为并发现影响大多数预测的功能。 在模型训练和推理期间,对玻璃和黑盒模型使用内置解释器。 使用交互式可视化效果来比较模型并执行 What-if 分析以提高模型准确性。 使用最高水平的算法测试模型的公平性。 缓解整个机器学习生命周期中的不公平性,比较缓解的模型,并根据需要有意识地权衡公平性与准确性。
  • 保护数据隐私和机密性:利用最新的差分隐私技术生成保护隐私的模型,该技术在数据中注入精确水平的统计噪声,以限制敏感信息的泄露。 识别数据泄漏并智能地限制重复查询以管理泄露风险。 使用专为机器学习设计的加密和机密机器学习技术安全地使用机密数据生成模型。
  • 控制并控制机器学习过程的每一步: 访问内置功能,以自动跟踪世系并在机器学习生命周期中创建审核线索。 通过跟踪数据集、模型、试验、代码等来全面了解机器学习过程。 使用自定义标记来实现模型数据表、记录关键模型元数据、增加问责制并确保流程可靠。

详细了解如何实现 负责任的 ML

与其他服务集成

Azure 机器学习与其他 Azure 平台服务配合使用,并与 Git 和 MLflow 等开源工具集成。

后续步骤