azureml-core 包

core

包含 Azure 机器学习的核心包、模块和类。

主要方面包括管理计算目标、创建/管理工作区和试验,以及提交/访问模型运行和运行输出/日志记录。

data

包含支持 Azure 机器学习中数据存储和数据集的数据表示形式的模块。

此包包含支持 core 包中的 DatastoreDataset 类的核心功能。 数据存储对象包含与 Azure 存储服务的连接信息,这些信息可以通过名称轻松引用,而无需直接使用或在脚本中硬编码连接信息。 数据存储支持此包中的类表示的多种不同服务,包括 AzureBlobDatastoreAzureFileDatastoreAzureDataLakeDatastore。 有关支持的存储服务的完整列表,请参阅 Datastore 类。

虽然数据存储充当数据文件的容器,但可以将数据集视为数据存储中特定数据的引用或指针。 支持以下数据集类型:

  • TabularDataset 表示表格格式的、通过分析提供的文件或文件列表所创建的数据。

  • FileDataset 引用数据存储或公共 URL 中的单个或多个文件。

有关详细信息,请参阅 添加 & 注册数据集一文。 要开始使用数据集,请参阅 https://aka.ms/tabulardataset-samplenotebookhttps://aka.ms/filedataset-samplenotebook

exceptions

包含 Azure 机器学习异常类。

history

此模块在内部使用,用于为远程环境准备 Azure ML SDK。

模块

authentication

包含用于在 Azure 机器学习中管理不同类型的身份验证的功能。

支持的身份验证类型:

  • 交互式登录 - 使用 Azure 机器学习 SDK 时的默认模式。 使用交互式对话。
  • Azure CLI - 与 azure-cli 包配合使用。
  • 服务主体 - 与自动化机器学习工作流配合使用。
  • MSI - 与启用了托管服务标识的资产(例如 Azure 虚拟机)配合使用。
  • Azure 机器学习令牌 - 用于获取 Azure 令牌(仅适用于已提交的运行)。

若要详细了解这些身份验证机制,请参阅 https://aka.ms/aml-notebook-auth

adla

包含用于在 Azure 机器学习中管理 Azure Data Lake Analytics 计算目标的功能。

aks

包含用于在 Azure 机器学习中管理 Azure Kubernetes 服务计算目标的功能。

amlcompute

包含用于在 Azure 机器学习中管理 Azure 机器学习计算目标的功能。

batch

包含用于在 Azure 机器学习中管理 Batch 计算目标的功能。

compute

包含 Azure 机器学习中计算目标的抽象父类和配置类。

computeinstance

包含用于在 Azure 机器学习中创建完全托管的基于云的工作站的功能。

databricks

包含用于在 Azure 机器学习中管理 Databricks 计算目标的功能。

datafactory

包含用于在 Azure 机器学习中管理 Datafactory 计算目标的功能。

dsvm

包含用于在 Azure 机器学习中管理 Data Science Virtual Machine 计算目标的功能。

hdinsight

包含用于在 Azure 机器学习中管理 HDInsight 群集计算目标的功能。

kubernetescompute

包含用于在 Azure 机器学习中管理 Azure 机器学习计算目标的功能。

kusto

包含用于在 Azure 机器学习中管理 Kusto 计算目标的功能。

remote

包含用于在 Azure 机器学习中管理远程计算目标的功能。

synapse

管理 Azure 机器学习服务中的 Synapse 计算目标。

compute_target

包含非 Azure 机器学习管理的计算目标的功能。

计算目标定义了训练计算环境,可以是本地资源,也可以是云中的远程资源。 远程资源允许利用加速的 CPU 和 GPU 处理功能轻松纵向或横向扩展机器学习试验。

有关由 Azure 机器学习管理的计算目标的信息,请参阅 ComputeTarget 类。 有关详细信息,请参阅什么是 Azure 机器学习中的计算目标?

conda_dependencies

包含用于管理 conda 环境依赖项的功能。

使用 CondaDependencies 类加载现有的 conda 环境文件,并配置和管理执行试验的新环境。

container_registry

包含用于管理 Azure 容器注册表的功能。

databricks

包含用于在 Azure 机器学习中管理 Databricks 环境的功能。

有关在 Azure 机器学习中使用 Databricks 的详细信息,请参阅为 Azure 机器学习配置开发环境

dataset

管理与 Azure 机器学习数据集的交互。

本模块提供了在 Azure 机器学习中使用原始数据、管理数据,以及对数据执行操作的功能。 使用此模块中的 Dataset 类创建数据集和 data 包中的功能,其中包含支持类 FileDatasetTabularDataset

若要开始使用数据集,请参阅 添加 & 注册数据集一文。

datastore

包含用于管理 Azure 机器学习中数据存储的功能。

environment

包含用于在 Azure 机器学习中创建和管理可重现环境的功能。

环境提供了一种用于管理软件依赖项的方法,以便在本地云和分布式云开发环境之间移动时,只需最少的手动配置即可重现受控环境。 环境可封装 Python 包、环境变量、用于训练和评分脚本的软件设置,以及 Python、Spark 或 Docker 上的运行时间。 有关使用 Azure 机器学习将环境用于训练和部署的详细信息,请参阅创建和管理可重用环境

experiment

包含用于在 Azure 机器学习中提交试验和管理试验历史记录的功能。

container

包含用于管理 Azure 机器学习中容器映像的功能。

image

包含用于管理 Azure 机器学习中映像的基本功能。

Image 封装模型、脚本和关联的文件,以提供已部署的 Web 服务的运行时环境。 图像具有负载均衡的 HTTP 终结点,它可以接收评分请求并返回预测。

unknown_image

包含用于管理未导入 Azure 机器学习的映像的功能。

keyvault

包含用于管理与 Azure 机器学习工作区关联的 Key Vault 机密的功能。

此模块包含一些便捷方法,用于从与工作区关联的 Azure Key Vault 添加、检索、删除和列出机密。

linked_service

包含用于在 AML 工作区中创建和管理链接服务的功能。

model

包含用于管理 Azure 机器学习中的机器学习模型的功能。

你可以使用 Model 类完成以下主要任务:

  • 使用工作区注册模型
  • 分析模型以了解部署要求
  • 将模型打包以与 Docker 一起使用
  • 将模型作为 Web 服务部署到推理终结点

有关如何使用模型的详细信息,请参阅 Azure 机器学习的工作原理:体系结构和概念

private_endpoint

包含用于定义和配置 Azure 专用终结点的功能。

profile

包含 Azure 机器学习中的分析模型的功能。

resource_configuration

包含用于管理 Azure 机器学习实体的资源配置的功能。

run

包含用于管理 Azure 机器学习中的试验指标和项目的功能。

runconfig

包含用于管理 Azure 机器学习中试验运行的配置的功能。

此模块中的键类是 RunConfiguration,它封装了在指定的计算目标上提交训练运行所需的信息。 该配置包括一组广泛的行为定义,例如,是使用现有 Python 环境还是使用根据规范构建的 Conda 环境。

该模块中的其他配置类可通过 RunConfiguration 来访问。

script_run

包含用于管理 Azure 机器学习中提交的训练运行的功能。

script_run_config

包含用于管理在 Azure 机器学习中提交训练运行的配置的功能。

util

包含用于指定日志记录详细信息级别的类。

aci

包含用于在 Azure 容器实例上将机器学习模型部署为 Web 服务终结点的功能。

对于能够在隔离容器中进行操作(包括简单应用程序、任务自动化和生成作业)的情况,建议使用 Azure 容器实例 (ACI)。 有关何时使用 ACI 的详细信息,请参阅将模型部署到 Azure 容器实例

aks

包含用于在 Azure Kubernetes 服务上将机器学习模型部署为 Web 服务终结点的功能。

对于需要完整容器业务流程(包括跨多个容器的服务发现、自动缩放、协调式应用程序升级)的情况,建议使用 Azure Kubernetes 服务 (AKS)。

有关详细信息,请参阅将模型部署到 Azure Kubernetes 服务

container_resource_requirements

用于描述 Azure 机器学习中容器资源要求的模型。

local

包含将机器学习模型部署为本地 Web 服务终结点的功能。

对于需要快速部署和验证模型或要测试开发中模型的情况,建议部署到本地 Web 服务。 有关详细信息,请参阅将模型部署到笔记本 VM

unknown_webservice

包含用于管理 Azure 机器学习中未知 Web 服务的功能。

webservice

包含用于在 Azure 机器学习中管理部署为 Web 服务终结点的模型的功能。

此模块包含抽象父类 Webservice,该类定义用于部署模型的方法。 常见模式是为特定计算目标创建配置对象,然后将 Webservice 类的方法与该配置对象结合使用。 例如,若要部署到 Azure 容器实例,请从 AciWebservice 类的 deploy_configuration 方法创建 AciServiceDeploymentConfiguration 对象,然后使用 Webservice 类的其中一个部署方法。 类似的模式适用于 AksWebserviceAksEndpointLocalWebservice 类。

有关部署的概述,请参阅使用 Azure 机器学习部署模型

workspace

包含用于管理工作区(Azure 机器学习中的顶级资源)的功能。

此模块包含 Workspace 类及其方法和属性,从而允许管理机器学习项目(如计算目标、环境、数据存储、试验和模型)。 工作区与 Azure 订阅和资源组绑定,是计费的主要方式。 工作区支持 Azure 资源管理器基于角色的访问控制 (RBAC) 和工作区内保存的所有机器学习数据的区域相关性。

abstract_dataset

包含 Azure 机器学习中的数据集的抽象基类。

abstract_datastore

包含将连接信息保存到 Azure 存储服务的数据存储的基本功能。

azure_data_lake_datastore

包含将连接信息保存到 Azure Data Lake Storage 的数据存储的基本功能。

azure_my_sql_datastore

包含将连接信息保存到 Azure Database for MySQL 的数据存储的基本功能。

azure_postgre_sql_datastore

包含将连接信息保存到 Azure Database for PostgreSQL 的数据存储的基本功能。

azure_sql_database_datastore

包含将连接信息保存到 Azure SQL 数据库的数据存储的基本功能。

azure_storage_datastore

包含将连接信息保存到 Azure Blob 和 Azure 文件存储的数据存储功能。

constants

azureml.data 包中使用的常数。 仅限内部使用。

context_managers

包含用于管理数据存储和数据集的数据上下文的功能。 仅限内部使用。

data_reference

包含定义如何创建对数据存储中数据的引用的功能。

datacache

包含用于管理 Azure 机器学习中的 DatacacheStore 和 Datacache 的功能。

datacache_client

仅限内部使用。

datacache_consumption_config

包含 DataCache 使用配置的功能。

datacache_singularity_settings

包含 Datacache 奇点设置表示形式所需的对象。

datapath

包含创建对数据存储中的数据的引用的功能。

此模块包含 DataPath 类,该类表示数据的位置;它还包含 DataPathComputeBinding 类,该类表示数据如何在计算目标上可用。

dataset_action_run

包含管理数据集操作执行的功能。

该模块提供了用于创建数据集操作并在完成后获取其结果的便捷方法。

dataset_consumption_config

包含数据集使用配置的功能。

dataset_definition

包含管理数据集定义及其操作的功能。

注意

此模块已弃用。 有关详细信息,请参阅 https://aka.ms/dataset-deprecation

dataset_error_handling

包含 Azure 机器学习中数据集错误处理的异常。

dataset_factory

包含用于为 Azure 机器学习创建数据集的功能。

dataset_profile

用于收集数据流生成的数据的汇总统计信息的类。

此模块中的功能包括收集有关哪个运行生成配置文件、配置文件是否过时的信息。

dataset_profile_run

包含用于监视 Azure 机器学习中运行的数据集配置文件的配置。

此模块中的功能包括处理和监视与实验对象以及单个运行 ID 关联的数据集配置文件的运行。

dataset_profile_run_config

包含用于在 Azure 机器学习中生成数据集统计摘要的配置。

此模块中的功能包括提交本地或远程配置文件运行和可视化提交的配置文件运行结果的方法。

dataset_snapshot

包含管理数据集快照操作的功能。

注意

此模块已弃用。 有关详细信息,请参阅 https://aka.ms/dataset-deprecation

dataset_type_definitions

包含与 Dataset 一起使用的枚举值。

datastore_client

仅限内部使用。

dbfs_datastore

包含用于将连接信息保存到 Databricks 文件系统 (DBFS) 的数据存储的功能。

file_dataset

包含引用数据存储或公共 URL 中的单个或多个文件的功能。

有关详细信息,请参阅 添加 & 注册数据集一文。 若要开始使用文件数据集,请参阅 https://aka.ms/filedataset-samplenotebook

hdfs_datastore

包含将连接信息保存到 HDFS 群集的数据存储的基本功能。

output_dataset_config

包含指定应如何将作业的输出上传和提升到数据集的配置。

有关详细信息,请参阅如何指定输出一文。

sql_data_reference

包含用于创建对数据存储中数据的引用的功能,这些数据将连接信息保存到 SQL 数据库。

stored_procedure_parameter

包含用于创建参数以传递给 SQL 存储过程的功能。

tabular_dataset

包含通过分析提供的文件或文件列表来以表格格式表示数据的功能。

有关详细信息,请参阅 添加 & 注册数据集一文。 若要开始使用表格数据集,请参阅 https://aka.ms/tabulardataset-samplenotebook