azureml-core 包
包
core |
包含 Azure 机器学习的核心包、模块和类。 主要方面包括管理计算目标、创建/管理工作区和试验,以及提交/访问模型运行和运行输出/日志记录。 |
data |
包含支持 Azure 机器学习中数据存储和数据集的数据表示形式的模块。 此包包含支持 core 包中的 Datastore 和 Dataset 类的核心功能。 数据存储对象包含与 Azure 存储服务的连接信息,这些信息可以通过名称轻松引用,而无需直接使用或在脚本中硬编码连接信息。 数据存储支持此包中的类表示的多种不同服务,包括 AzureBlobDatastore、AzureFileDatastore 和 AzureDataLakeDatastore。 有关支持的存储服务的完整列表,请参阅 Datastore 类。 虽然数据存储充当数据文件的容器,但可以将数据集视为数据存储中特定数据的引用或指针。 支持以下数据集类型:
有关详细信息,请参阅 添加 & 注册数据集一文。 要开始使用数据集,请参阅 https://aka.ms/tabulardataset-samplenotebook 和 https://aka.ms/filedataset-samplenotebook。 |
exceptions |
包含 Azure 机器学习异常类。 |
history |
此模块在内部使用,用于为远程环境准备 Azure ML SDK。 |
模块
authentication |
包含用于在 Azure 机器学习中管理不同类型的身份验证的功能。 支持的身份验证类型:
若要详细了解这些身份验证机制,请参阅 https://aka.ms/aml-notebook-auth。 |
adla |
包含用于在 Azure 机器学习中管理 Azure Data Lake Analytics 计算目标的功能。 |
aks |
包含用于在 Azure 机器学习中管理 Azure Kubernetes 服务计算目标的功能。 |
amlcompute |
包含用于在 Azure 机器学习中管理 Azure 机器学习计算目标的功能。 |
batch |
包含用于在 Azure 机器学习中管理 Batch 计算目标的功能。 |
compute |
包含 Azure 机器学习中计算目标的抽象父类和配置类。 |
computeinstance |
包含用于在 Azure 机器学习中创建完全托管的基于云的工作站的功能。 |
databricks |
包含用于在 Azure 机器学习中管理 Databricks 计算目标的功能。 |
datafactory |
包含用于在 Azure 机器学习中管理 Datafactory 计算目标的功能。 |
dsvm |
包含用于在 Azure 机器学习中管理 Data Science Virtual Machine 计算目标的功能。 |
hdinsight |
包含用于在 Azure 机器学习中管理 HDInsight 群集计算目标的功能。 |
kubernetescompute |
包含用于在 Azure 机器学习中管理 Azure 机器学习计算目标的功能。 |
kusto |
包含用于在 Azure 机器学习中管理 Kusto 计算目标的功能。 |
remote |
包含用于在 Azure 机器学习中管理远程计算目标的功能。 |
synapse |
管理 Azure 机器学习服务中的 Synapse 计算目标。 |
compute_target |
包含非 Azure 机器学习管理的计算目标的功能。 计算目标定义了训练计算环境,可以是本地资源,也可以是云中的远程资源。 远程资源允许利用加速的 CPU 和 GPU 处理功能轻松纵向或横向扩展机器学习试验。 有关由 Azure 机器学习管理的计算目标的信息,请参阅 ComputeTarget 类。 有关详细信息,请参阅什么是 Azure 机器学习中的计算目标? |
conda_dependencies |
包含用于管理 conda 环境依赖项的功能。 使用 CondaDependencies 类加载现有的 conda 环境文件,并配置和管理执行试验的新环境。 |
container_registry |
包含用于管理 Azure 容器注册表的功能。 |
databricks |
包含用于在 Azure 机器学习中管理 Databricks 环境的功能。 有关在 Azure 机器学习中使用 Databricks 的详细信息,请参阅为 Azure 机器学习配置开发环境。 |
dataset |
管理与 Azure 机器学习数据集的交互。 本模块提供了在 Azure 机器学习中使用原始数据、管理数据,以及对数据执行操作的功能。 使用此模块中的 Dataset 类创建数据集和 data 包中的功能,其中包含支持类 FileDataset 和 TabularDataset。 若要开始使用数据集,请参阅 添加 & 注册数据集一文。 |
datastore |
包含用于管理 Azure 机器学习中数据存储的功能。 |
environment |
包含用于在 Azure 机器学习中创建和管理可重现环境的功能。 环境提供了一种用于管理软件依赖项的方法,以便在本地云和分布式云开发环境之间移动时,只需最少的手动配置即可重现受控环境。 环境可封装 Python 包、环境变量、用于训练和评分脚本的软件设置,以及 Python、Spark 或 Docker 上的运行时间。 有关使用 Azure 机器学习将环境用于训练和部署的详细信息,请参阅创建和管理可重用环境。 |
experiment |
包含用于在 Azure 机器学习中提交试验和管理试验历史记录的功能。 |
container |
包含用于管理 Azure 机器学习中容器映像的功能。 |
image |
包含用于管理 Azure 机器学习中映像的基本功能。 Image 封装模型、脚本和关联的文件,以提供已部署的 Web 服务的运行时环境。 图像具有负载均衡的 HTTP 终结点,它可以接收评分请求并返回预测。 |
unknown_image |
包含用于管理未导入 Azure 机器学习的映像的功能。 |
keyvault |
包含用于管理与 Azure 机器学习工作区关联的 Key Vault 机密的功能。 此模块包含一些便捷方法,用于从与工作区关联的 Azure Key Vault 添加、检索、删除和列出机密。 |
linked_service |
包含用于在 AML 工作区中创建和管理链接服务的功能。 |
model |
包含用于管理 Azure 机器学习中的机器学习模型的功能。 你可以使用 Model 类完成以下主要任务:
有关如何使用模型的详细信息,请参阅 Azure 机器学习的工作原理:体系结构和概念。 |
private_endpoint |
包含用于定义和配置 Azure 专用终结点的功能。 |
profile |
包含 Azure 机器学习中的分析模型的功能。 |
resource_configuration |
包含用于管理 Azure 机器学习实体的资源配置的功能。 |
run |
包含用于管理 Azure 机器学习中的试验指标和项目的功能。 |
runconfig |
包含用于管理 Azure 机器学习中试验运行的配置的功能。 此模块中的键类是 RunConfiguration,它封装了在指定的计算目标上提交训练运行所需的信息。 该配置包括一组广泛的行为定义,例如,是使用现有 Python 环境还是使用根据规范构建的 Conda 环境。 该模块中的其他配置类可通过 RunConfiguration 来访问。 |
script_run |
包含用于管理 Azure 机器学习中提交的训练运行的功能。 |
script_run_config |
包含用于管理在 Azure 机器学习中提交训练运行的配置的功能。 |
util |
包含用于指定日志记录详细信息级别的类。 |
aci |
包含用于在 Azure 容器实例上将机器学习模型部署为 Web 服务终结点的功能。 对于能够在隔离容器中进行操作(包括简单应用程序、任务自动化和生成作业)的情况,建议使用 Azure 容器实例 (ACI)。 有关何时使用 ACI 的详细信息,请参阅将模型部署到 Azure 容器实例。 |
aks |
包含用于在 Azure Kubernetes 服务上将机器学习模型部署为 Web 服务终结点的功能。 对于需要完整容器业务流程(包括跨多个容器的服务发现、自动缩放、协调式应用程序升级)的情况,建议使用 Azure Kubernetes 服务 (AKS)。 有关详细信息,请参阅将模型部署到 Azure Kubernetes 服务。 |
container_resource_requirements |
用于描述 Azure 机器学习中容器资源要求的模型。 |
local |
包含将机器学习模型部署为本地 Web 服务终结点的功能。 对于需要快速部署和验证模型或要测试开发中模型的情况,建议部署到本地 Web 服务。 有关详细信息,请参阅将模型部署到笔记本 VM。 |
unknown_webservice |
包含用于管理 Azure 机器学习中未知 Web 服务的功能。 |
webservice |
包含用于在 Azure 机器学习中管理部署为 Web 服务终结点的模型的功能。 此模块包含抽象父类 Webservice,该类定义用于部署模型的方法。 常见模式是为特定计算目标创建配置对象,然后将 Webservice 类的方法与该配置对象结合使用。
例如,若要部署到 Azure 容器实例,请从 AciWebservice 类的 有关部署的概述,请参阅使用 Azure 机器学习部署模型。 |
workspace |
包含用于管理工作区(Azure 机器学习中的顶级资源)的功能。 此模块包含 Workspace 类及其方法和属性,从而允许管理机器学习项目(如计算目标、环境、数据存储、试验和模型)。 工作区与 Azure 订阅和资源组绑定,是计费的主要方式。 工作区支持 Azure 资源管理器基于角色的访问控制 (RBAC) 和工作区内保存的所有机器学习数据的区域相关性。 |
abstract_dataset |
包含 Azure 机器学习中的数据集的抽象基类。 |
abstract_datastore |
包含将连接信息保存到 Azure 存储服务的数据存储的基本功能。 |
azure_data_lake_datastore |
包含将连接信息保存到 Azure Data Lake Storage 的数据存储的基本功能。 |
azure_my_sql_datastore |
包含将连接信息保存到 Azure Database for MySQL 的数据存储的基本功能。 |
azure_postgre_sql_datastore |
包含将连接信息保存到 Azure Database for PostgreSQL 的数据存储的基本功能。 |
azure_sql_database_datastore |
包含将连接信息保存到 Azure SQL 数据库的数据存储的基本功能。 |
azure_storage_datastore |
包含将连接信息保存到 Azure Blob 和 Azure 文件存储的数据存储功能。 |
constants |
azureml.data 包中使用的常数。 仅限内部使用。 |
context_managers |
包含用于管理数据存储和数据集的数据上下文的功能。 仅限内部使用。 |
data_reference |
包含定义如何创建对数据存储中数据的引用的功能。 |
datacache |
包含用于管理 Azure 机器学习中的 DatacacheStore 和 Datacache 的功能。 |
datacache_client |
仅限内部使用。 |
datacache_consumption_config |
包含 DataCache 使用配置的功能。 |
datacache_singularity_settings |
包含 Datacache 奇点设置表示形式所需的对象。 |
datapath |
包含创建对数据存储中的数据的引用的功能。 此模块包含 DataPath 类,该类表示数据的位置;它还包含 DataPathComputeBinding 类,该类表示数据如何在计算目标上可用。 |
dataset_action_run |
包含管理数据集操作执行的功能。 该模块提供了用于创建数据集操作并在完成后获取其结果的便捷方法。 |
dataset_consumption_config |
包含数据集使用配置的功能。 |
dataset_definition |
包含管理数据集定义及其操作的功能。 注意 此模块已弃用。 有关详细信息,请参阅 https://aka.ms/dataset-deprecation。 |
dataset_error_handling |
包含 Azure 机器学习中数据集错误处理的异常。 |
dataset_factory |
包含用于为 Azure 机器学习创建数据集的功能。 |
dataset_profile |
用于收集数据流生成的数据的汇总统计信息的类。 此模块中的功能包括收集有关哪个运行生成配置文件、配置文件是否过时的信息。 |
dataset_profile_run |
包含用于监视 Azure 机器学习中运行的数据集配置文件的配置。 此模块中的功能包括处理和监视与实验对象以及单个运行 ID 关联的数据集配置文件的运行。 |
dataset_profile_run_config |
包含用于在 Azure 机器学习中生成数据集统计摘要的配置。 此模块中的功能包括提交本地或远程配置文件运行和可视化提交的配置文件运行结果的方法。 |
dataset_snapshot |
包含管理数据集快照操作的功能。 注意 此模块已弃用。 有关详细信息,请参阅 https://aka.ms/dataset-deprecation。 |
dataset_type_definitions |
包含与 Dataset 一起使用的枚举值。 |
datastore_client |
仅限内部使用。 |
dbfs_datastore |
包含用于将连接信息保存到 Databricks 文件系统 (DBFS) 的数据存储的功能。 |
file_dataset |
包含引用数据存储或公共 URL 中的单个或多个文件的功能。 有关详细信息,请参阅 添加 & 注册数据集一文。 若要开始使用文件数据集,请参阅 https://aka.ms/filedataset-samplenotebook。 |
hdfs_datastore |
包含将连接信息保存到 HDFS 群集的数据存储的基本功能。 |
output_dataset_config |
包含指定应如何将作业的输出上传和提升到数据集的配置。 有关详细信息,请参阅如何指定输出一文。 |
sql_data_reference |
包含用于创建对数据存储中数据的引用的功能,这些数据将连接信息保存到 SQL 数据库。 |
stored_procedure_parameter |
包含用于创建参数以传递给 SQL 存储过程的功能。 |
tabular_dataset |
包含通过分析提供的文件或文件列表来以表格格式表示数据的功能。 有关详细信息,请参阅 添加 & 注册数据集一文。 若要开始使用表格数据集,请参阅 https://aka.ms/tabulardataset-samplenotebook。 |
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈