azureml-pipeline-core 包

core

包含 Azure 机器学习管道的核心功能,这些管道是可配置的机器学习工作流。

使用 Azure 机器学习管道,可以创建可重用的机器学习工作流,这些工作流可用作机器学习方案的模板。 此包包含用于 Azure 机器学习管道的核心功能,通常与 steps 包中的类一起使用。

机器学习管道由 PipelineStep 对象的集合表示,可以对这些对象进行排序和并行化,也可以通过步骤之间的显式依赖关系创建这些对象。 管道步骤用于定义 Pipeline 对象,该对象表示要执行的工作流。 可以在 Jupyter Notebook 或其他任何安装了 Azure ML SDK 的 IDE 中创建和使用管道。

Azure 机器学习管道使你能够将工作重心放在机器学习上,而不是基础结构。 若要开始生成管道,请参阅 https://aka.ms/pl-first-pipeline

若要详细了解机器学习管道的优势,以及它与 Azure 提供的其他管道之间的关联,请参阅 Azure 机器学习服务中的机器学习管道是什么?

模块

builder

定义用于生成 Azure 机器学习管道的类。

管道图包含管道步骤 (PipelineStep),在每个步骤中生成或使用的可选管道数据 (PipelineData),以及可选的步骤执行序列 (StepSequence)。

graph

定义用于构造 Azure 机器学习管道图形的类。

使用 PipelineStep(和派生类)、PipelineDataPipelineData 对象时,会为 Pipeline 对象创建 Azure ML 管道图。 在典型用例中,无需直接使用此模块中的类。

管道运行图由模块节点组成,这些节点表示基本单位,如数据源或步骤。 节点可以有输入端口和输出端口,以及关联的参数。 边缘定义图中两个节点端口之间的关系。

module

包含用于创建和管理 Azure 机器学习管道的可重用计算单元的类。

模块允许在 Pipeline 中创建计算单元。计算单元可以有输入、输出,并依赖于参数和环境配置来运行。 可以对模块进行版本控制,并在不同的 Azure 机器学习管道中使用模块,而 PipelineStep(及其派生的类)则与此不同,它只能在一个管道中使用。

模块设计为在多个管道中重用,并且可以演进,使特定的计算逻辑适应不同的用例。 可以在快速迭代中使用管道中的某个步骤来改进算法,一旦实现目标,该算法通常会作为模块发布,以便可供重用。

module_step_base

包含使用 Module 的版本向管道添加步骤的功能。

pipeline

定义用于创建可重用 Azure 机器学习工作流的类。

pipeline_draft

定义用于管理可变管道的类。

pipeline_endpoint

定义用于管理管道的类,包括版本控制和终结点。

pipeline_output_dataset

包含用于将中间输出提升为 Azure 机器学习数据集的功能。

默认情况下,管道中的中间数据(输出)不会成为 Azure 机器学习数据集。 若要将中间数据提升为 Azure 机器学习数据集,请调用 PipelineData 类的 as_dataset 方法以返回 PipelineOutputFileDataset 对象。 然后,可以从 PipelineOutputFileDataset 对象创建一个 PipelineOutputTabularDataset 对象。

run

为提交的管道定义类,包括用于检查状态和检索运行详细信息的类。

schedule

定义用于计划 Azure 机器学习管道提交的类。