azureml-pipeline-core 包

参考

包

core

包含 Azure 机器学习管道的核心功能，这些管道是可配置的机器学习工作流。

使用 Azure 机器学习管道，可以创建可重用的机器学习工作流，这些工作流可用作机器学习方案的模板。此包包含用于 Azure 机器学习管道的核心功能，通常与 steps 包中的类一起使用。

机器学习管道由 PipelineStep 对象的集合表示，可以对这些对象进行排序和并行化，也可以通过步骤之间的显式依赖关系创建这些对象。管道步骤用于定义 Pipeline 对象，该对象表示要执行的工作流。可以在 Jupyter Notebook 或其他任何安装了 Azure ML SDK 的 IDE 中创建和使用管道。

Azure 机器学习管道使你能够将工作重心放在机器学习上，而不是基础结构。若要开始生成管道，请参阅 https://aka.ms/pl-first-pipeline。

若要详细了解机器学习管道的优势，以及它与 Azure 提供的其他管道之间的关联，请参阅 Azure 机器学习服务中的机器学习管道是什么？

模块

builder	定义用于生成 Azure 机器学习管道的类。管道图包含管道步骤 (PipelineStep)，在每个步骤中生成或使用的可选管道数据 (PipelineData)，以及可选的步骤执行序列 (StepSequence)。
graph	定义用于构造 Azure 机器学习管道图形的类。使用 PipelineStep（和派生类）、PipelineData 和 PipelineData 对象时，会为 Pipeline 对象创建 Azure ML 管道图。在典型用例中，无需直接使用此模块中的类。管道运行图由模块节点组成，这些节点表示基本单位，如数据源或步骤。节点可以有输入端口和输出端口，以及关联的参数。边缘定义图中两个节点端口之间的关系。
module	包含用于创建和管理 Azure 机器学习管道的可重用计算单元的类。模块允许在 Pipeline 中创建计算单元。计算单元可以有输入、输出，并依赖于参数和环境配置来运行。可以对模块进行版本控制，并在不同的 Azure 机器学习管道中使用模块，而 PipelineStep（及其派生的类）则与此不同，它只能在一个管道中使用。模块设计为在多个管道中重用，并且可以演进，使特定的计算逻辑适应不同的用例。可以在快速迭代中使用管道中的某个步骤来改进算法，一旦实现目标，该算法通常会作为模块发布，以便可供重用。
module_step_base	包含使用 Module 的版本向管道添加步骤的功能。
pipeline	定义用于创建可重用 Azure 机器学习工作流的类。
pipeline_draft	定义用于管理可变管道的类。
pipeline_endpoint	定义用于管理管道的类，包括版本控制和终结点。
pipeline_output_dataset	包含用于将中间输出提升为 Azure 机器学习数据集的功能。默认情况下，管道中的中间数据（输出）不会成为 Azure 机器学习数据集。若要将中间数据提升为 Azure 机器学习数据集，请调用 PipelineData 类的 as_dataset 方法以返回 PipelineOutputFileDataset 对象。然后，可以从 PipelineOutputFileDataset 对象创建一个 PipelineOutputTabularDataset 对象。
run	为提交的管道定义类，包括用于检查状态和检索运行详细信息的类。
schedule	定义用于计划 Azure 机器学习管道提交的类。

azureml-pipeline-core 包

包

模块

反馈

反馈

其他资源