PipelineDataset 类

充当数据集和管道的适配器。

注意

此类已弃用。 若要了解如何在管道中使用数据集,请参阅 https://aka.ms/pipeline-with-dataset

这是内部类。 不应直接创建此类,而应在 Dataset 或 OutputDatasetConfig 类上调用 as_* 实例方法。

充当数据集和管道的适配器。

这是内部类。 不应直接创建此类,而应在 Dataset 或 OutputDatasetConfig 类上调用 as_* 实例方法。

继承
builtins.object
PipelineDataset

构造函数

PipelineDataset(dataset=None, name=None, bind_mode='mount', path_on_compute=None, overwrite=False, parameter_name=None)

参数

dataset
Dataset
默认值: None

将用作步骤的输入的数据集。

name
str
默认值: None

管道中输入的名称。

bind_mode
str
默认值: mount

提供数据集的方式,即装载或下载。

path_on_compute
str
默认值: None

将在计算上提供数据的路径。

overwrite
bool
默认值: False

是否覆盖现有数据。

parameter_name
str
默认值: None

数据集的参数名称。 用于已发布的管道。

dataset
Union[<xref:azureml.core.Datase> 或 AbstractDataset, OutputDatasetConfig]
必需

将用作步骤的输入的数据集。

name
str
必需

管道中输入的名称。

bind_mode
str
必需

提供数据集的方式,即装载或下载。

path_on_compute
str
必需

将在计算上提供数据的路径。

overwrite
bool
必需

是否覆盖现有数据。

方法

create

从 Azure 机器学习数据集创建 PipelineDataset。

注意

不推荐使用此方法。 若要了解如何将数据集与管道结合使用,请参阅

https://aka.ms/pipeline-with-dataset.

default_name

获取数据集/数据集定义的默认端口名称。

注意

不推荐使用此方法。 若要了解如何将数据集与管道结合使用,请参阅

https://aka.ms/pipeline-with-dataset.

is_dataset

确定输入是数据集还是数据集定义。

注意

不推荐使用此方法。 若要了解如何将数据集与管道结合使用,请参阅

https://aka.ms/pipeline-with-dataset.

validate_dataset

验证数据集状态。

注意

不推荐使用此方法。 若要了解如何将数据集与管道结合使用,请参阅

https://aka.ms/pipeline-with-dataset.

如果数据集已弃用,则记录警告;如果数据集已存档,则引发错误。

create

从 Azure 机器学习数据集创建 PipelineDataset。

注意

不推荐使用此方法。 若要了解如何将数据集与管道结合使用,请参阅

https://aka.ms/pipeline-with-dataset.

static create(dataset, name=None, parameter_name=None)

参数

dataset
Union[Dataset, DatasetConsumptionConfig, PipelineDataset]
必需

要从中创建 PipelineDataset 的数据集。

name
str
默认值: None

输入数据集的名称。 如果为 None,则基于输入的类型派生名称。

parameter_name
str
默认值: None

管道参数名称。

返回

创建的 PipelineDataset。

返回类型

default_name

获取数据集/数据集定义的默认端口名称。

注意

不推荐使用此方法。 若要了解如何将数据集与管道结合使用,请参阅

https://aka.ms/pipeline-with-dataset.

static default_name(dataset)

参数

dataset
object
必需

要从中计算名称的数据集。

返回

名称。

返回类型

str

is_dataset

确定输入是数据集还是数据集定义。

注意

不推荐使用此方法。 若要了解如何将数据集与管道结合使用,请参阅

https://aka.ms/pipeline-with-dataset.

static is_dataset(dset)

参数

dset
object
必需

输入。

返回

输入是数据集还是数据集定义。

返回类型

validate_dataset

验证数据集状态。

注意

不推荐使用此方法。 若要了解如何将数据集与管道结合使用,请参阅

https://aka.ms/pipeline-with-dataset.

如果数据集已弃用,则记录警告;如果数据集已存档,则引发错误。

static validate_dataset(dset)

参数

dset
Union[Dataset, DatasetConsumptionConfig]
必需

要验证的数据集。

属性

bind_mode

获取提供数据集的方式。

返回

绑定模式。

返回类型

str

dataset

获取此输入绑定到的数据集。

返回

数据集。

返回类型

Union[Dataset, <xref:azureml.data.abstract_dataset.AbstractDataset,azureml.data.output_dataset_config.OutputDatasetConfig>]

dataset_id

获取数据集 ID。

返回

数据集 ID。

返回类型

str

dataset_version

获取数据集定义版本。

返回

数据集版本。

返回类型

str

name

获取输入名称。

返回

名称。

返回类型

str

overwrite

获取一个指示是否覆盖现有数据的值。

返回

是否覆盖。

返回类型

parameter_name

获取此管道数据集的管道参数名称。

返回

参数名称。

返回类型

str

path_on_compute

获取将在计算上提供数据的路径。

返回

计算路径。

返回类型

str

saved_dataset_id

返回 PipelineDataset 中已保存的数据集 ID。

返回

已保存的数据集 ID。

返回类型

str

workspace

获取数据集所属的工作区。

返回

工作区。

返回类型