dataset 模块

管理与 Azure 机器学习数据集的交互。

本模块提供了在 Azure 机器学习中使用原始数据、管理数据,以及对数据执行操作的功能。 使用此模块中的 Dataset 类创建数据集和 data 包中的功能,其中包含支持类 FileDatasetTabularDataset

若要开始处理数据集,请参阅添加和注册数据集

Dataset

表示在 Azure 机器学习中用于探索、转换和管理数据的资源。

数据集是对 Datastore 中或公共 Web url 后面的数据的引用。

对于此类中已弃用的方法,请检查 AbstractDataset 类以了解改进的 API。

支持以下数据集类型:

  • TabularDataset 表示表格格式的、通过分析提供的文件或文件列表所创建的数据。

  • FileDataset 引用数据存储或公共 URL 中的单个或多个文件。

若要开始处理数据集,请参阅添加和注册数据集一文,或查看 https://aka.ms/tabulardataset-samplenotebookhttps://aka.ms/filedataset-samplenotebook 笔记本。