添加列

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

将一组列从一个数据集添加到另一个

类别: 数据转换/操作

注意

适用于:机器学习 Studio (经典) 应用

可在 Azure 机器学习设计器中获取类似的拖放模块。

模块概述

本文介绍如何使用 机器学习 Studio (经典) 中的"添加列"模块来连接两个数据集。

将指定为输入的两个数据集中的所有列合并,以便创建一个数据集。 如果需要连接两个以上的数据集,请使用“添加列”的多个实例。

合并包含不同行数的两个数据集时,建议使用联接数据模块,该模块支持对公用键列进行外部联接。

如何配置“添加列”

  1. 将" 添加列" 模块添加到试验。

  2. 连接要连接的两个数据集。 如果要合并两个以上的数据集,可以将多个“添加列”的组合链接起来。

    • 可以合并具有不同行数的两个列。 对于较小的源列中的每一行,输出数据集中会填充缺失值。

    • 不能选择要添加的单个列。 使用“添加列”时,将连接每个数据集中的所有列。 因此,如果只想添加列的子集,请使用"选择数据集 中的 列"创建包含你选择的列的数据集。

  3. 运行试验。

结果

运行试验后:

  • 若要查看新数据集的第一行,请右键单击"添加列 "的输出, 然后选择"可视化 "
  • 若要保存连接数据集并将其命名,请右键单击输出并选择" 另存为数据集"

新数据集中的列数等于两个输入数据集的列数之和。

如果在输入数据集中存在两个具有相同名称的列,则将一个数字后缀添加到右侧输入列中所用数据集中的列的名称。 例如,如果一个名为“TargetOutcome”的列具有两个实例,则将右侧列重命名为“TargetOutcome (1)”

示例

有关如何在 试验中使用的 添加列的示例,请参阅以下 Azure AI 库

预期输入

名称 类型 说明
左侧数据集 数据表 左侧数据集
右侧数据集 数据表 右侧数据集

输出

名称 类型 说明
合并的数据集 数据表 合并的数据集

例外

异常 描述
错误 0003 如果一个或多个输入数据集为 null 或为空,则会发生异常。
错误 0017 如果一个或多个指定的列具有不受当前模块支持的类型,则会发生异常。

有关特定于工作室和经典 (模块) 的列表,请参阅机器学习代码

有关 API 异常的列表,请参阅机器学习 REST API代码

另请参阅

操作
数据转换
A-Z 模块列表