collect_set 聚合函数

适用于:勾选“是” Databricks SQL 勾选“是” Databricks Runtime

返回一个数组,该数组由组内 expr 中的所有唯一值组成。

语法

collect_set(expr) [FILTER ( WHERE cond ) ]

还可以使用 OVER 子句将此函数作为窗口函数调用。

参数

  • expr:除 MAP 以外任何类型的表达式。
  • cond:可选的布尔表达式,可筛选用于聚合的行。

返回

参数类型的 ARRAY。

数组中元素的顺序不确定。 排除 NULL 值。

示例

> SELECT collect_set(col) FROM VALUES (1), (2), (NULL), (1) AS tab(col);
 [1,2]

> SELECT collect_set(col1) FILTER(WHERE col2 = 10)
    FROM VALUES (1, 10), (2, 10), (NULL, 10), (1, 10), (3, 12) AS tab(col1, col2);
 [1,2]