Fonction d’agrégation collect_set

S’applique à :case marquée oui Databricks SQL case marquée oui Databricks Runtime

Retourne un tableau contenant toutes les valeurs uniques figurant dans expr au sein du groupe.

Syntaxe

collect_set(expr) [FILTER ( WHERE cond ) ]

Cette fonction peut également être appelée en tant que fonction de fenêtre à l’aide de la clause OVER.

Arguments

  • expr: Une expression de tout type. à l’exception de MAP.
  • cond : expression booléenne facultative qui filtre les lignes utilisées pour l’agrégation.

Retours

Tableau (ARRAY) du type d’argument.

L’ordre des éléments dans le tableau n’est pas déterministe. Les valeurs NULL sont exclues.

Exemples

> SELECT collect_set(col) FROM VALUES (1), (2), (NULL), (1) AS tab(col);
 [1,2]

> SELECT collect_set(col1) FILTER(WHERE col2 = 10)
    FROM VALUES (1, 10), (2, 10), (NULL, 10), (1, 10), (3, 12) AS tab(col1, col2);
 [1,2]