Fonction d’agrégation mean

S’applique à :case marquée oui Databricks SQL case marquée oui Databricks Runtime

Retourne la moyenne calculée à partir des valeurs d’un groupe. Cette fonction est un synonyme de la fonction d'agrégation avg.

Syntaxe

mean ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]

Cette fonction peut également être appelée en tant que fonction de fenêtre à l’aide de la clause OVER.

Arguments

  • expr : Expression qui prend une valeur numérique.
  • cond : expression booléenne facultative qui filtre les lignes utilisées pour l’agrégation.

Retours

Le type de résultat est calculé comme pour les arguments :

  • DECIMAL(p, s) : le type de résultat est DECIMAL(p + 4, s + 4). Si la précision maximale de DECIMAL est atteinte, l’augmentation de l’échelle est limitée pour éviter la perte de chiffres significatifs.
  • Intervalle d’année-mois : le résultat est INTERVAL YEAR TO MONTH.
  • intervalle de jour-heure : le résultat est INTERVAL DAY TO SECOND.
  • Dans tous les autres cas, le résultat est une valeur DOUBLE.

Les valeurs Null au sein du groupe sont ignorées. Si un groupe est vide ou comprend uniquement des valeurs Null, le résultat est NULL.

Si DISTINCT est spécifié, la moyenne est calculée après la suppression des doublons.

Avertissement

Dans Databricks Runtime, si spark.sql.ansi.enabled a la valeur false, un dépassement de capacité retourne NULL au lieu d’une erreur.

Exemples

> SELECT mean(col) FROM VALUES (1), (2), (3) AS tab(col);
 2.0

> SELECT mean(DISTINCT col) FROM VALUES (1), (1), (2), (NULL) AS tab(col);
 1.5

> SELECT mean(col) FROM VALUES (1), (2), (NULL) AS tab(col);
 1.5