mean
função de agregação
Aplica-se a: do SQL do Databricks Databricks Runtime
Devolve a média calculada a partir dos valores de um grupo. Esta função é um sinónimo para a função de agregação média.
Sintaxe
mean ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
Esta função também pode ser invocada como uma função de janela com a OVER
cláusula .
Argumentos
expr
: uma expressão que é avaliada como numérica.cond
: uma expressão booleana opcional que filtra as linhas utilizadas para agregação.
Devolve
O tipo de resultado é calculado como para os argumentos:
DECIMAL(p, s)
: o tipo de resultado é aDECIMAL(p + 4, s + 4)
. Se for atingida a precisão máxima para DECIMAL, o aumento da escala é limitado para evitar a perda de dígitos significativos.- intervalo de ano/mês: o resultado é um
INTERVAL YEAR TO MONTH
. - intervalo de tempo diário: o resultado é um
INTERVAL DAY TO SECOND
. - Em todos os outros casos, o resultado é duplo.
Os valores nulos dentro do grupo são ignorados. Se um grupo estiver vazio ou consistir apenas em nulos, o resultado será NULO.
Se DISTINCT
for especificada, a média é calculada depois de os duplicados terem sido removidos.
Aviso
No Databricks Runtime, se spark.sql.ansi.enabled for false
, um excesso de capacidade devolve NULL
em vez de um erro.
Exemplos
> SELECT mean(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT mean(DISTINCT col) FROM VALUES (1), (1), (2), (NULL) AS tab(col);
1.5
> SELECT mean(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5