mean função de agregação

Aplica-se a:verificar a verificação sim do SQL do Databricks marcada como sim Databricks Runtime

Devolve a média calculada a partir dos valores de um grupo. Esta função é um sinónimo para a função de agregação média.

Sintaxe

mean ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]

Esta função também pode ser invocada como uma função de janela com a OVER cláusula .

Argumentos

  • expr: uma expressão que é avaliada como numérica.
  • cond: uma expressão booleana opcional que filtra as linhas utilizadas para agregação.

Devolve

O tipo de resultado é calculado como para os argumentos:

  • DECIMAL(p, s): o tipo de resultado é a DECIMAL(p + 4, s + 4). Se for atingida a precisão máxima para DECIMAL, o aumento da escala é limitado para evitar a perda de dígitos significativos.
  • intervalo de ano/mês: o resultado é um INTERVAL YEAR TO MONTH.
  • intervalo de tempo diário: o resultado é um INTERVAL DAY TO SECOND.
  • Em todos os outros casos, o resultado é duplo.

Os valores nulos dentro do grupo são ignorados. Se um grupo estiver vazio ou consistir apenas em nulos, o resultado será NULO.

Se DISTINCT for especificada, a média é calculada depois de os duplicados terem sido removidos.

Aviso

No Databricks Runtime, se spark.sql.ansi.enabled for false, um excesso de capacidade devolve NULL em vez de um erro.

Exemplos

> SELECT mean(col) FROM VALUES (1), (2), (3) AS tab(col);
 2.0

> SELECT mean(DISTINCT col) FROM VALUES (1), (1), (2), (NULL) AS tab(col);
 1.5

> SELECT mean(col) FROM VALUES (1), (2), (NULL) AS tab(col);
 1.5