Compartir a través de


corr (función de agregado)

Se aplica a:casilla marcada como Sí Databricks SQL casilla marcada como Sí Databricks Runtime

Devuelve el coeficiente de correlación de Pearson entre un grupo de pares de números.

Sintaxis

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Esta función también se puede invocar como una función de ventana mediante la cláusula OVER.

Argumentos

  • expr1: una expresión que se evalúa como un número.
  • expr2: una expresión que se evalúa como un número.
  • cond: una expresión booleana opcional que filtra las filas usadas para la agregación.

Devoluciones

Un valor DOUBLE.

Si se especifica DISTINCT, la función solo afecta a un conjunto único de pares expr1, expr2.

Ejemplos

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0