corr
mängdfunktion
Gäller för: Databricks Databricks Runtime
Returnerar Pearson-koefficienten för korrelation mellan en grupp med talpar.
Syntax
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Den här funktionen kan också anropas som en fönsterfunktion med hjälp av - OVER
satsen.
Argument
expr1
: Ett uttryck som utvärderas till ett numeriskt.expr2
: Ett uttryck som utvärderas till ett numeriskt.cond
: Ett valfritt booleskt uttryck som filtrerar de rader som används för aggregering.
Returnerar
EN DUBBEL.
Om DISTINCT
anges fungerar funktionen bara på en unik uppsättning med expr1
, expr2
par.
Exempel
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0