corr mängdfunktion

Gäller för:check markerad ja Databricks SQL-kontroll markerad som ja Databricks Runtime

Returnerar Pearson-koefficienten för korrelation mellan en grupp med talpar.

Syntax

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Den här funktionen kan också anropas som en fönsterfunktion med hjälp av - OVER satsen.

Argument

  • expr1: Ett uttryck som utvärderas till ett numeriskt.
  • expr2: Ett uttryck som utvärderas till ett numeriskt.
  • cond: Ett valfritt booleskt uttryck som filtrerar de rader som används för aggregering.

Returnerar

EN DUBBEL.

Om DISTINCT anges fungerar funktionen bara på en unik uppsättning med expr1, expr2 par.

Exempel

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0