corr
statistische functie
Van toepassing op: Databricks Databricks Runtime
Retourneert Pearson-coëfficiënt van correlatie tussen een groep getalparen.
Syntaxis
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Deze functie kan ook worden aangeroepen als een vensterfunctie met behulp van de OVER
-component.
Argumenten
expr1
: Een expressie die resulteert in een numerieke waarde.expr2
: Een expressie die resulteert in een numerieke waarde.cond
: een optionele Booleaanse expressie die de rijen filtert die worden gebruikt voor aggregatie.
Retourneert
EEN DUBBELE.
Als DISTINCT
is opgegeven, werkt de functie alleen op een unieke set van expr1
, expr2
paren.
Voorbeelden
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0