corr statistische functie

Van toepassing op:gemarkeerd met ja Databricks SQL-controle gemarkeerd als ja Databricks Runtime

Retourneert Pearson-coëfficiënt van correlatie tussen een groep getalparen.

Syntaxis

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Deze functie kan ook worden aangeroepen als een vensterfunctie met behulp van de OVER -component.

Argumenten

  • expr1: Een expressie die resulteert in een numerieke waarde.
  • expr2: Een expressie die resulteert in een numerieke waarde.
  • cond: een optionele Booleaanse expressie die de rijen filtert die worden gebruikt voor aggregatie.

Retourneert

EEN DUBBELE.

Als DISTINCT is opgegeven, werkt de functie alleen op een unieke set van expr1, expr2 paren.

Voorbeelden

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0