corr
彙總函式
適用于: Databricks SQL Databricks Runtime
傳回一組數位組之間的相互關聯性 Pearson 係數。
語法
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
您也可以使用 OVER
子句,將此函式叫用為視窗函式。
參數
expr1
:評估為數值的運算式。expr2
:評估為數值的運算式。cond
:選擇性布林運算式,篩選用於匯總的資料列。
返回
DOUBLE。
如果 DISTINCT
指定 ,則函式只會在唯一的 expr1
一組 上 expr2
運作。
例子
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0