共用方式為


corr 彙總函式

適用于:核取標示為是 Databricks SQL 檢查標示為是 Databricks Runtime

傳回一組數位組之間的相互關聯性 Pearson 係數。

語法

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

您也可以使用 OVER 子句,將此函式叫用為視窗函式。

參數

  • expr1:評估為數值的運算式。
  • expr2:評估為數值的運算式。
  • cond:選擇性布林運算式,篩選用於匯總的資料列。

返回

DOUBLE。

如果 DISTINCT 指定 ,則函式只會在唯一的 expr1 一組 上 expr2 運作。

例子

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0