次の方法で共有


hll_sketch_estimate 関数

適用対象:check marked yes Databricks SQL Databricks Runtime 13.3 LTS 以降

この関数は、HyperLogLog アルゴリズムを利用して、特定の列内の一意の値の数の確率的近似値をカウントし、 hll_sketch_agg 関数によって以前に生成されたスケッチ バッファーと呼ばれるバイナリ表現を使用し、結果を大きな整数として返します。

hll_union 関数と hll_union_agg 関数では、これらのバッファーを入力として使用し、マージすることでスケッチを結合することもできます。

実装では、Apache Datasketches ライブラリを使用します。 詳細については、「HLL」を参照してください。

構文

hll_sketch_estimate ( expr )

引数

  • expr: hll_sketch_agg によって生成されるスケッチを保持する BINARY 式。

返品

入力スケッチによって表されるおおよその個別の数である BIGINT 値。

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3