Funktionen hll_sketch_estimate

Gäller för:markerad ja Databricks SQL markerad ja Databricks Runtime 13.3 LTS och senare

Den här funktionen använder HyperLogLog-algoritmen för att räkna en probabilistisk uppskattning av antalet unika värden i en viss kolumn, vilket förbrukar en binär representation som kallas en skissbuffert som tidigare genererades av funktionen hll_sketch_agg och returnerar resultatet som ett stort heltal.

Funktionerna hll_union och hll_union_agg kan också kombinera skisser genom att använda och sammanfoga dessa buffertar som indata.

Implementeringen använder Apache Datasketches-biblioteket. Mer information finns i HLL .

Syntax

hll_sketch_estimate ( expr )

Argument

  • expr: Ett BINARY uttryck som innehåller en skiss som genererats av hll_sketch_agg.

Returer

Ett BIGINT värde som är det ungefärliga distinkta antalet som representeras av indataskissen.

Exempel

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3