hll_sketch_agg funkcja agregacji

Dotyczy:zaznacz pole wyboru oznaczone jako tak Databricks SQL zaznacz pole wyboru oznaczone jako tak Databricks Runtime 13.3 LTS i nowsze

Ta funkcja wykorzystuje algorytm HyperLogLog do zliczania probabilistycznego przybliżenia liczby unikatowych wartości w danej kolumnie i zwraca wynik jako reprezentację binarną znaną jako bufor szkicu. Ta reprezentacja binarna jest odpowiednia do trwałości.

Zapytania mogą używać wynikowych buforów do obliczania przybliżonych unikatowych liczb za pomocą funkcji hll_sketch_estimate .

Funkcje hll_union i hll_union_agg mogą również łączyć szkice, zużywając i scalając te bufory jako dane wejściowe.

Implementacja używa biblioteki Apache Datasketches. Aby uzyskać więcej informacji, zobacz HLL .

Składnia

hll_sketch_agg ( expr [, lgConfigK ] )

Tę funkcję można również wywołać jako funkcję okna przy użyciu klauzuli OVER .

Argumenty

  • expr: wyrażenie typu INT, , BIGINTSTRINGlubBINARY, względem którego wystąpi unikatowe zliczanie.
  • lgConfigK: opcjonalna INT stała z zakresu od 4 do 21 włącznie z wartością domyślną 12. Log-base-2 z K, gdzie K jest liczbą zasobników lub gniazd dla szkicu.

Dowolny NULL w pliku expr jest ignorowany.

Zwraca

NULLBINARY Bufor bez buforu zawierającego szkic funkcji HyperLogLog obliczony w wyniku zużywania i agregowania wszystkich wartości wejściowych w grupie agregacji.

Przykłady

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3