hll_unionFunción

Se aplica a:casilla marcada como sí Databricks SQL casilla marcada como Sí Databricks Runtime 13.3 LTS y versiones posteriores

Esta función utiliza el algoritmo HyperLogLog para combinar dos bocetos en un solo croquis.

Las consultas pueden usar los búferes resultantes para calcular recuentos únicos aproximados con la función hll_sketch_estimate.

La implementación usa la Biblioteca Apache Datasketches. Para obtener más información, consulte HLL.

Sintaxis

hll_union ( expr1, expr2 [, allowDifferentLgConfigK ] )

Argumentos

  • exprN: Una expresión BINARY que contiene un boceto generado por hll_sketch_agg.
  • allowDifferentLgConfigK: expresión opcional BOOLEAN que controla si se permiten combinar dos bocetos con valores lgConfigK diferentes. El valor predeterminado es falso.

Devoluciones

Un BINARY búfer que contiene el boceto de HyperLogLog calculado como resultado de combinar las expresiones de entrada.

Cuando el allowDifferentLgConfigK parámetro es true, el boceto de resultados usa el menor de los dos valores proporcionados lgConfigK.

Ejemplos

> SELECT hll_sketch_estimate(
  hll_union(
    hll_sketch_agg(col1),
    hll_sketch_agg(col2)))
  FROM VALUES
    (1, 4),
    (1, 4),
    (2, 5),
    (2, 5),
    (3, 6) AS tab(col1, col2);
  6

> SELECT hll_sketch_estimate(
  hll_union(
    hll_sketch_agg(col1,  4),
    hll_sketch_agg(col2, 21)))
  FROM VALUES
    (1, 4),
    (1, 4),
    (2, 5),
    (2, 5),
    (3, 6) AS tab(col1, col2);
  error