hll_union_aggFunción

Se aplica a:casilla marcada como sí Databricks SQL casilla marcada como Sí Databricks Runtime 13.3 LTS y versiones posteriores

Esta función utiliza el algoritmo HyperLogLog para combinar un grupo de bocetos en uno solo.

Las consultas pueden usar los búferes resultantes para calcular recuentos únicos aproximados con la función hll_sketch_estimate.

La implementación usa la Biblioteca Apache Datasketches. Para obtener más información, consulte HLL.

Sintaxis

hll_union_agg ( expr [, allowDifferentLgConfigK ] )

Esta función también se puede invocar como una función de ventana mediante la cláusula OVER.

Argumentos

  • expr: Una expresión BINARY que contiene un boceto generado por hll_sketch_agg.
  • allowDifferentLgConfigK: Una expresión constante opcionalBOOLEAN que controla si se permite fusionar bocetos con valores lgConfigK diferentes. El valor predeterminado es falso.

Devoluciones

Un BINARY búfer que contiene el boceto de HyperLogLog calculado como resultado de combinar las expresiones de entrada.

Cuando el allowDifferentLgConfigK parámetro es true, el boceto de resultados usa el menor de los dos valores proporcionados lgConfigK.

Ejemplos

> SELECT hll_sketch_estimate(hll_union_agg(sketch, true))
    FROM (SELECT hll_sketch_agg(col) as sketch
            FROM VALUES (1) AS tab(col)
          UNION ALL
          SELECT hll_sketch_agg(col, 20) as sketch
            FROM VALUES (1) AS tab(col));
  1

> SELECT hll_sketch_estimate(hll_union_agg(sketch, false))
    FROM (SELECT hll_sketch_agg(col) as sketch
            FROM VALUES (1) AS tab(col)
          UNION ALL
          SELECT hll_sketch_agg(col, 20) as sketch
            FROM VALUES (1) AS tab(col));
  error