Sdílet prostřednictvím


hll_merge()

Sloučí výsledky HLL. Toto je skalární verze agregované verze hll_merge().

Přečtěte si o základním algoritmu (HyperLogLog) a přesnosti odhadu.

Důležité

Výsledky hll(), hll_if() a hll_merge() je možné uložit a později načíst. Můžete například chtít vytvořit denní souhrn jedinečných uživatelů, který pak můžete použít k výpočtu týdenních počtů. Přesné binární znázornění těchto výsledků se však může v průběhu času měnit. Neexistuje žádná záruka, že tyto funkce pro identické vstupy vygenerují identické výsledky, a proto nedoporučujeme spoléhat se na ně.

Syntax

hll_merge(hll,Jana 2, [ hll3, ... ])

Přečtěte si další informace o konvencích syntaxe.

Parametry

Název Typ Vyžadováno Popis
hll, hll2, ... string ✔️ Názvy sloupců obsahujících hodnoty HLL, které se mají sloučit. Funkce očekává 2 až 64 argumentů.

Návraty

Vrátí jednu hodnotu HLL. Hodnota je výsledkem sloučení sloupců hll, hll2, ... hllN.

Příklady

Tento příklad ukazuje hodnotu sloučených sloupců.

range x from 1 to 10 step 1 
| extend y = x + 10
| summarize hll_x = hll(x), hll_y = hll(y)
| project merged = hll_merge(hll_x, hll_y)
| project dcount_hll(merged)

Výstup

dcount_hll_merged
20

Přesnost odhadu

Tato funkce používá variantu algoritmu HyperLogLog (HLL), který provádí stochastický odhad kardinality sady. Algoritmus poskytuje "knoflík", který lze použít k vyvážení přesnosti a doby provádění podle velikosti paměti:

Přesnost Chyba (%) Počet položek
0 1.6 212
1 0.8 214
2 0.4 216
3 0,28 Č. 217
4 0.2 218

Poznámka

Sloupec "počet položek" je počet 1-bajtové čítače v implementaci HLL.

Algoritmus obsahuje několik ustanovení pro provedení dokonalého počtu (chyba nula), pokud je nastavená kardinalita dostatečně malá:

  • Pokud je 1úroveň přesnosti , vrátí se 1 000 hodnot.
  • Pokud je 2úroveň přesnosti , vrátí se 8 000 hodnot.

Chybová hranice je pravděpodobnostní, nikoli teoretická. Hodnota je směrodatnou odchylkou rozdělení chyb (sigma) a 99,7 % odhadů bude mít relativní chybu pod 3 x sigma.

Následující obrázek ukazuje funkci rozdělení pravděpodobnosti chyby relativního odhadu v procentech pro všechna podporovaná nastavení přesnosti:

Graf znázorňující distribuci chyb hll