hll_merge() (toplama işlevi)

HLL sonuçlarını grup genelinde tek bir HLL değeriyle birleştirir.

Not

Bu işlev summarize işleciyle birlikte kullanılır.

Daha fazla bilgi için temel algoritmaya (HyperLogLog) ve tahmin doğruluğuna bakın.

Önemli

hll(), hll_if() ve hll_merge() sonuçları depolanabilir ve daha sonra alınabilir. Örneğin, daha sonra haftalık sayıları hesaplamak için kullanılabilecek günlük benzersiz kullanıcılar özeti oluşturmak isteyebilirsiniz. Ancak, bu sonuçların kesin ikili gösterimi zaman içinde değişebilir. Bu işlevlerin özdeş girişler için aynı sonuçları üreteceğinin garantisi yoktur ve bu nedenle bunlara güvenmeyi önermiyoruz.

Syntax

hll_merge(hll)

Söz dizimi kuralları hakkında daha fazla bilgi edinin.

Parametreler

Ad Tür Gerekli Açıklama
hll string ✔️ Birleştirilecek HLL değerlerini içeren sütun adı.

Döndürülenler

işlevi, grup genelinde hll'nin birleştirilmiş HLL değerlerini döndürür.

İpucu

hll() ve hll_merge() toplama işlevlerini hesaplamak dcount için dcount_hll işlevini kullanın.

Örnek

Aşağıdaki örnekte, tek bir HLL değeriyle birleştirilmiş bir grup genelinde HLL sonuçları gösterilmektedir.

StormEvents
| summarize hllRes = hll(DamageProperty) by bin(StartTime,10m)
| summarize hllMerged = hll_merge(hllRes)

Çıkış

Sonuçlar dizideki yalnızca ilk beş sonucu gösterir.

hllMerged
[[1024,14],["-6903255281122589438","-7413697181929588220","-2396604341988936699","5824198135224880646","-6257421034880415225", ...],[]]

Tahmin doğruluğu

Bu işlev, küme kardinalitesinin stokastik tahminini yapan HyperLogLog (HLL) algoritmasının bir değişkenini kullanır. Algoritma, bellek boyutu başına doğruluk ve yürütme süresini dengelemek için kullanılabilecek bir "düğme" sağlar:

Doğruluk Hata (%) Giriş sayısı
0 1.6 212
1 0,8 214
2 0,4 216
3 0.28 217
4 0,2 218

Not

"Giriş sayısı" sütunu, HLL uygulamasındaki 1 baytlık sayaçların sayısıdır.

Küme kardinalitesi yeterince küçükse algoritma, mükemmel bir sayı (sıfır hata) yapmaya yönelik bazı hükümler içerir:

  • Doğruluk düzeyi olduğunda 11000 değer döndürülür
  • Doğruluk düzeyi olduğunda 28000 değer döndürülür

Hata sınırı olasılıktır, teorik bir sınır değildir. Değer, hata dağılımının standart sapmasıdır (sigma) ve tahminlerin %99,7'sinde 3 x sigma'nın altında göreli bir hata olur.

Aşağıdaki görüntüde, desteklenen tüm doğruluk ayarları için yüzde cinsinden göreli tahmin hatasının olasılık dağılımı işlevi gösterilmektedir:

Hll hata dağılımını gösteren grafik.