hll_merge() (toplama işlevi)
HLL sonuçlarını grup genelinde tek bir HLL değeriyle birleştirir.
Not
Bu işlev summarize işleciyle birlikte kullanılır.
Daha fazla bilgi için temel algoritmaya (HyperLogLog) ve tahmin doğruluğuna bakın.
Önemli
hll(), hll_if() ve hll_merge() sonuçları depolanabilir ve daha sonra alınabilir. Örneğin, daha sonra haftalık sayıları hesaplamak için kullanılabilecek günlük benzersiz kullanıcılar özeti oluşturmak isteyebilirsiniz. Ancak, bu sonuçların kesin ikili gösterimi zaman içinde değişebilir. Bu işlevlerin özdeş girişler için aynı sonuçları üreteceğinin garantisi yoktur ve bu nedenle bunlara güvenmeyi önermiyoruz.
Syntax
hll_merge
(
hll)
Söz dizimi kuralları hakkında daha fazla bilgi edinin.
Parametreler
Ad | Tür | Gerekli | Açıklama |
---|---|---|---|
hll | string |
✔️ | Birleştirilecek HLL değerlerini içeren sütun adı. |
Döndürülenler
işlevi, grup genelinde hll'nin birleştirilmiş HLL değerlerini döndürür.
İpucu
hll() ve hll_merge() toplama işlevlerini hesaplamak dcount
için dcount_hll işlevini kullanın.
Örnek
Aşağıdaki örnekte, tek bir HLL değeriyle birleştirilmiş bir grup genelinde HLL sonuçları gösterilmektedir.
StormEvents
| summarize hllRes = hll(DamageProperty) by bin(StartTime,10m)
| summarize hllMerged = hll_merge(hllRes)
Çıkış
Sonuçlar dizideki yalnızca ilk beş sonucu gösterir.
hllMerged |
---|
[[1024,14],["-6903255281122589438","-7413697181929588220","-2396604341988936699","5824198135224880646","-6257421034880415225", ...],[]] |
Tahmin doğruluğu
Bu işlev, küme kardinalitesinin stokastik tahminini yapan HyperLogLog (HLL) algoritmasının bir değişkenini kullanır. Algoritma, bellek boyutu başına doğruluk ve yürütme süresini dengelemek için kullanılabilecek bir "düğme" sağlar:
Doğruluk | Hata (%) | Giriş sayısı |
---|---|---|
0 | 1.6 | 212 |
1 | 0,8 | 214 |
2 | 0,4 | 216 |
3 | 0.28 | 217 |
4 | 0,2 | 218 |
Not
"Giriş sayısı" sütunu, HLL uygulamasındaki 1 baytlık sayaçların sayısıdır.
Küme kardinalitesi yeterince küçükse algoritma, mükemmel bir sayı (sıfır hata) yapmaya yönelik bazı hükümler içerir:
- Doğruluk düzeyi olduğunda
1
1000 değer döndürülür - Doğruluk düzeyi olduğunda
2
8000 değer döndürülür
Hata sınırı olasılıktır, teorik bir sınır değildir. Değer, hata dağılımının standart sapmasıdır (sigma) ve tahminlerin %99,7'sinde 3 x sigma'nın altında göreli bir hata olur.
Aşağıdaki görüntüde, desteklenen tüm doğruluk ayarları için yüzde cinsinden göreli tahmin hatasının olasılık dağılımı işlevi gösterilmektedir:
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin