dcount() (toplama işlevi)

Özet grubundaki bir skaler ifade tarafından alınan ayrı değerlerin sayısını tahmin eder.

Null değerler yoksayılır ve hesaplamayı dikkate almaz.

Not

dcount() Toplama işlevi, büyük kümelerin kardinalitesini tahmin etmek için öncelikli olarak yararlıdır. Performansın doğruluğunu dengeler ve yürütmeler arasında değişen bir sonuç döndürebilir. Girişlerin sırasının çıkışı üzerinde etkisi olabilir.

Not

Bu işlev summarize işleciyle birlikte kullanılır.

Syntax

dcount(expr[,doğruluk])

Söz dizimi kuralları hakkında daha fazla bilgi edinin.

Parametreler

Ad Tür Gerekli Açıklama
ifade string ✔️ Ayrı değerleri sayılacak olan giriş.
Doğru -luk int İstenen tahmin doğruluğunu tanımlayan değer. 1 varsayılan değerdir. Desteklenen değerler için bkz. Tahmin doğruluğu .

Döndürülenler

Gruptaki ifadenin ayrı değerlerinin sayısına ilişkin bir tahmin döndürür.

Örnek

Bu örnekte her durumda kaç tür fırtına olayının gerçekleştiği gösterilmektedir.

StormEvents
| summarize DifferentEvents=dcount(EventType) by State
| order by DifferentEvents

Gösterilen sonuçlar tablosu yalnızca ilk 10 satırı içerir.

Durum DifferentEvents
TEXAS 27
CALİFORNİA 26
PENNSYLVANIA 25
GÜRCİSTAN 24
ILLİNOİS 23
MARYLAND 23
KUZEY CAROLINA 23
MICHIGAN 22
FLORİDA 22
OREGON 21
KANSAS 21
... ...

Tahmin doğruluğu

Bu işlev, küme kardinalitesinin stokastik tahminini yapan HyperLogLog (HLL) algoritmasının bir değişkenini kullanır. Algoritma, bellek boyutu başına doğruluk ve yürütme süresini dengelemek için kullanılabilecek bir "düğme" sağlar:

Doğruluk Hata (%) Giriş sayısı
0 1.6 212
1 0,8 214
2 0,4 216
3 0.28 217
4 0,2 218

Not

"Giriş sayısı" sütunu, HLL uygulamasındaki 1 baytlık sayaçların sayısıdır.

Küme kardinalitesi yeterince küçükse algoritma, mükemmel bir sayı (sıfır hata) yapmaya yönelik bazı hükümler içerir:

  • Doğruluk düzeyi olduğunda 11000 değer döndürülür
  • Doğruluk düzeyi olduğunda 28000 değer döndürülür

Hata sınırı olasılıktır, teorik bir sınır değildir. Değer, hata dağılımının standart sapmasıdır (sigma) ve tahminlerin %99,7'sinde 3 x sigma'nın altında göreli bir hata olur.

Aşağıdaki görüntüde, desteklenen tüm doğruluk ayarları için yüzde cinsinden göreli tahmin hatasının olasılık dağılımı işlevi gösterilmektedir:

Hll hata dağılımını gösteren grafik.