dcountif() (toplama işlevi)

Koşulun olarak değerlendirildiği satırlar için ifadenin ayrı değerlerinin sayısını tahmin edertrue.

Null değerler yoksayılır ve hesaplamayı dikkate almaz.

Not

Bu işlev summarize işleciyle birlikte kullanılır.

Syntax

dcountif(ifade, koşul, [,doğruluk])

Söz dizimi kuralları hakkında daha fazla bilgi edinin.

Parametreler

Ad Tür Gerekli Açıklama
ifade string ✔️ Toplama hesaplaması için kullanılan ifade.
Yüklemi string ✔️ Satırları filtrelemek için kullanılan ifade.
Doğru -luk int Hız ve doğruluk arasındaki kontrol. Belirtilmemişse, varsayılan değer olur 1. Desteklenen değerler için bkz. Tahmin doğruluğu .

Döndürülenler

Koşulun olarak değerlendirildiği satırlar için ifadenin ayrı değerlerinin sayısını tahmin eder.true

İpucu

dcountif() , satırların tümünün veya hiçbirinin ifadeyi Predicate geçirmediği durumlarda hata döndürebilir.

Örnek

Bu örnekte, her durumda kaç tür önemli fırtına olayının gerçekleştiği gösterilmektedir.

StormEvents
| summarize DifferentFatalEvents=dcountif(EventType,(DeathsDirect + DeathsIndirect)>0) by State
| where DifferentFatalEvents > 0
| order by DifferentFatalEvents 

Gösterilen sonuçlar tablosu yalnızca ilk 10 satırı içerir.

Durum DifferentFatalEvents
CALİFORNİA 12
TEXAS 12
OKLAHOMA 10
ILLİNOİS 9
KANSAS 9
NEW YORK 9
NEW JERSEY 7
WASHİNGTON 7
MICHIGAN 7
MİSSOURİ 7
... ...

Tahmin doğruluğu

Bu işlev, küme kardinalitesinin stokastik tahminini yapan HyperLogLog (HLL) algoritmasının bir değişkenini kullanır. Algoritma, bellek boyutu başına doğruluk ve yürütme süresini dengelemek için kullanılabilecek bir "düğme" sağlar:

Doğruluk Hata (%) Giriş sayısı
0 1.6 212
1 0,8 214
2 0,4 216
3 0.28 217
4 0,2 218

Not

"Giriş sayısı" sütunu, HLL uygulamasındaki 1 baytlık sayaçların sayısıdır.

Küme kardinalitesi yeterince küçükse algoritma, mükemmel bir sayı (sıfır hata) yapmaya yönelik bazı hükümler içerir:

  • Doğruluk düzeyi olduğunda 11000 değer döndürülür
  • Doğruluk düzeyi olduğunda 28000 değer döndürülür

Hata sınırı olasılıktır, teorik bir sınır değildir. Değer, hata dağılımının standart sapmasıdır (sigma) ve tahminlerin %99,7'sinde 3 x sigma'nın altında göreli bir hata olur.

Aşağıdaki görüntüde, desteklenen tüm doğruluk ayarları için yüzde cinsinden göreli tahmin hatasının olasılık dağılımı işlevi gösterilmektedir:

Hll hata dağılımını gösteren grafik.