approx_count_distinct الدالة التجميعية

ينطبق على:التحقق تم وضع علامة نعم على التحقق من Databricks SQL الذي تم وضع علامة عليه نعم Databricks Runtime

إرجاع العدد المقدر للقيم المميزة داخل expr المجموعة.

يستخدم التنفيذ الإصدار الكثيف من خوارزمية HyperLogLog++ (HLL++)، وهي حالة من خوارزمية تقدير العلاقة الأساسية.

تكون النتائج دقيقة ضمن قيمة افتراضية تبلغ 5٪، والتي تستمد من قيمة الحد الأقصى للانحراف المعياري النسبي، على الرغم من أن هذا قابل للتكوين مع المعلمة relativeSD كما هو مذكور أدناه.

بناء الجمله

approx_count_distinct(expr[, relativeSD]) [FILTER ( WHERE cond ) ]

يمكن أيضا استدعاء هذه الدالة كدالة نافذة باستخدام العبارة OVER .

الحجج

  • expr: يمكن أن يكون من أي نوع يتم تعريف التكافؤ له.
  • relativeSD: يحدد الحد الأقصى للانحراف المعياري النسبي المسموح به.
  • cond: تعبير منطقي اختياري يقوم بتصفية الصفوف المستخدمة للتجميع.

ارجاع

بيغينت.

امثله

> SELECT approx_count_distinct(col1) FROM VALUES (1), (1), (2), (2), (3) tab(col1);
 3
> SELECT approx_count_distinct(col1) FILTER(WHERE col2 = 10)
    FROM VALUES (1, 10), (1, 10), (2, 10), (2, 10), (3, 10), (1, 12) AS tab(col1, col2);
 3