count_min_sketch الدالة التجميعية

ينطبق على:وضع علامة Databricks SQL وضع علامة Databricks Runtime

إرجاع مخطط عدد أدنى لكافة القيم في المجموعة في column مع epsilonوconfidence.seed

في Databricks SQL وDatabricks Runtime 13.3 LTS وما فوق تدعم هذه الدالة استدعاء المعلمة المسماة.

بناء الجملة

count_min_sketch ( [ALL | DISTINCT] column, epsilon, confidence, seed ) [FILTER ( WHERE cond ) ]

يمكن أيضا استدعاء هذه الدالة كدالة نافذة باستخدام العبارة OVER .

الوسيطات

  • column: تعبير يتم تقييمه إلى رقم متكامل أو STRINGأو BINARY.
  • epsilonDOUBLE: قيمة حرفية أكبر من 0 تصف الخطأ النسبي.
  • confidenceDOUBLE: قيمة حرفية أكبر من 0 وأقل من 1.
  • seed: قيمة حرفية INTEGER .
  • cond: تعبير منطقي اختياري يقوم بتصفية الصفوف المستخدمة للتجميع.

المرتجعات

BINARY.

مخطط Count-min هو بنية بيانات احتمالية تستخدم لتقدير العلاقة الأساسية باستخدام مساحة دون خطية.

إذا DISTINCT تم تحديد الدالة تعمل فقط على مجموعة فريدة من expr القيم.

الأمثلة

-- Named parameter invocation
> SELECT hex(count_min_sketch(column => col, confidence => 0.5d, epsilon => 0.5d, seed => 1)) FROM VALUES (1), (2), (1) AS tab(col);
0000000100000000000000030000000100000004000000005D8D6AB90000000000000000000000000000000200000000000000010000000000000000

> SELECT hex(count_min_sketch(DISTINCT col, 0.5d, 0.5d, 1)) FROM VALUES (1), (2), (1) AS tab(col);
0000000100000000000000020000000100000004000000005D8D6AB90000000000000000000000000000000100000000000000010000000000000000