count_min_sketch
الدالة التجميعية
ينطبق على: Databricks SQL Databricks Runtime
إرجاع مخطط عدد أدنى لكافة القيم في المجموعة في column
مع epsilon
وconfidence
.seed
في Databricks SQL وDatabricks Runtime 13.3 LTS وما فوق تدعم هذه الدالة استدعاء المعلمة المسماة.
بناء الجملة
count_min_sketch ( [ALL | DISTINCT] column, epsilon, confidence, seed ) [FILTER ( WHERE cond ) ]
يمكن أيضا استدعاء هذه الدالة كدالة نافذة باستخدام العبارة OVER
.
الوسيطات
column
: تعبير يتم تقييمه إلى رقم متكامل أوSTRING
أوBINARY
.epsilon
DOUBLE
: قيمة حرفية أكبر من 0 تصف الخطأ النسبي.confidence
DOUBLE
: قيمة حرفية أكبر من 0 وأقل من 1.seed
: قيمة حرفيةINTEGER
.cond
: تعبير منطقي اختياري يقوم بتصفية الصفوف المستخدمة للتجميع.
المرتجعات
BINARY
.
مخطط Count-min هو بنية بيانات احتمالية تستخدم لتقدير العلاقة الأساسية باستخدام مساحة دون خطية.
إذا DISTINCT
تم تحديد الدالة تعمل فقط على مجموعة فريدة من expr
القيم.
الأمثلة
-- Named parameter invocation
> SELECT hex(count_min_sketch(column => col, confidence => 0.5d, epsilon => 0.5d, seed => 1)) FROM VALUES (1), (2), (1) AS tab(col);
0000000100000000000000030000000100000004000000005D8D6AB90000000000000000000000000000000200000000000000010000000000000000
> SELECT hex(count_min_sketch(DISTINCT col, 0.5d, 0.5d, 1)) FROM VALUES (1), (2), (1) AS tab(col);
0000000100000000000000020000000100000004000000005D8D6AB90000000000000000000000000000000100000000000000010000000000000000