count_min_sketch statistische functie

Retourneert een count-min-sketch van alle waarden in de groep in expr met de , en epsilon confidence seed .

Syntaxis

count_min_sketch ( [ALL | DISTINCT] expr, epsilon, confidence, seed ) [FILTER ( WHERE cond ) ]

Argumenten

  • expr: Een expressie die evalueert naar een integraal numerieke waarde, STRING of BINARY.
  • epsilon: een double literal groter dan 0 die de relatieve fout beschrijft.
  • confidence: Een DOUBLE-letterlijke waarde die groter is dan 0 en kleiner is dan 1.
  • seed: Een letterlijke geheel getal.
  • cond: Een optionele Booleaanse expressie waarmee de rijen worden gefilterd die worden gebruikt voor aggregatie.

Retouren

EEN BINAIR BESTAND.

Count-min-sketch is een probabilistische gegevensstructuur die wordt gebruikt voor kardinaliteitsschatting met behulp van sub-lineaire ruimte.

Als DISTINCT is opgegeven, werkt de functie alleen op een unieke set expr waarden.

Voorbeelden

> SELECT hex(count_min_sketch(col, 0.5d, 0.5d, 1)) FROM VALUES (1), (2), (1) AS tab(col);
0000000100000000000000030000000100000004000000005D8D6AB90000000000000000000000000000000200000000000000010000000000000000
> SELECT hex(count_min_sketch(DISTINCT col, 0.5d, 0.5d, 1)) FROM VALUES (1), (2), (1) AS tab(col);
0000000100000000000000020000000100000004000000005D8D6AB90000000000000000000000000000000100000000000000010000000000000000