Inbyggda funktioner

Mängdfunktioner

Funktion Beskrivning
alla (uttr) Returnerar true om minst ett värde på expr är sant.
approx_count_distinct (uttr [, Släktingared]) Returnerar den uppskattade kardinalitet med HyperLogLog + +. relativeSD definierar maximalt uppskattnings fel som tillåts.
approx_percentile (kolumn, procent [, noggrannhet]) Returnerar det ungefärliga percentilvärdet för en numerisk kolumn col vid den aktuella procent andelen. Värdet för procent måste vara mellan 0,0 och 1,0. accuracyParametern (standard: 10000) är en positiv numerisk literal som styr den ungefärliga precisionen med kostnaden för minnet. Högre värde av accuracy ger bättre precision, 1.0/accuracy är det relativa felet i uppskattningen. När percentage är en matris måste varje värde i procent matrisen vara mellan 0,0 och 1,0. I det här fallet returnerar den ungefärliga percentilen för kolumnen med col den aktuella procent matrisen.
AVG (uttr) Returnerar medelvärdet som beräknas utifrån värdena för en grupp.
bit_or (uttr) Returnerar den bitvisa eller alla värden som inte är null, eller null om inget.
bit_xor (uttr) Returnerar den bitvisa XOR av alla värden som inte är null, eller null om ingen används.
bool_and (uttr) Returnerar true om alla värden expr är true.
bool_or (uttr) Returnerar true om minst ett värde på expr är sant.
collect_list (uttr) Samlar in och returnerar en lista med icke-unika element.
collect_set (uttr) Samlar in och returnerar en uppsättning unika element.
Corr (Uttr1, Expr2) Returnerar Pearsons koefficient för korrelation mellan en uppsättning siffer par.
antal (*) Returnerar det totala antalet hämtade rader, inklusive rader som innehåller null.
Count (uttr [, uttr...]) Returnerar antalet rader för vilka de angivna uttrycken är icke-null.
Count (DISTINCT-uttryck [, uttr...]) Returnerar antalet rader för vilka de angivna uttrycken är unika och icke-null.
count_if (uttr) Returnerar antalet TRUE värden för uttrycket.
count_min_sketch (kolumn, EPS, säkerhet, utsäde) Returnerar ett antal – min skiss av en kolumn med angivet ESP, säkerhet och dirigering. Resultatet är en matris med byte som kan avserialiseras till en CountMinSketch före användning. Count-min skiss är en Probabilistic-datastruktur som används för att beräkna kardinalitet med hjälp av dellinjärt utrymme.
covar_pop (Uttr1, Expr2) Returnerar populationens kovarians för en uppsättning nummer par.
covar_samp (Uttr1, Expr2) Returnerar exempel kovariansen för en uppsättning nummer par.
var (uttr) Returnerar true om alla värden expr är true.
First (uttr [, isIgnoreNull]) Returnerar det första värdet för expr för en grupp med rader. Om isIgnoreNull är sant returnerar endast värden som inte är null.
first_value (uttr [, isIgnoreNull]) Returnerar det första värdet för expr för en grupp med rader. Om isIgnoreNull är sant returnerar endast värden som inte är null.
en/ett (uttr) Returnerar värdet för minimivärde som beräknats från värden för en grupp.
sista (uttr [, isIgnoreNull]) Returnerar det sista värdet för expr för en grupp med rader. Om isIgnoreNull är sant returnerar endast värden som inte är null.
last_value (uttr [, isIgnoreNull]) Returnerar det sista värdet för expr för en grupp med rader. Om isIgnoreNull är sant returnerar endast värden som inte är null.
Max (uttr) Returnerar det maximala värdet för expr .
max_by (x, y) Returnerar värdet för x associerat med det maximala värdet för y .
medelvärde (uttr) Returnerar medelvärdet som beräknas utifrån värdena för en grupp.
min (uttr) Returnerar det minsta värdet för expr .
min_by (x, y) Returnerar värdet för x associerat med det lägsta värdet för y .
percentil (kolumn, procent [, frekvens]) Returnerar det exakta percentilvärdet för en numerisk kolumn col vid den aktuella procent andelen. Värdet för procent måste vara mellan 0,0 och 1,0. Värdet för frekvens ska vara positivt heltal.
percentil (kol, array (percentage1 [, percentage2]...) [, frekvens]) Returnerar den exakta percentilvärdet för en numerisk kolumns värde mat ris col vid de procent andelen. Varje värde i procent mat ris måste vara mellan 0,0 och 1,0. Värdet för frekvens ska vara positivt heltal.
percentile_approx (kolumn, procent [, noggrannhet]) Returnerar det ungefärliga percentilvärdet för en numerisk kolumn col vid den aktuella procent andelen. Värdet för procent måste vara mellan 0,0 och 1,0. accuracyParametern (standard: 10000) är en positiv numerisk literal som styr den ungefärliga precisionen med kostnaden för minnet. Högre värde av accuracy ger bättre precision, 1.0/accuracy är det relativa felet i uppskattningen. När percentage är en matris måste varje värde i procent matrisen vara mellan 0,0 och 1,0. I det här fallet returnerar den ungefärliga percentilen för kolumnen med col den aktuella procent matrisen.
snedhet (uttr) Returnerar skevningen-värdet beräknat från värden för en grupp.
vissa (uttr) Returnerar true om minst ett värde på expr är sant.
STD (uttr) Returnerar exempel standard avvikelsen beräknad från värden i en grupp.
StdDev (uttr) Returnerar exempel standard avvikelsen beräknad från värden i en grupp.
stddev_pop (uttr) Returnerar populationens standard avvikelse beräknad från värden i en grupp.
stddev_samp (uttr) Returnerar exempel standard avvikelsen beräknad från värden i en grupp.
sum (uttr) Returnerar summan beräknad från värden för en grupp.
var_pop (uttr) Returnerar populationens varians beräknad från värden i en grupp.
var_samp (uttr) Returnerar exempel avvikelsen beräknad utifrån värden i en grupp.
varians (uttr) Returnerar exempel avvikelsen beräknad utifrån värden i en grupp.

Exempel

-- any
SELECT any(col) FROM VALUES (true), (false), (false) AS tab(col);
+--------+
|any(col)|
+--------+
|  true|
+--------+

SELECT any(col) FROM VALUES (NULL), (true), (false) AS tab(col);
+--------+
|any(col)|
+--------+
|  true|
+--------+

SELECT any(col) FROM VALUES (false), (false), (NULL) AS tab(col);
+--------+
|any(col)|
+--------+
|  false|
+--------+

-- approx_count_distinct
SELECT approx_count_distinct(col1) FROM VALUES (1), (1), (2), (2), (3) tab(col1);
+---------------------------+
|approx_count_distinct(col1)|
+---------------------------+
|             3|
+---------------------------+

-- approx_percentile
SELECT approx_percentile(10.0, array(0.5, 0.4, 0.1), 100);
+--------------------------------------------------+
|approx_percentile(10.0, array(0.5, 0.4, 0.1), 100)|
+--------------------------------------------------+
|                [10.0, 10.0, 10.0]|
+--------------------------------------------------+

SELECT approx_percentile(10.0, 0.5, 100);
+-------------------------------------------------+
|approx_percentile(10.0, CAST(0.5 AS DOUBLE), 100)|
+-------------------------------------------------+
|                       10.0|
+-------------------------------------------------+

-- avg
SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
+--------+
|avg(col)|
+--------+
|   2.0|
+--------+

SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
+--------+
|avg(col)|
+--------+
|   1.5|
+--------+

-- bit_or
SELECT bit_or(col) FROM VALUES (3), (5) AS tab(col);
+-----------+
|bit_or(col)|
+-----------+
|     7|
+-----------+

-- bit_xor
SELECT bit_xor(col) FROM VALUES (3), (5) AS tab(col);
+------------+
|bit_xor(col)|
+------------+
|      6|
+------------+

-- bool_and
SELECT bool_and(col) FROM VALUES (true), (true), (true) AS tab(col);
+-------------+
|bool_and(col)|
+-------------+
|     true|
+-------------+

SELECT bool_and(col) FROM VALUES (NULL), (true), (true) AS tab(col);
+-------------+
|bool_and(col)|
+-------------+
|     true|
+-------------+

SELECT bool_and(col) FROM VALUES (true), (false), (true) AS tab(col);
+-------------+
|bool_and(col)|
+-------------+
|    false|
+-------------+

-- bool_or
SELECT bool_or(col) FROM VALUES (true), (false), (false) AS tab(col);
+------------+
|bool_or(col)|
+------------+
|    true|
+------------+

SELECT bool_or(col) FROM VALUES (NULL), (true), (false) AS tab(col);
+------------+
|bool_or(col)|
+------------+
|    true|
+------------+

SELECT bool_or(col) FROM VALUES (false), (false), (NULL) AS tab(col);
+------------+
|bool_or(col)|
+------------+
|    false|
+------------+

-- collect_list
SELECT collect_list(col) FROM VALUES (1), (2), (1) AS tab(col);
+-----------------+
|collect_list(col)|
+-----------------+
|    [1, 2, 1]|
+-----------------+

-- collect_set
SELECT collect_set(col) FROM VALUES (1), (2), (1) AS tab(col);
+----------------+
|collect_set(col)|
+----------------+
|     [1, 2]|
+----------------+

-- corr
SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (6, 4) as tab(c1, c2);
+--------------------------------------------+
|corr(CAST(c1 AS DOUBLE), CAST(c2 AS DOUBLE))|
+--------------------------------------------+
|             0.8660254037844387|
+--------------------------------------------+

-- count
SELECT count(*) FROM VALUES (NULL), (5), (5), (20) AS tab(col);
+--------+
|count(1)|
+--------+
|    4|
+--------+

SELECT count(col) FROM VALUES (NULL), (5), (5), (20) AS tab(col);
+----------+
|count(col)|
+----------+
|     3|
+----------+

SELECT count(DISTINCT col) FROM VALUES (NULL), (5), (5), (10) AS tab(col);
+-------------------+
|count(DISTINCT col)|
+-------------------+
|         2|
+-------------------+

-- count_if
SELECT count_if(col % 2 = 0) FROM VALUES (NULL), (0), (1), (2), (3) AS tab(col);
+-------------------------+
|count_if(((col % 2) = 0))|
+-------------------------+
|            2|
+-------------------------+

SELECT count_if(col IS NULL) FROM VALUES (NULL), (0), (1), (2), (3) AS tab(col);
+-----------------------+
|count_if((col IS NULL))|
+-----------------------+
|           1|
+-----------------------+

-- covar_pop
SELECT covar_pop(c1, c2) FROM VALUES (1,1), (2,2), (3,3) AS tab(c1, c2);
+-------------------------------------------------+
|covar_pop(CAST(c1 AS DOUBLE), CAST(c2 AS DOUBLE))|
+-------------------------------------------------+
|                0.6666666666666666|
+-------------------------------------------------+

-- covar_samp
SELECT covar_samp(c1, c2) FROM VALUES (1,1), (2,2), (3,3) AS tab(c1, c2);
+--------------------------------------------------+
|covar_samp(CAST(c1 AS DOUBLE), CAST(c2 AS DOUBLE))|
+--------------------------------------------------+
|                        1.0|
+--------------------------------------------------+

-- every
SELECT every(col) FROM VALUES (true), (true), (true) AS tab(col);
+----------+
|every(col)|
+----------+
|   true|
+----------+

SELECT every(col) FROM VALUES (NULL), (true), (true) AS tab(col);
+----------+
|every(col)|
+----------+
|   true|
+----------+

SELECT every(col) FROM VALUES (true), (false), (true) AS tab(col);
+----------+
|every(col)|
+----------+
|   false|
+----------+

-- first
SELECT first(col) FROM VALUES (10), (5), (20) AS tab(col);
+-----------------+
|first(col, false)|
+-----------------+
|        10|
+-----------------+

SELECT first(col) FROM VALUES (NULL), (5), (20) AS tab(col);
+-----------------+
|first(col, false)|
+-----------------+
|       null|
+-----------------+

SELECT first(col, true) FROM VALUES (NULL), (5), (20) AS tab(col);
+----------------+
|first(col, true)|
+----------------+
|        5|
+----------------+

-- first_value
SELECT first_value(col) FROM VALUES (10), (5), (20) AS tab(col);
+-----------------------+
|first_value(col, false)|
+-----------------------+
|           10|
+-----------------------+

SELECT first_value(col) FROM VALUES (NULL), (5), (20) AS tab(col);
+-----------------------+
|first_value(col, false)|
+-----------------------+
|          null|
+-----------------------+

SELECT first_value(col, true) FROM VALUES (NULL), (5), (20) AS tab(col);
+----------------------+
|first_value(col, true)|
+----------------------+
|           5|
+----------------------+

-- kurtosis
SELECT kurtosis(col) FROM VALUES (-10), (-20), (100), (1000) AS tab(col);
+-----------------------------+
|kurtosis(CAST(col AS DOUBLE))|
+-----------------------------+
|     -0.7014368047529618|
+-----------------------------+

SELECT kurtosis(col) FROM VALUES (1), (10), (100), (10), (1) as tab(col);
+-----------------------------+
|kurtosis(CAST(col AS DOUBLE))|
+-----------------------------+
|     0.19432323191698986|
+-----------------------------+

-- last
SELECT last(col) FROM VALUES (10), (5), (20) AS tab(col);
+----------------+
|last(col, false)|
+----------------+
|       20|
+----------------+

SELECT last(col) FROM VALUES (10), (5), (NULL) AS tab(col);
+----------------+
|last(col, false)|
+----------------+
|      null|
+----------------+

SELECT last(col, true) FROM VALUES (10), (5), (NULL) AS tab(col);
+---------------+
|last(col, true)|
+---------------+
|       5|
+---------------+

-- last_value
SELECT last_value(col) FROM VALUES (10), (5), (20) AS tab(col);
+----------------------+
|last_value(col, false)|
+----------------------+
|          20|
+----------------------+

SELECT last_value(col) FROM VALUES (10), (5), (NULL) AS tab(col);
+----------------------+
|last_value(col, false)|
+----------------------+
|         null|
+----------------------+

SELECT last_value(col, true) FROM VALUES (10), (5), (NULL) AS tab(col);
+---------------------+
|last_value(col, true)|
+---------------------+
|          5|
+---------------------+

-- max
SELECT max(col) FROM VALUES (10), (50), (20) AS tab(col);
+--------+
|max(col)|
+--------+
|   50|
+--------+

-- max_by
SELECT max_by(x, y) FROM VALUES (('a', 10)), (('b', 50)), (('c', 20)) AS tab(x, y);
+------------+
|max_by(x, y)|
+------------+
|      b|
+------------+

-- mean
SELECT mean(col) FROM VALUES (1), (2), (3) AS tab(col);
+---------+
|mean(col)|
+---------+
|   2.0|
+---------+

SELECT mean(col) FROM VALUES (1), (2), (NULL) AS tab(col);
+---------+
|mean(col)|
+---------+
|   1.5|
+---------+

-- min
SELECT min(col) FROM VALUES (10), (-1), (20) AS tab(col);
+--------+
|min(col)|
+--------+
|   -1|
+--------+

-- min_by
SELECT min_by(x, y) FROM VALUES (('a', 10)), (('b', 50)), (('c', 20)) AS tab(x, y);
+------------+
|min_by(x, y)|
+------------+
|      a|
+------------+

-- percentile
SELECT percentile(col, 0.3) FROM VALUES (0), (10) AS tab(col);
+---------------------------------------+
|percentile(col, CAST(0.3 AS DOUBLE), 1)|
+---------------------------------------+
|                  3.0|
+---------------------------------------+

SELECT percentile(col, array(0.25, 0.75)) FROM VALUES (0), (10) AS tab(col);
+-------------------------------------+
|percentile(col, array(0.25, 0.75), 1)|
+-------------------------------------+
|              [2.5, 7.5]|
+-------------------------------------+

-- percentile_approx
SELECT percentile_approx(10.0, array(0.5, 0.4, 0.1), 100);
+--------------------------------------------------+
|percentile_approx(10.0, array(0.5, 0.4, 0.1), 100)|
+--------------------------------------------------+
|                [10.0, 10.0, 10.0]|
+--------------------------------------------------+

SELECT percentile_approx(10.0, 0.5, 100);
+-------------------------------------------------+
|percentile_approx(10.0, CAST(0.5 AS DOUBLE), 100)|
+-------------------------------------------------+
|                       10.0|
+-------------------------------------------------+

-- skewness
SELECT skewness(col) FROM VALUES (-10), (-20), (100), (1000) AS tab(col);
+-----------------------------+
|skewness(CAST(col AS DOUBLE))|
+-----------------------------+
|      1.1135657469022013|
+-----------------------------+

SELECT skewness(col) FROM VALUES (-1000), (-100), (10), (20) AS tab(col);
+-----------------------------+
|skewness(CAST(col AS DOUBLE))|
+-----------------------------+
|     -1.1135657469022011|
+-----------------------------+

-- some
SELECT some(col) FROM VALUES (true), (false), (false) AS tab(col);
+---------+
|some(col)|
+---------+
|   true|
+---------+

SELECT some(col) FROM VALUES (NULL), (true), (false) AS tab(col);
+---------+
|some(col)|
+---------+
|   true|
+---------+

SELECT some(col) FROM VALUES (false), (false), (NULL) AS tab(col);
+---------+
|some(col)|
+---------+
|  false|
+---------+

-- std
SELECT std(col) FROM VALUES (1), (2), (3) AS tab(col);
+------------------------+
|std(CAST(col AS DOUBLE))|
+------------------------+
|           1.0|
+------------------------+

-- stddev
SELECT stddev(col) FROM VALUES (1), (2), (3) AS tab(col);
+---------------------------+
|stddev(CAST(col AS DOUBLE))|
+---------------------------+
|            1.0|
+---------------------------+

-- stddev_pop
SELECT stddev_pop(col) FROM VALUES (1), (2), (3) AS tab(col);
+-------------------------------+
|stddev_pop(CAST(col AS DOUBLE))|
+-------------------------------+
|       0.816496580927726|
+-------------------------------+

-- stddev_samp
SELECT stddev_samp(col) FROM VALUES (1), (2), (3) AS tab(col);
+--------------------------------+
|stddev_samp(CAST(col AS DOUBLE))|
+--------------------------------+
|               1.0|
+--------------------------------+

-- sum
SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
+--------+
|sum(col)|
+--------+
|   30|
+--------+

SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
+--------+
|sum(col)|
+--------+
|   25|
+--------+

SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
+--------+
|sum(col)|
+--------+
|  null|
+--------+

-- var_pop
SELECT var_pop(col) FROM VALUES (1), (2), (3) AS tab(col);
+----------------------------+
|var_pop(CAST(col AS DOUBLE))|
+----------------------------+
|     0.6666666666666666|
+----------------------------+

-- var_samp
SELECT var_samp(col) FROM VALUES (1), (2), (3) AS tab(col);
+-----------------------------+
|var_samp(CAST(col AS DOUBLE))|
+-----------------------------+
|             1.0|
+-----------------------------+

-- variance
SELECT variance(col) FROM VALUES (1), (2), (3) AS tab(col);
+-----------------------------+
|variance(CAST(col AS DOUBLE))|
+-----------------------------+
|             1.0|
+-----------------------------+

Fönsterfunktioner

Funktion Beskrivning
cume_dist () Beräknar positionen för ett värde relativt till alla värden i partitionen.
dense_rank () Beräknar rangordningen för ett värde i en grupp med värden. Resultatet är ett plus det tidigare tilldelade rang svärdet. Till skillnad från funktionen rang, kan dense_rank inte skapa luckor i rangordnings ordningen.
fördröjning (inmatat värde [, offset [, default]]) Returnerar värdet för inputoffset raden före den aktuella raden i fönstret. Standardvärdet offset är 1 och standardvärdet default är null. Om värdet för inputoffset raden är null returneras null. Om det inte finns någon sådan förskjutnings rad (t. ex. när förskjutningen är 1, har inte den första raden i fönstret någon föregående rad), default returneras.
lead (inmatat värde [, offset [, standard]]) Returnerar värdet för inputoffset raden efter den aktuella raden i fönstret. Standardvärdet offset är 1 och standardvärdet default är null. Om värdet för inputoffset raden är null returneras null. Om det inte finns någon sådan förskjutnings rad (t. ex. när förskjutningen är 1, har den sista raden i fönstret inga efterföljande rader), default returneras.
ntile (n) Delar upp raderna för varje partition i n buckets mellan 1 och högst 1 n .
percent_rank () Beräknar procent rangordningen för ett värde i en grupp med värden.
rang () Beräknar rangordningen för ett värde i en grupp med värden. Resultatet är ett plus antalet rader före eller lika med den aktuella raden i ordningen för partitionen. Värdena kommer att skapa luckor i sekvensen.
row_number() Tilldelar ett unikt, sekventiellt nummer till varje rad, med början från en, enligt rad ordningen i Window-partitionen.

Matrisfunktioner

Funktion Beskrivning
array_contains (matris, värde) Returnerar true om matrisen innehåller värdet.
array_distinct (matris) Tar bort dubblettvärden från matrisen.
array_except (matris1, matris2) Returnerar en matris med element i matris1, men inte i matris2, utan dubbletter.
array_intersect (matris1, matris2) Returnerar en matris med elementen i skärnings punkten för matris1 och matris2, utan dubbletter.
array_join (matris, avgränsare [, nullReplacement]) Sammanfogar elementen i den matrisen med hjälp av avgränsaren och en valfri sträng för att ersätta null-värden. Om inget värde anges för nullReplacement filtreras alla null-värden.
array_max (matris) Returnerar det maximala värdet i matrisen. NULL-element hoppas över.
array_min (matris) Returnerar det minsta värdet i matrisen. NULL-element hoppas över.
array_position (matris, element) Returnerar det (1-baserade) indexet för det första elementet i matrisen som long.
array_remove (matris, element) Tar bort alla element som är lika med element från matrisen.
array_repeat (element, antal) Returnerar den matris som innehåller antal gånger för element.
array_union (matris1, matris2) Returnerar en matris av elementen i en union av matris1 och matris2, utan dubbletter.
arrays_overlap (a1, a2) Returnerar true om a1 innehåller minst ett element som inte är null finns även i a2. Om matriserna inte har något gemensamt element och de både är icke-tomma och antingen innehåller de ett null-element null returneras, annars FALSE.
arrays_zip (a1, a2,...) Returnerar en sammanfogad matris med strukturer där den N:te structen innehåller alla N-värden för inmatade matriser.
concat (col1, col2,..., colN) Returnerar sammanfogningen av col1, col2,..., colN.
förenkling (arrayOfArrays) Transformerar en matris med matriser till en enda matris.
omvänd (matris) Returnerar en omvänd sträng eller en matris med omvänd ordning för element.
sekvens (starta, stoppa, steg) Genererar en matris med element från start till stopp (inklusive), steg för steg. De returnerade elementens typ är samma som typen av argument uttryck. Typer som stöds: byte, Short, Integer, Long, date, timestamp. Start-och stopp uttryck måste matcha samma typ. Om start-och stopp uttryck matchas till typen date eller timestamp måste steg-uttrycket matcha till typen Interval, annars till samma typ som start-och stopp uttryck.
Blanda (matris) Returnerar en slumpmässig permutation av den aktuella matrisen.
sektor (x, start, längd) Delmängd av matris x som börjar från index start (mat ris index börjar med 1, eller börjar från slutet om start är negativ) med den angivna längden.
sort_array (matris [, ascendingOrder]) Sorterar Indataporten i stigande eller fallande ordning enligt mat ris elementens naturliga ordning. Null-element placeras i början av den returnerade matrisen i stigande ordning eller i slutet av den returnerade matrisen i fallande ordning.

Exempel

-- array_contains
SELECT array_contains(array(1, 2, 3), 2);
+---------------------------------+
|array_contains(array(1, 2, 3), 2)|
+---------------------------------+
|               true|
+---------------------------------+

-- array_distinct
SELECT array_distinct(array(1, 2, 3, null, 3));
+----------------------------------------------------+
|array_distinct(array(1, 2, 3, CAST(NULL AS INT), 3))|
+----------------------------------------------------+
|                     [1, 2, 3,]|
+----------------------------------------------------+

-- array_except
SELECT array_except(array(1, 2, 3), array(1, 3, 5));
+--------------------------------------------+
|array_except(array(1, 2, 3), array(1, 3, 5))|
+--------------------------------------------+
|                     [2]|
+--------------------------------------------+

-- array_intersect
SELECT array_intersect(array(1, 2, 3), array(1, 3, 5));
+-----------------------------------------------+
|array_intersect(array(1, 2, 3), array(1, 3, 5))|
+-----------------------------------------------+
|                     [1, 3]|
+-----------------------------------------------+

-- array_join
SELECT array_join(array('hello', 'world'), ' ');
+----------------------------------+
|array_join(array(hello, world), )|
+----------------------------------+
|            hello world|
+----------------------------------+

SELECT array_join(array('hello', null ,'world'), ' ');
+--------------------------------------------------------+
|array_join(array(hello, CAST(NULL AS STRING), world), )|
+--------------------------------------------------------+
|                       hello world|
+--------------------------------------------------------+

SELECT array_join(array('hello', null ,'world'), ' ', ',');
+-----------------------------------------------------------+
|array_join(array(hello, CAST(NULL AS STRING), world), , ,)|
+-----------------------------------------------------------+
|                       hello , world|
+-----------------------------------------------------------+

-- array_max
SELECT array_max(array(1, 20, null, 3));
+---------------------------------------------+
|array_max(array(1, 20, CAST(NULL AS INT), 3))|
+---------------------------------------------+
|                      20|
+---------------------------------------------+

-- array_min
SELECT array_min(array(1, 20, null, 3));
+---------------------------------------------+
|array_min(array(1, 20, CAST(NULL AS INT), 3))|
+---------------------------------------------+
|                      1|
+---------------------------------------------+

-- array_position
SELECT array_position(array(3, 2, 1), 1);
+---------------------------------+
|array_position(array(3, 2, 1), 1)|
+---------------------------------+
|                3|
+---------------------------------+

-- array_remove
SELECT array_remove(array(1, 2, 3, null, 3), 3);
+-----------------------------------------------------+
|array_remove(array(1, 2, 3, CAST(NULL AS INT), 3), 3)|
+-----------------------------------------------------+
|                       [1, 2,]|
+-----------------------------------------------------+

-- array_repeat
SELECT array_repeat('123', 2);
+--------------------+
|array_repeat(123, 2)|
+--------------------+
|     [123, 123]|
+--------------------+

-- array_union
SELECT array_union(array(1, 2, 3), array(1, 3, 5));
+-------------------------------------------+
|array_union(array(1, 2, 3), array(1, 3, 5))|
+-------------------------------------------+
|                [1, 2, 3, 5]|
+-------------------------------------------+

-- arrays_overlap
SELECT arrays_overlap(array(1, 2, 3), array(3, 4, 5));
+----------------------------------------------+
|arrays_overlap(array(1, 2, 3), array(3, 4, 5))|
+----------------------------------------------+
|                     true|
+----------------------------------------------+

-- arrays_zip
SELECT arrays_zip(array(1, 2, 3), array(2, 3, 4));
+------------------------------------------+
|arrays_zip(array(1, 2, 3), array(2, 3, 4))|
+------------------------------------------+
|           [[1, 2], [2, 3], ...|
+------------------------------------------+

SELECT arrays_zip(array(1, 2), array(2, 3), array(3, 4));
+-------------------------------------------------+
|arrays_zip(array(1, 2), array(2, 3), array(3, 4))|
+-------------------------------------------------+
|               [[1, 2, 3], [2, 3...|
+-------------------------------------------------+

-- concat
SELECT concat('Spark', 'SQL');
+------------------+
|concat(Spark, SQL)|
+------------------+
|     SparkSQL|
+------------------+

SELECT concat(array(1, 2, 3), array(4, 5), array(6));
+---------------------------------------------+
|concat(array(1, 2, 3), array(4, 5), array(6))|
+---------------------------------------------+
|              [1, 2, 3, 4, 5, 6]|
+---------------------------------------------+

-- flatten
SELECT flatten(array(array(1, 2), array(3, 4)));
+----------------------------------------+
|flatten(array(array(1, 2), array(3, 4)))|
+----------------------------------------+
|              [1, 2, 3, 4]|
+----------------------------------------+

-- reverse
SELECT reverse('Spark SQL');
+------------------+
|reverse(Spark SQL)|
+------------------+
|     LQS krapS|
+------------------+

SELECT reverse(array(2, 1, 4, 3));
+--------------------------+
|reverse(array(2, 1, 4, 3))|
+--------------------------+
|       [3, 4, 1, 2]|
+--------------------------+

-- sequence
SELECT sequence(1, 5);
+---------------+
| sequence(1, 5)|
+---------------+
|[1, 2, 3, 4, 5]|
+---------------+

SELECT sequence(5, 1);
+---------------+
| sequence(5, 1)|
+---------------+
|[5, 4, 3, 2, 1]|
+---------------+

SELECT sequence(to_date('2018-01-01'), to_date('2018-03-01'), interval 1 month);
+---------------------------------------------------------------------------+
|sequence(to_date('2018-01-01'), to_date('2018-03-01'), INTERVAL '1 months')|
+---------------------------------------------------------------------------+
|                            [2018-01-01, 2018...|
+---------------------------------------------------------------------------+

-- shuffle
SELECT shuffle(array(1, 20, 3, 5));
+---------------------------+
|shuffle(array(1, 20, 3, 5))|
+---------------------------+
|       [5, 20, 3, 1]|
+---------------------------+

SELECT shuffle(array(1, 20, null, 3));
+-------------------------------------------+
|shuffle(array(1, 20, CAST(NULL AS INT), 3))|
+-------------------------------------------+
|                [20, 3,, 1]|
+-------------------------------------------+

-- slice
SELECT slice(array(1, 2, 3, 4), 2, 2);
+------------------------------+
|slice(array(1, 2, 3, 4), 2, 2)|
+------------------------------+
|            [2, 3]|
+------------------------------+

SELECT slice(array(1, 2, 3, 4), -2, 2);
+-------------------------------+
|slice(array(1, 2, 3, 4), -2, 2)|
+-------------------------------+
|             [3, 4]|
+-------------------------------+

-- sort_array
SELECT sort_array(array('b', 'd', null, 'c', 'a'), true);
+---------------------------------------------------------+
|sort_array(array(b, d, CAST(NULL AS STRING), c, a), true)|
+---------------------------------------------------------+
|                      [, a, b, c, d]|
+---------------------------------------------------------+

Kart funktioner

Funktion Beskrivning
map_concat (mappa,...) Returnerar union av alla de aktuella Maps.
map_entries (karta) Returnerar en osorterad matris med alla poster i den aktuella kartan.
map_from_entries (arrayOfEntries) Returnerar en mappning som skapats från den aktuella matrisen med poster.
map_keys (karta) Returnerar en osorterad matris som innehåller kartans nycklar.
map_values (karta) Returnerar en osorterad matris som innehåller mappningens värden.

Exempel

-- map_concat
SELECT map_concat(map(1, 'a', 2, 'b'), map(3, 'c'));
+--------------------------------------+
|map_concat(map(1, a, 2, b), map(3, c))|
+--------------------------------------+
|         [1 -> a, 2 -> b, ...|
+--------------------------------------+

-- map_entries
SELECT map_entries(map(1, 'a', 2, 'b'));
+----------------------------+
|map_entries(map(1, a, 2, b))|
+----------------------------+
|      [[1, a], [2, b]]|
+----------------------------+

-- map_from_entries
SELECT map_from_entries(array(struct(1, 'a'), struct(2, 'b')));
+---------------------------------------------------+
|map_from_entries(array(struct(1, a), struct(2, b)))|
+---------------------------------------------------+
|                  [1 -> a, 2 -> b]|
+---------------------------------------------------+

-- map_keys
SELECT map_keys(map(1, 'a', 2, 'b'));
+-------------------------+
|map_keys(map(1, a, 2, b))|
+-------------------------+
|          [1, 2]|
+-------------------------+

-- map_values
SELECT map_values(map(1, 'a', 2, 'b'));
+---------------------------+
|map_values(map(1, a, 2, b))|
+---------------------------+
|           [a, b]|
+---------------------------+

Datum-och tidsstämpel-funktioner

Information om datum-och tidsstämpel-format finns i datetime-mönster.

Funktion Beskrivning
add_months (start_date, num_months) Returnerar det datum som infaller num_months efter start_date .
current_date () Returnerar aktuellt datum i början av utvärderingen av frågan.
current_timestamp () Returnerar den aktuella tidsstämpeln i början av utvärderingen av frågan.
date_add (start_date, num_days) Returnerar det datum som infaller num_days efter start_date .
date_format (timestamp, FMT) Konverterar timestamp till ett sträng värde i det format som anges i datum formatet fmt .
date_part (fält, källa) Extraherar en del av datumet/tidsstämpeln eller intervall källan.
date_sub (start_date, num_days) Returnerar det datum som infaller num_days före start_date .
date_trunc (FMT, TS) Returnerar tidsstämpel ts trunkerad till den enhet som anges av format modellen fmt .
DateDiff (endDate, StartDate) Returnerar antalet dagar från startDate till endDate .
DAYOFWEEK (datum) Returnerar vecko dagen för datum/tidsstämpel (1 = söndag, 2 = måndag,..., 7 = lördag).
DAYOFYEAR (datum) Returnerar dagen på året för datum/tidsstämpel.
from_unixtime (unix_time, format) Returnerar unix_time i angivet värde format .
from_utc_timestamp (tidsstämpel, tidszon) En tidsstämpel som "2017-07-14 02:40:00.0" tolkar den som en tid i UTC och återger tiden som en tidsstämpel i den aktuella tids zonen. GMT + 1 skulle till exempel ge "2017-07-14 03:40:00.0".
timme (tidsstämpel) Returnerar Tim komponenten för strängen/tidsstämpeln.
last_day (datum) Returnerar den sista dagen i månaden som datumet tillhör.
make_date (år, månad, dag) Skapa datum från fälten år, månad och dag
make_timestamp (år, månad, dag, timme, min, SEK [, tidszon]) Skapa tidsstämpelfält från fälten år, månad, dag, timme, min, SEK och tidszon.
minut (timestamp) Returnerar minut komponenten för strängen/tidsstämpeln.
månad (datum) Returnerar månads komponenten för datum/tidsstämpel.
months_between (timestamp1, timestamp2 [, roundOff]) Om timestamp1 är senare än timestamp2 är resultatet positivt. Om timestamp1 och timestamp2 är samma dag i månaden, eller båda är den sista dagen i månaden, så ignoreras tiden på dagen. Annars beräknas skillnaden baserat på 31 dagar per månad och avrundas till 8 siffror om inte roundOff = false.
next_day (start_date, day_of_week) Returnerar det första datumet som är senare än start_date och med namnet som anges.
now() Returnerar den aktuella tidsstämpeln i början av utvärderingen av frågan.
kvartal (datum) Returnerar kvartalet på året för datum, inom intervallet 1 till 4.
andra (tidsstämpel) Returnerar den andra komponenten i strängen/tidsstämpeln.
to_date (date_str [, FMT]) Tolkar date_str uttrycket med fmt uttrycket till ett datum. Returnerar null med ogiltiga indatatyper. Som standard följer data typs regler till ett datum om fmt utelämnas
to_timestamp (timestamp_str [, FMT]) Parsar timestamp_str uttrycket med fmt uttrycket till en tidsstämpel. Returnerar null med ogiltiga indatatyper. Som standard följer indata typs regler till en tidsstämpel om den fmt utelämnas.
to_unix_timestamp (timeExp [, format]) Returnerar UNIX-tidsstämpeln för den aktuella tiden.
to_utc_timestamp (tidsstämpel, tidszon) Med en tidsstämpel som "2017-07-14 02:40:00.0", tolkar den som en tid i den givna tids zonen och återger tiden som en tidsstämpel i UTC. GMT + 1 skulle till exempel ge "2017-07-14 01:40:00.0"
trunc(datefmt) Returnerar date med tids delen av dagen trunkerats till den enhet som anges av format modellen fmt .
unix_timestamp ([timeExp [format]]) Returnerar UNIX-tidsstämpeln för den aktuella eller angivna tiden.
veckodag (datum) Returnerar vecko dagen för datum/tidsstämpel (0 = måndag, 1 = tisdag,..., 6 = söndag).
weekofyear (datum) Returnerar veckan på året för det aktuella datumet. En vecka anses börja på måndag och vecka 1 är den första veckan med >3 dagar.
år (datum) Returnerar års komponenten för datum/tidsstämpel.

Exempel

-- add_months
SELECT add_months('2016-08-31', 1);
+---------------------------------------+
|add_months(CAST(2016-08-31 AS DATE), 1)|
+---------------------------------------+
|               2016-09-30|
+---------------------------------------+

-- current_date
SELECT current_date();
+--------------+
|current_date()|
+--------------+
|  2020-06-06|
+--------------+

SELECT current_date;
+--------------+
|current_date()|
+--------------+
|  2020-06-06|
+--------------+

-- current_timestamp
SELECT current_timestamp();
+--------------------+
| current_timestamp()|
+--------------------+
|2020-06-06 14:00:...|
+--------------------+

SELECT current_timestamp;
+--------------------+
| current_timestamp()|
+--------------------+
|2020-06-06 14:00:...|
+--------------------+

-- date_add
SELECT date_add('2016-07-30', 1);
+-------------------------------------+
|date_add(CAST(2016-07-30 AS DATE), 1)|
+-------------------------------------+
|              2016-07-31|
+-------------------------------------+

-- date_format
SELECT date_format('2016-04-08', 'y');
+---------------------------------------------+
|date_format(CAST(2016-04-08 AS TIMESTAMP), y)|
+---------------------------------------------+
|                     2016|
+---------------------------------------------+

-- date_part
SELECT date_part('YEAR', TIMESTAMP '2019-08-12 01:00:00.123456');
+---------------------------------------------------------+
|date_part('YEAR', TIMESTAMP '2019-08-12 01:00:00.123456')|
+---------------------------------------------------------+
|                           2019|
+---------------------------------------------------------+

SELECT date_part('week', timestamp'2019-08-12 01:00:00.123456');
+---------------------------------------------------------+
|date_part('week', TIMESTAMP '2019-08-12 01:00:00.123456')|
+---------------------------------------------------------+
|                            33|
+---------------------------------------------------------+

SELECT date_part('doy', DATE'2019-08-12');
+-----------------------------------+
|date_part('doy', DATE '2019-08-12')|
+-----------------------------------+
|                224|
+-----------------------------------+

SELECT date_part('SECONDS', timestamp'2019-10-01 00:00:01.000001');
+------------------------------------------------------------+
|date_part('SECONDS', TIMESTAMP '2019-10-01 00:00:01.000001')|
+------------------------------------------------------------+
|                          1.000001|
+------------------------------------------------------------+

SELECT date_part('days', interval 1 year 10 months 5 days);
+------------------------------------------------------+
|date_part('days', INTERVAL '1 years 10 months 5 days')|
+------------------------------------------------------+
|                           5|
+------------------------------------------------------+

SELECT date_part('seconds', interval 5 hours 30 seconds 1 milliseconds 1 microseconds);
+----------------------------------------------------------+
|date_part('seconds', INTERVAL '5 hours 30.001001 seconds')|
+----------------------------------------------------------+
|                         30.001001|
+----------------------------------------------------------+

-- date_sub
SELECT date_sub('2016-07-30', 1);
+-------------------------------------+
|date_sub(CAST(2016-07-30 AS DATE), 1)|
+-------------------------------------+
|              2016-07-29|
+-------------------------------------+

-- date_trunc
SELECT date_trunc('YEAR', '2015-03-05T09:32:05.359');
+------------------------------------------------------------+
|date_trunc(YEAR, CAST(2015-03-05T09:32:05.359 AS TIMESTAMP))|
+------------------------------------------------------------+
|                     2015-01-01 00:00:00|
+------------------------------------------------------------+

SELECT date_trunc('MM', '2015-03-05T09:32:05.359');
+----------------------------------------------------------+
|date_trunc(MM, CAST(2015-03-05T09:32:05.359 AS TIMESTAMP))|
+----------------------------------------------------------+
|                    2015-03-01 00:00:00|
+----------------------------------------------------------+

SELECT date_trunc('DD', '2015-03-05T09:32:05.359');
+----------------------------------------------------------+
|date_trunc(DD, CAST(2015-03-05T09:32:05.359 AS TIMESTAMP))|
+----------------------------------------------------------+
|                    2015-03-05 00:00:00|
+----------------------------------------------------------+

SELECT date_trunc('HOUR', '2015-03-05T09:32:05.359');
+------------------------------------------------------------+
|date_trunc(HOUR, CAST(2015-03-05T09:32:05.359 AS TIMESTAMP))|
+------------------------------------------------------------+
|                     2015-03-05 09:00:00|
+------------------------------------------------------------+

SELECT date_trunc('MILLISECOND', '2015-03-05T09:32:05.123456');
+----------------------------------------------------------------------+
|date_trunc(MILLISECOND, CAST(2015-03-05T09:32:05.123456 AS TIMESTAMP))|
+----------------------------------------------------------------------+
|                         2015-03-05 09:32:...|
+----------------------------------------------------------------------+

-- datediff
SELECT datediff('2009-07-31', '2009-07-30');
+------------------------------------------------------------+
|datediff(CAST(2009-07-31 AS DATE), CAST(2009-07-30 AS DATE))|
+------------------------------------------------------------+
|                              1|
+------------------------------------------------------------+

SELECT datediff('2009-07-30', '2009-07-31');
+------------------------------------------------------------+
|datediff(CAST(2009-07-30 AS DATE), CAST(2009-07-31 AS DATE))|
+------------------------------------------------------------+
|                             -1|
+------------------------------------------------------------+

-- dayofweek
SELECT dayofweek('2009-07-30');
+-----------------------------------+
|dayofweek(CAST(2009-07-30 AS DATE))|
+-----------------------------------+
|                 5|
+-----------------------------------+

-- dayofyear
SELECT dayofyear('2016-04-09');
+-----------------------------------+
|dayofyear(CAST(2016-04-09 AS DATE))|
+-----------------------------------+
|                100|
+-----------------------------------+

-- from_unixtime
SELECT from_unixtime(0, 'yyyy-MM-dd HH:mm:ss');
+-----------------------------------------------------+
|from_unixtime(CAST(0 AS BIGINT), yyyy-MM-dd HH:mm:ss)|
+-----------------------------------------------------+
|                 1970-01-01 00:00:00|
+-----------------------------------------------------+

-- from_utc_timestamp
SELECT from_utc_timestamp('2016-08-31', 'Asia/Seoul');
+-------------------------------------------------------------+
|from_utc_timestamp(CAST(2016-08-31 AS TIMESTAMP), Asia/Seoul)|
+-------------------------------------------------------------+
|                     2016-08-31 09:00:00|
+-------------------------------------------------------------+

-- hour
SELECT hour('2009-07-30 12:58:59');
+--------------------------------------------+
|hour(CAST(2009-07-30 12:58:59 AS TIMESTAMP))|
+--------------------------------------------+
|                     12|
+--------------------------------------------+

-- last_day
SELECT last_day('2009-01-12');
+----------------------------------+
|last_day(CAST(2009-01-12 AS DATE))|
+----------------------------------+
|            2009-01-31|
+----------------------------------+

-- make_date
SELECT make_date(2013, 7, 15);
+----------------------+
|make_date(2013, 7, 15)|
+----------------------+
|      2013-07-15|
+----------------------+

SELECT make_date(2019, 13, 1);
+----------------------+
|make_date(2019, 13, 1)|
+----------------------+
|         null|
+----------------------+

SELECT make_date(2019, 7, NULL);
+-------------------------------------+
|make_date(2019, 7, CAST(NULL AS INT))|
+-------------------------------------+
|                 null|
+-------------------------------------+

SELECT make_date(2019, 2, 30);
+----------------------+
|make_date(2019, 2, 30)|
+----------------------+
|         null|
+----------------------+

-- make_timestamp
SELECT make_timestamp(2014, 12, 28, 6, 30, 45.887);
+-----------------------------------------------------------------+
|make_timestamp(2014, 12, 28, 6, 30, CAST(45.887 AS DECIMAL(8,6)))|
+-----------------------------------------------------------------+
|                       2014-12-28 06:30:...|
+-----------------------------------------------------------------+

SELECT make_timestamp(2014, 12, 28, 6, 30, 45.887, 'CET');
+----------------------------------------------------------------------+
|make_timestamp(2014, 12, 28, 6, 30, CAST(45.887 AS DECIMAL(8,6)), CET)|
+----------------------------------------------------------------------+
|                         2014-12-28 05:30:...|
+----------------------------------------------------------------------+

SELECT make_timestamp(2019, 6, 30, 23, 59, 60);
+-------------------------------------------------------------+
|make_timestamp(2019, 6, 30, 23, 59, CAST(60 AS DECIMAL(8,6)))|
+-------------------------------------------------------------+
|                     2019-07-01 00:00:00|
+-------------------------------------------------------------+

SELECT make_timestamp(2019, 13, 1, 10, 11, 12, 'PST');
+------------------------------------------------------------------+
|make_timestamp(2019, 13, 1, 10, 11, CAST(12 AS DECIMAL(8,6)), PST)|
+------------------------------------------------------------------+
|                               null|
+------------------------------------------------------------------+

SELECT make_timestamp(null, 7, 22, 15, 30, 0);
+-------------------------------------------------------------------------+
|make_timestamp(CAST(NULL AS INT), 7, 22, 15, 30, CAST(0 AS DECIMAL(8,6)))|
+-------------------------------------------------------------------------+
|                                   null|
+-------------------------------------------------------------------------+

-- minute
SELECT minute('2009-07-30 12:58:59');
+----------------------------------------------+
|minute(CAST(2009-07-30 12:58:59 AS TIMESTAMP))|
+----------------------------------------------+
|                      58|
+----------------------------------------------+

-- month
SELECT month('2016-07-30');
+-------------------------------+
|month(CAST(2016-07-30 AS DATE))|
+-------------------------------+
|               7|
+-------------------------------+

-- months_between
SELECT months_between('1997-02-28 10:30:00', '1996-10-30');
+-------------------------------------------------------------------------------------------+
|months_between(CAST(1997-02-28 10:30:00 AS TIMESTAMP), CAST(1996-10-30 AS TIMESTAMP), true)|
+-------------------------------------------------------------------------------------------+
|                                         3.94959677|
+-------------------------------------------------------------------------------------------+

SELECT months_between('1997-02-28 10:30:00', '1996-10-30', false);
+--------------------------------------------------------------------------------------------+
|months_between(CAST(1997-02-28 10:30:00 AS TIMESTAMP), CAST(1996-10-30 AS TIMESTAMP), false)|
+--------------------------------------------------------------------------------------------+
|                                     3.9495967741935485|
+--------------------------------------------------------------------------------------------+

-- next_day
SELECT next_day('2015-01-14', 'TU');
+--------------------------------------+
|next_day(CAST(2015-01-14 AS DATE), TU)|
+--------------------------------------+
|              2015-01-20|
+--------------------------------------+

-- now
SELECT now();
+--------------------+
|        now()|
+--------------------+
|2020-06-06 14:00:...|
+--------------------+

-- quarter
SELECT quarter('2016-08-31');
+---------------------------------+
|quarter(CAST(2016-08-31 AS DATE))|
+---------------------------------+
|                3|
+---------------------------------+

-- second
SELECT second('2009-07-30 12:58:59');
+----------------------------------------------+
|second(CAST(2009-07-30 12:58:59 AS TIMESTAMP))|
+----------------------------------------------+
|                      59|
+----------------------------------------------+

-- to_date
SELECT to_date('2009-07-30 04:17:52');
+------------------------------+
|to_date('2009-07-30 04:17:52')|
+------------------------------+
|          2009-07-30|
+------------------------------+

SELECT to_date('2016-12-31', 'yyyy-MM-dd');
+-----------------------------------+
|to_date('2016-12-31', 'yyyy-MM-dd')|
+-----------------------------------+
|             2016-12-31|
+-----------------------------------+

-- to_timestamp
SELECT to_timestamp('2016-12-31 00:12:00');
+-----------------------------------+
|to_timestamp('2016-12-31 00:12:00')|
+-----------------------------------+
|        2016-12-31 00:12:00|
+-----------------------------------+

SELECT to_timestamp('2016-12-31', 'yyyy-MM-dd');
+----------------------------------------+
|to_timestamp('2016-12-31', 'yyyy-MM-dd')|
+----------------------------------------+
|           2016-12-31 00:00:00|
+----------------------------------------+

-- to_unix_timestamp
SELECT to_unix_timestamp('2016-04-08', 'yyyy-MM-dd');
+-----------------------------------------+
|to_unix_timestamp(2016-04-08, yyyy-MM-dd)|
+-----------------------------------------+
|                1460073600|
+-----------------------------------------+

-- to_utc_timestamp
SELECT to_utc_timestamp('2016-08-31', 'Asia/Seoul');
+-----------------------------------------------------------+
|to_utc_timestamp(CAST(2016-08-31 AS TIMESTAMP), Asia/Seoul)|
+-----------------------------------------------------------+
|                    2016-08-30 15:00:00|
+-----------------------------------------------------------+

-- trunc
SELECT trunc('2019-08-04', 'week');
+-------------------------------------+
|trunc(CAST(2019-08-04 AS DATE), week)|
+-------------------------------------+
|              2019-07-29|
+-------------------------------------+

SELECT trunc('2019-08-04', 'quarter');
+----------------------------------------+
|trunc(CAST(2019-08-04 AS DATE), quarter)|
+----------------------------------------+
|               2019-07-01|
+----------------------------------------+

SELECT trunc('2009-02-12', 'MM');
+-----------------------------------+
|trunc(CAST(2009-02-12 AS DATE), MM)|
+-----------------------------------+
|             2009-02-01|
+-----------------------------------+

SELECT trunc('2015-10-27', 'YEAR');
+-------------------------------------+
|trunc(CAST(2015-10-27 AS DATE), YEAR)|
+-------------------------------------+
|              2015-01-01|
+-------------------------------------+

-- unix_timestamp
SELECT unix_timestamp();
+--------------------------------------------------------+
|unix_timestamp(current_timestamp(), yyyy-MM-dd HH:mm:ss)|
+--------------------------------------------------------+
|                       1591452047|
+--------------------------------------------------------+

SELECT unix_timestamp('2016-04-08', 'yyyy-MM-dd');
+--------------------------------------+
|unix_timestamp(2016-04-08, yyyy-MM-dd)|
+--------------------------------------+
|              1460073600|
+--------------------------------------+

-- weekday
SELECT weekday('2009-07-30');
+---------------------------------+
|weekday(CAST(2009-07-30 AS DATE))|
+---------------------------------+
|                3|
+---------------------------------+

-- weekofyear
SELECT weekofyear('2008-02-20');
+------------------------------------+
|weekofyear(CAST(2008-02-20 AS DATE))|
+------------------------------------+
|                  8|
+------------------------------------+

-- year
SELECT year('2016-07-30');
+------------------------------+
|year(CAST(2016-07-30 AS DATE))|
+------------------------------+
|             2016|
+------------------------------+

JSON-funktioner

Funktion Beskrivning
from_json (jsonStr, schema [, alternativ]) Returnerar ett struct-värde med angivet jsonStr och schema .
get_json_object (json_txt, sökväg) Extraherar ett JSON-objekt från path .
json_tuple (jsonStr, P1, P2,..., PN) Returnerar en tupel som funktionen get_json_object , men den tar flera namn. Alla indataparametrar och kolumn typer för utdata är sträng.
schema_of_json (JSON [, alternativ]) Returnerar schema i DDL-formatet för JSON-sträng.
to_json (uttr [, alternativ]) Returnerar en JSON-sträng med ett angivet struct-värde.

Exempel

-- from_json
SELECT from_json('{"a":1, "b":0.8}', 'a INT, b DOUBLE');
+---------------------------+
|from_json({"a":1, "b":0.8})|
+---------------------------+
|          [1, 0.8]|
+---------------------------+

SELECT from_json('{"time":"26/08/2015"}', 'time Timestamp', map('timestampFormat', 'dd/MM/yyyy'));
+--------------------------------+
|from_json({"time":"26/08/2015"})|
+--------------------------------+
|      [2015-08-26 00:00...|
+--------------------------------+

-- get_json_object
SELECT get_json_object('{"a":"b"}', '$.a');
+-------------------------------+
|get_json_object({"a":"b"}, $.a)|
+-------------------------------+
|               b|
+-------------------------------+

-- json_tuple
SELECT json_tuple('{"a":1, "b":2}', 'a', 'b');
+---+---+
| c0| c1|
+---+---+
| 1| 2|
+---+---+

-- schema_of_json
SELECT schema_of_json('[{"col":0}]');
+---------------------------+
|schema_of_json([{"col":0}])|
+---------------------------+
|    array<struct<col:...|
+---------------------------+

SELECT schema_of_json('[{"col":01}]', map('allowNumericLeadingZeros', 'true'));
+----------------------------+
|schema_of_json([{"col":01}])|
+----------------------------+
|    array<struct<col:...|
+----------------------------+

-- to_json
SELECT to_json(named_struct('a', 1, 'b', 2));
+---------------------------------+
|to_json(named_struct(a, 1, b, 2))|
+---------------------------------+
|          {"a":1,"b":2}|
+---------------------------------+

SELECT to_json(named_struct('time', to_timestamp('2015-08-26', 'yyyy-MM-dd')), map('timestampFormat', 'dd/MM/yyyy'));
+---------------------------------------------------------------------+
|to_json(named_struct(time, to_timestamp('2015-08-26', 'yyyy-MM-dd')))|
+---------------------------------------------------------------------+
|                         {"time":"26/08/20...|
+---------------------------------------------------------------------+

SELECT to_json(array(named_struct('a', 1, 'b', 2)));
+----------------------------------------+
|to_json(array(named_struct(a, 1, b, 2)))|
+----------------------------------------+
|             [{"a":1,"b":2}]|
+----------------------------------------+

SELECT to_json(map('a', named_struct('b', 1)));
+-----------------------------------+
|to_json(map(a, named_struct(b, 1)))|
+-----------------------------------+
|           {"a":{"b":1}}|
+-----------------------------------+

SELECT to_json(map(named_struct('a', 1),named_struct('b', 2)));
+----------------------------------------------------+
|to_json(map(named_struct(a, 1), named_struct(b, 2)))|
+----------------------------------------------------+
|                   {"[1]":{"b":2}}|
+----------------------------------------------------+

SELECT to_json(map('a', 1));
+------------------+
|to_json(map(a, 1))|
+------------------+
|      {"a":1}|
+------------------+

SELECT to_json(array((map('a', 1))));
+-------------------------+
|to_json(array(map(a, 1)))|
+-------------------------+
|        [{"a":1}]|
+-------------------------+