Integrierte Funktionen (Databricks SQL)

Dieser Artikel enthält Links zu und Beschreibungen von integrierten Operatoren und Funktionen für Zeichenfolgen und binäre Typen, numerische Skalare, Aggregationen, Fenster, Arrays, Zuordnungen, Datums- und Zeitstempel, Umwandlung, CSV-Daten, JSON-Daten, XPath-Bearbeitung und verschiedene Funktionen.

Siehe auch:

Operatoren und Prädikate

Informationen dazu, wie Operatoren in Bezug aufeinander analysiert werden, finden Sie unter Operator-Rangfolge.

Operator Syntax BESCHREIBUNG
& expr1 & expr2 Gibt das bitweise AND von expr1 und expr2 zurück.
and expr1 and expr2 Gibt das logische AND von expr1 und expr2 zurück.
* multiplier * multiplicand Gibt multiplier multipliziert mit multiplicand zurück.
!= expr1 != expr2 Gibt TRUE zurück, expr1 wenn nicht gleich expr2 ist, oder false andernfalls .
! !expr Gibt die logische NOT eines booleschen Ausdrucks zurück.
between expr1 [not] between expr2 and expr2 expr1Testet, ob größer oder gleich und kleiner oder gleich expr2expr3 ist.
[ ] arrayExpr [ indexExpr ] Gibt indexExpr das nd-Element von ARRAY zurück. arrayExpr
[ ] mapExpr [ keyExpr ] Gibt den Wert bei keyExpr map zurück. mapExpr
^ expr1 ^ expr2 Gibt die bitweise exklusive OR (XOR) von expr1 und expr2 zurück.
: jsonStr : jsonPath Gibt aus extrahierte Felder jsonStr zurück.
:: expr :: type Casts the value expr to the target data type type ."
div divisor div dividend Gibt den integralen Teil der Division von durch divisordividend zurück.
== expr1 == expr2 Gibt trueexpr1 zurück, wenn expr2 gleich ist, false oder andernfalls ."
= expr1 = expr2 Gibt trueexpr1 zurück, wenn expr2 gleich ist, false oder andernfalls ."
= expr1 >= expr2 Gibt trueexpr1 zurück, wenn größer oder gleich expr2 ist, oder false andernfalls .
> expr1 > expr2 Gibt trueexpr1 zurück, wenn größer als expr2 ist, oder false andernfalls .
exists exists(query) Gibt TRUE query zurück, wenn mindestens eine Zeile zurückgibt, andernfalls FALSE.
Ilike str [not] ilike (pattern[ESCAPE escape]) Gibt TRUE str zurück, wenn pattern die escape Groß-/Kleinschreibung nicht beachtet wird.
Ilike str [not] ilike {ANY|SOME|ALL}([pattern[, ...]]) Gibt TRUE str zurück, wenn die Groß-/Kleinschreibung nicht beachtet wird.
in elem [not] in (expr1[, ...]) Gibt true zurück, elem wenn gleich einem exprN ist.
in elem [not] in (query) Gibt trueelem zurück, wenn einer Zeile in query entspricht.
ist eindeutig. expr1 is [not] distinct from expr2 Testet, ob die Argumente unterschiedliche Werte haben, wobei NULLs als vergleichbare Werte betrachtet werden.
ist "false". expr is [not] false Testet, expr ob false ist.
ist NULL. expr is [not] null Gibt true zurück, expr wenn ist NULL (nicht).
ist "true". expr is [not] true Testet, expr ob true ist.
like str [not] like (pattern[ESCAPE escape]) Gibt TRUE zurück, str wenn mit patternescape entspricht.
like str [not] like {ANY|SOME|ALL}([pattern[, ...]]) Gibt TRUE str zurück, wenn einem beliebigen/allen Mustern entspricht.
=> expr1 <=> expr2 Gibt das gleiche Ergebnis wie für Nicht-NULL-Operanden zurück, gibt jedoch zurück, wenn beide sind, wenn EQUAL(=) einer true der NULLfalse Operanden NULL ist.
<> expr1 <= expr2 Gibt true zurück, expr1 wenn nicht gleich expr2 ist, oder false andernfalls .
<> expr1 <> expr2 Gibt true zurück, expr1 wenn nicht gleich expr2 ist, oder false andernfalls .
< expr1 < expr2 Gibt trueexpr1 zurück, wenn kleiner oder gleich expr2 ist, oder false andernfalls .
- expr1 - expr2 Gibt die Subtraktion von expr2 von expr1 zurück.
not not expr Gibt die logische NOT eines booleschen Ausdrucks zurück.
% dividend % divisor Gibt den Rest nach dividend / divisor zurück.
|| expr1 || expr2 Gibt die Verkettung von und expr1expr2 zurück.
| expr1 | expr2 Gibt die bitweise OR von expr1 und expr2 zurück.
+ expr1 + expr2 Gibt die Summe von expr1 und expr2zurück.
Regexp str [not] regexp regex Gibt TRUE zurück, wenn strregex entspricht.
regexp_like str [not] regexp_like regex Gibt TRUE zurück, wenn strregex entspricht.
rlike str [not] rlike regex Gibt TRUE zurück, wenn strregex entspricht.
/ dividend / divisor Gibt geteilt dividend durch divisor zurück.
~ ~ expr Gibt die bitweise NOT von expr zurück.

Operatorrangfolge

Rangfolge Betreiber
1 :, ::, [ ]
2 -(unär), + (unär), ~
3 *, /, %, div
4 +, -, ||
5 &
6 ^
7 |
8 =, ==, <=>, <>, !=, <, <=, >, >=
9 not, exists
10 between, in, rlike, regexp, ilike, like, is [not] [NULL, true, false], is [not] distinct from
11 and
12 or

Zeichenfolgen- und Binärfunktionen

Funktion BESCHREIBUNG
expr1 || expr2 Gibt die Verkettung von und expr1expr2 zurück.
ascii(str) Gibt den ASCII-Codepunkt des ersten Zeichens von str zurück.
base64(expr) Konvertiert in expr eine Base64-Zeichenfolge.
bin(expr) Gibt die binäre Darstellung von expr zurück.
binary(expr) Gibt den Wert von expr in BINARY um.
bit_length(expr) Gibt die Bitlänge von Zeichenfolgendaten oder die Anzahl der Bits von Binärdaten zurück.
btrim(st [, trimStr]) Gibt str zurück, wobei führende und nachfolgende Zeichen entfernt wurden.
char(expr) Gibt das Zeichen am angegebenen UTF-16-Codepunkt zurück.
char_length(expr) Gibt die Zeichenlänge von Zeichenfolgendaten oder die Anzahl der Bytes von Binärdaten zurück.
character_length(expr) Gibt die Zeichenlänge von Zeichenfolgendaten oder die Anzahl der Bytes von Binärdaten zurück.
charindex(substr, str[, pos]) Gibt die Position des ersten Vorkommens von substr in str nach position pos zurück.
ch(expr) Gibt das Zeichen am angegebenen UTF-16-Codepunkt zurück.
concat(expr1, expr2[, ...]) Gibt die Verkettung der Argumente zurück.
concat_ws(sep[, expr1[, ...]]) Gibt die durch getrennten Verkettungszeichenfolgen sep zurück.
crc32(expr) Gibt den zyklischen Redundanzprüfungswert expr zurück.
decode(expr, charSet) Übersetzt binär expr mithilfe der Zeichensatzcodierung in eine charSet Zeichenfolge.
encode(expr, charSet) Gibt die binäre Darstellung einer Zeichenfolge mithilfe der charSet Zeichencodierung zurück.
find_in_set(searchExpr, sourceExpr) Gibt die Position einer Zeichenfolge innerhalb einer durch Trennzeichen getrennten Liste von Zeichenfolgen zurück.
format_number(expr, scale) Formate expr wie #,###,###.## , gerundet auf scale Dezimalstellen.
format_number(expr, fmt) Formate expr wie fmt .
format_string(strfmt[, obj1 [, ...]]) Gibt eine formatierte Zeichenfolge aus Formatzeichenfolgen im printf-Format zurück.
hex(expr) Wird expr in hexadezimale konvertiert.
str ilike (pattern[ESCAPE escape]) Gibt TRUE zurück, wenn die strpatternescape Groß-/Kleinschreibung nicht beachtet wird.
initcap(expr) Gibt expr mit dem ersten Buchstaben jedes Worts in Großbuchstaben zurück.
instr(str, substr) Gibt den (1-basierten) Index des ersten Vorkommens von substr in str zurück.
lcase(expr) Gibt expr zurück, wobei alle Zeichen in Kleinbuchstaben geändert wurden.
left(str, len) Gibt die am weitesten links liegenden len Zeichen aus str zurück.
length(expr) Gibt die Zeichenlänge von Zeichenfolgendaten oder die Anzahl der Bytes von Binärdaten zurück.
adrenshtein(str1, str2) Gibt den Abstand zwischen den Zeichenfolgen str1 und str2 zurück.
str like (pattern[ESCAPE escape]) Gibt TRUE zurück, wenn strpattern mit escape übereinstimmt.
locate(substr, str[, pos]) Gibt die Position des ersten Vorkommens von substr in str nach position pos zurück.
lower(expr) Gibt expr zurück, wobei alle Zeichen in Kleinbuchstaben geändert wurden.
lpad(str, len[, pad]) Gibt str zurück, links mit pad bis zu einer Länge von len .
ltrim([trimstr,] str) Gibt str zurück, wobei führende Zeichen entfernt trimStr wurden.
md5(expr) Gibt eine MD5-128-Bit-Prüfsumme von expr als hexadezimale Zeichenfolge zurück.
octet_length(expr) Gibt die Bytelänge von Zeichenfolgendaten oder die Anzahl der Bytes von Binärdaten zurück.
overlay(input PLACING replace FROM pos [FOR len]) Ersetzt input durch replace , das bei beginnt und die Länge poslen hat.
parse_url(url, partToExtract[, key]) Extrahiert einen Teil aus url .
position(substr, str[, pos]) Gibt die Position des ersten Vorkommens von substr in str nach position pos zurück.
position(subtr IN str) Gibt die Position des ersten Vorkommens von substr in str nach position pos zurück.
printf(strfmt[, obj1 [, ...]]) Gibt eine formatierte Zeichenfolge aus Formatzeichenfolgen im printf-Format zurück.
str regexp regex Gibt TRUE zurück, wenn strregex entspricht.
str regexp_like regex Gibt TRUE zurück, wenn strregex entspricht.
regexp_extract(str, regexp[, idx]) Extrahiert die erste Zeichenfolge in str , die mit dem Ausdruck übereinstimmt und dem regexp Gruppenindex entspricht. regex
regexp_extract_all(str, regexp[, idx]) Extrahiert alle Zeichenfolgen in str , die mit dem Ausdruck übereinstimmen und dem regexpregex Gruppenindex entsprechen.
regexp_replace(str, regexp, rep[, position]) Ersetzt alle Teilzeichenfolgen von str , die regexp mit rep übereinstimmen.
repeat(expr, n) Gibt die Zeichenfolge zurück, die exprn wiederholt wird.
replace(str, regexp, rep[, position]) Ersetzt alle Teilzeichenfolgen von str , die regexp mit rep übereinstimmen.
reverse(expr) Gibt eine umgekehrte Zeichenfolge oder ein Array mit umgekehrter Reihenfolge von Elementen zurück.
right(str, len) Gibt die am weitesten rechts liegenden len Zeichen aus der Zeichenfolge str zurück.
str rlike regex Gibt TRUE zurück, wenn strregex entspricht.
rpad(str, len[, pad]) Gibt str zurück, mit rechts aufgefüllt mit pad bis zu einer Länge von len .
rtrim([trimStr,] str) Gibt str mit entfernten nachgestellten Zeichen zurück.
sentences(str[, lang, country]) Teilt in str ein Array von Wörtern auf.
sha(expr) Gibt einen sha1-Hashwert als hexadezimale Zeichenfolge von expr zurück.
sha1(expr) Gibt einen sha1-Hashwert als hexadezimale Zeichenfolge von expr zurück.
sha2(expr, bitLength) Gibt eine Prüfsumme der SHA-2-Familie als hexadezimale Zeichenfolge von expr zurück.
soundex(expr) Gibt den Soundex-Code der Zeichenfolge zurück.
space(n) Gibt eine Zeichenfolge zurück, die aus n Leerzeichen besteht.
split(str, regex[, limit]) Teilt str vorkommende Vorkommen auf, die regex übereinstimmen, und gibt ein Array mit einer Länge von mindestens limit zurück.
string(expr) Casts the value expr to STRING.
substr(expr, pos[, len]) Gibt die Teilzeichenfolge von expr zurück, die bei pos beginnt und die Länge len hat.
substr(expr FROM pos[ FOR len]) Gibt die Teilzeichenfolge von expr zurück, die bei pos beginnt und die Länge len hat.
substring(expr, pos[, len]) Gibt die Teilzeichenfolge von expr zurück, die bei pos beginnt und die Länge len hat.
substring(expr FROM pos[ FOR len]) Gibt die Teilzeichenfolge von expr zurück, die bei pos beginnt und die Länge len hat.
substring_index(expr, delim, count) Gibt die Teilzeichenfolge von vor expr dem count Vorkommen des Trennzeichens delim zurück.
translate(expr, from, to) Gibt einen zurück, bei dem alle Zeichen in durch die zeichen exprfrom in ersetzt to wurden.
trim([BOTH | LEADING | TRAILING] [trimStr] FROM] str) Kürzen Sie Zeichen aus einer Zeichenfolge.
ucase(expr) Gibt expr zurück, wenn alle Zeichen in Großbuchstaben geändert wurden.
unbase64(expr) Gibt eine decodierte Base64-Zeichenfolge als Binärdatei zurück.
unhex(expr) Konvertiert hexadezimal expr in BINARY.
upper(expr) Gibt expr zurück, wenn alle Zeichen in Großbuchstaben geändert wurden.

Numerische Skalarfunktionen

Funktion BESCHREIBUNG
~ expr Gibt die bitweise NOT von expr zurück.
dividend/divisor Gibt geteilt dividend durch divisor zurück.
expr1 | expr2 Gibt die bitweise OR von expr1 und expr2 zurück.
- expr Gibt den negierten Wert von expr zurück.
expr1 - expr2 Gibt die Subtraktion von expr2 von expr1 zurück.
+ expr Gibt den Wert von expr zurück.
expr1 + expr2 Gibt die Summe von expr1 und expr2zurück.
Dividend % Divisor Gibt den Rest nach dividend / divisor zurück.
expr1 ^ expr2 Gibt die bitweise exklusive OR (XOR) von expr1 und expr2 zurück.
expr1 expr2 Gibt das bitweise AND von expr1 und expr2 zurück.
Multiplikator * Multiplikation Gibt multiplier multipliziert mit multiplicand zurück.
abs(expr) Gibt den absoluten Wert des numerischen Werts in expr zurück.
acos(expr) Gibt den inverse Kosinus (Arkuscosinus) von expr zurück.
acosh(expr) Gibt den umgekehrten hyperbolischen Kosinus von expr zurück.
asin(expr) Gibt den inverse Sinus (Arkussinus) von expr zurück.
asinh(expr) Gibt den umgekehrten hyperbolischen Sinus von expr zurück.
atan(expr) Gibt den umgekehrten Tangens (Arkutangens) von expr zurück.
atan2(exprY, exprX) Gibt den Winkel im Bogenmaß zwischen der positiven X-Achse einer Ebene und dem punkt zurück, der durch die Koordinaten ( , ) exprX angegeben exprY wird.
atanh(expr) Gibt den umgekehrten hyperbolischen Tangens von expr zurück.
bigint(expr) Casts the value expr to BIGINT.
bit_count(expr) Gibt die Anzahl der bits zurück, die im Argument festgelegt sind.
bit_get(expr, pos) Gibt den Wert eines Bit in einer binären Darstellung eines integralen numerischen -Werts zurück.
bit_reverse(expr) Gibt den Wert zurück, der durch Umkehren der Reihenfolge der Bits im Argument ermittelt wird.
bround(expr[,targetScale]) Gibt die gerundete expr mithilfe HALF_EVEN des Rundungsmodus zurück.
cbrt(expr) Gibt den Cubestamm von expr zurück.
ceil(expr) Gibt die kleinste Ganzzahl zurück, die nicht kleiner als expr ist.
ceiling(expr) Gibt die kleinste Ganzzahl zurück, die nicht kleiner als expr ist.
conv(num, fromBase, toBase) Konvertiert von numfromBase in toBase .
cos(expr) Gibt den Kosinus von expr zurück.
cosh(expr) Gibt den hyperbolischen Kosinus von expr zurück.
cot(expr) Gibt den Kohengens von expr zurück.
decimal(expr) Konvertiert den Wert expr in DECIMAL.
degrees(expr) Konvertiert Bogenmaße zu Graden.
divisor div dividend Gibt den integralen Teil der Division von durch divisordividend zurück.
double(expr) Casts the value to DOUBLE. (Der Wert wird expr in DOUBLE umverwertet.)
e() Gibt die Konstante e zurück.
exp(expr) Kehrt e zur Leistung von expr zurück.
expm1(expr) Gibt exp(expr) - 1zurück.
factorial(expr) Gibt den Faktor von expr zurück.
float(expr) Casts the value expr to FLOAT.
floor(expr) Gibt die kleinste integrale Zahl zurück, die nicht größer als expr ist.
getbit(expr, pos) Gibt den Wert eines Bit in einer binären Darstellung eines integralen numerischen -Werts zurück.
hypot(expr1, expr2) Gibt sqrt(expr1 * expr1 + expr2 * expr2)zurück.
int(expr) Konvertiert den Wert in expr INTEGER.
isnan(expr) Gibt true zurück, wenn expr gleich NaN ist.
ln(expr) Gibt den natürlichen Logarithmus e (Basis) von expr zurück.
log([base,] expr) Gibt den Logarithmus von mit exprbase zurück.
log1p(expr) Gibt log(1 + expr)zurück.
log2(expr) Gibt den Logarithmus von mit expr der Basis 2 zurück.
log10(expr) Gibt den Logarithmus von mit expr der Basis 10 zurück.
mod(dividend, divisor) Gibt den Rest nach dividend / divisor zurück.
nanvl(expr1, expr2) Gibt expr1 zurück, wenn es nicht NaN ist, oder expr2 andernfalls .
negative(expr) Gibt den negierten Wert von expr zurück.
pi() Gibt pi zurück.
pmod(dividend, divisor) Gibt den positiven Rest nach dividend / divisor zurück.
positive(expr) Gibt den Wert von expr zurück.
pow(expr1, expr2) Löst expr1 die Leistung von expr2 aus.
power(expr1, expr2) Löst expr1 die Leistung von expr2 aus.
radians(expr) Konvertiert expr in Grad in Bogenmaß.
rand([seed]) Gibt einen zufälligen Wert zwischen 0 und 1 zurück.
randn([seed]) Gibt einen zufälligen Wert aus einer Standardnorm normaler Verteilung zurück.
random([seed]) Gibt einen zufälligen Wert zwischen 0 und 1 zurück.
rint(expr) Gibt expr als DOUBLE auf eine ganze Zahl gerundet zurück.
round(expr[,targetScale]) Gibt die gerundete expr mithilfe HALF_UP des Rundungsmodus zurück.
shiftleft(expr, n) Gibt eine bitweise Umschaltung nach links um n Bits zurück.
shiftright(expr, n) Gibt eine bitweise ganzzahliger Zahl mit Vorzeichen zurück, die um Bits nach rechts verschoben n wird.
shiftrightunsigned(expr, n) Gibt eine bitweise ganzzahliger Zahl ohne Vorzeichen zurück, die um Bits nach rechts verschoben n wird.
signum(expr) Gibt -1.0, 0.0 oder 1.0 als expr negativ, 0 oder positiv zurück.
sinh(expr) Gibt den hyperbolischen Sinus von expr zurück.
smallint(expr) Casts the value expr to SMALLINT.
sqrt(expr) Gibt die Quadratwurzel von expr zurück.
tan(expr) Gibt den Tangens von expr zurück.
tanh(expr) Gibt den hyperbolischen Tangens von expr zurück.
tinyint(expr) Wird in expr TINYINT um.
try_add(expr1, expr2) Gibt die Summe von expr1 und oder NULL im Falle eines expr2 Fehlers zurück.
try_divide(Dividend, Divisor) Gibt dividend dividiert durch divisor oder NULL zurück, wenn divisor 0 ist.

Aggregatfunktionen

Funktion BESCHREIBUNG
any(expr) Gibt TRUE zurück, wenn mindestens ein Wert expr von in der Gruppe true ist.
approx_count_distinct(expr[,relativeSD]) Gibt die geschätzte Anzahl unterschiedlicher Werte in der expr Gruppe zurück.
approx_percentile(col,percentage[,accuracy]) Gibt das ungefähre Perzentil des expr innerhalb der Gruppe zurück.
avg(expr) Gibt den Mittelwert zurück, der aus Werten einer Gruppe berechnet wird.
bit_and(expr) Gibt die bitweise AND aller Eingabewerte in der Gruppe zurück.
bit_or(expr) Gibt die bitweise OR aller Eingabewerte in der Gruppe zurück.
bit_xor(expr) Gibt die bitweise XOR aller Eingabewerte in der Gruppe zurück.
bool_and(expr) Gibt TRUE zurück, wenn alle Werte in expr innerhalb der Gruppe true sind.
bool_or(expr) Gibt TRUE zurück, wenn mindestens ein Wert in expr innerhalb der Gruppe true ist.
collect_list(expr) Gibt ein Array zurück, das aus allen Werten expr in der Gruppe besteht.
collect_set(expr) Gibt ein Array zurück, das aus allen eindeutigen Werten expr in der Gruppe besteht.
corr(expr1,expr2) Gibt den Pearson-Korrelationskoeffizient zwischen einer Gruppe von Zahlenpaaren zurück.
count(*) Gibt die Gesamtzahl der abgerufenen Zeilen in einer Gruppe zurück, einschließlich der Zeilen, die NULL enthalten.
count(expr[, ...]) Gibt die Anzahl der Zeilen in einer Gruppe zurück, für die alle angegebenen Ausdrücke ungleich NULL sind.
count_if(expr) Gibt die Anzahl der true-Werte für die Gruppe in expr zurück.
count_min_sketch(expr, epsilon, confidence, seed) Gibt eine Zählungsminen-Zeichnung aller Werte in der Gruppe in expr mit , epsilon und confidenceseed zurück.
covar_pop(expr1,expr2) Gibt die Kovarianz der Grundgesamtheit von Zahlenpaaren in einer Gruppe zurück.
covar_samp(expr1,expr2) Gibt die Kovarianz von Zahlenpaaren in einer Gruppe zurück.
every(expr) Gibt TRUE zurück, wenn alle Werte von expr in der Gruppe true sind.
first(expr[,ignoreNull]) Gibt den ersten Wert von expr für eine Gruppe von Zeilen zurück.
first_value(expr[,ignoreNull]) Gibt den ersten Wert von expr für eine Gruppe von Zeilen zurück.
dass (expr) Gibt den anhand der Werte einer Gruppe berechneten Wert zurück.
last(expr[,ignoreNull]) Gibt den letzten Wert von expr für die Zeilengruppe zurück.
last_value(expr[,ignoreNull]) Gibt den letzten Wert von expr für die Zeilengruppe zurück.
max(expr) Gibt den Maximalwert von expr in einer Gruppe zurück.
max_by(expr1,expr2) Gibt den Wert eines zurück, expr1 der dem Höchstwert von in einer Gruppe zugeordnet expr2 ist.
mean(expr) Gibt den Mittelwert zurück, der aus Werten einer Gruppe berechnet wird.
min(expr) Gibt den Minimalwert von expr in einer Gruppe zurück.
min_by(expr1, expr2) Gibt den Wert eines zurück, expr1 der dem Minimalwert von in einer Gruppe zugeordnet expr2 ist.
percentile(expr, percentage [,frequency]) Gibt den genauen Perzentilwert von expr am angegebenen percentage zurück.
percentile_approx(expr,percentage[,accuracy]) Gibt das ungefähre Perzentil des expr innerhalb der Gruppe zurück.
skewness(expr) Gibt den Auswerten einer Gruppe berechneten Schiefewert zurück.
some(expr) Gibt TRUE zurück, wenn mindestens ein Wert von expr in einer Gruppe true ist.
std(expr) Gibt die Standardabweichung der Stichprobe zurück, die aus den Werten innerhalb der Gruppe berechnet wird.
stddev(expr) Gibt die Standardabweichung der Stichprobe zurück, die aus den Werten innerhalb der Gruppe berechnet wird.
stddev_pop(expr) Gibt die Standardabweichung der Grundgesamtheit zurück, die anhand der Werte einer Gruppe berechnet wird.
stddev_samp(expr) Gibt die Standardabweichung der Stichprobe zurück, die anhand der Werte einer Gruppe berechnet wird.
sum(expr) Gibt die Summe zurück, die aus Werten einer Gruppe berechnet wird.
var_pop(expr) Gibt die Varianz der Grundgesamtheit zurück, die aus Werten einer Gruppe berechnet wird.
var_samp(expr) Gibt die Varianz der Stichprobe zurück, die aus Werten einer Gruppe berechnet wird.
variance(expr) Gibt die Varianz der Stichprobe zurück, die aus Werten einer Gruppe berechnet wird.

Fensterrangfunktionen

Funktion BESCHREIBUNG
dense_rank() Gibt den Rang eines Werts im Vergleich zu allen Werten in der Partition zurück.
ntile(n) Unterteilt die Zeilen für jede Fensterpartition in n Buckets im Bereich von 1 bis höchstens n .
percent_rank() Berechnet die prozentuale Rangfolge eines Werts innerhalb der Partition.
rank() Gibt den Rang eines Werts im Vergleich zu allen Werten in der Partition zurück.
row_number() Weist jeder Zeile eine eindeutige sequenzielle Zahl zu, beginnend mit einer Zeile, entsprechend der Reihenfolge der Zeilen innerhalb der Fensterpartition.

Analysefensterfunktionen

Funktion BESCHREIBUNG
cume_dist() Gibt die Position eines Werts relativ zu allen Werten in der Partition zurück.
lag(expr[,offset[,default]]) Gibt den Wert von expr aus einer vorangehenden Zeile innerhalb der Partition zurück.
lead(expr[,offset[,default]]) Gibt den Wert von expr aus einer nachfolgenden Zeile innerhalb der Partition zurück.
nth_value(expr, offset[, ignoreNulls]) Gibt den Wert von expr an einem bestimmten offset im Fenster zurück.

Arrayfunktionen

Funktion BESCHREIBUNG
arrayExpr[indexExpr] Gibt das Element an der Position indexExpr von ARRAY arrayExpr zurück.
aggregate(expr,start,merge[,finish]) Aggregiert Elemente in einem Array mithilfe eines benutzerdefinierten Aggregators.
array([expr [, ...]]) Gibt ein Array mit den Elementen in expr zurück.
array_contains(array,value) Gibt TRUE zurück, wenn arrayvalue enthält.
array_distinct(Array) Entfernt doppelte Werte aus array .
array_except(array1,array2) Gibt ein Array der Elemente in , array1 aber nicht in array2 zurück.
array_intersect(array1,array2) Gibt ein Array der Elemente in der Schnittmenge von array1 und array2 zurück.
array_join(array,delimiter[,nullReplacement]) Verkettet die Elemente von array .
array_max(Array) Gibt den Höchstwert in array zurück.
array_min(Array) Gibt den Mindestwert in array zurück.
array_position(array,element) Gibt die Position des ersten Vorkommens von element in array zurück.
array_remove(array,element) Entfernt alle Vorkommen von element aus array .
array_repeat(element,count) Gibt ein Array zurück, das elementcount Zeiten enthält.
array_sort(array,func) Gibt array sortiert nach func zurück.
array_union(array1,array2) Gibt ein Array der Elemente in der Vereinigung von und array1array2 ohne Duplikate zurück.
arrays_overlap(array1, array2) Gibt TRUE zurück, wenn die array1 Schnittmenge von und array2 nicht leer ist.
arrays_zip(array1 [, ...]) Gibt ein zusammengeführtes Array von Strukturen zurück, in dem die n-te Struktur alle Nth-Werte von Eingabearrays enthält.
cardinality(expr) Gibt die Größe von expr zurück.
concat(expr1, expr2 [, ...]) Gibt die Verkettung der Argumente zurück.
element_at(arrayExpr, index) Gibt das Element eines bei arrayExprindex zurück.
exists(expr, pred) Gibt TRUE zurück, pred wenn für jedes Element in true expr ist.
explode(expr) Gibt Zeilen zurück, indem die Schachtelung von entschachtelt expr wird.
explode_outer(expr) Gibt Zeilen zurück, indem die Schachtelung expr mithilfe der äußeren Semantik entschachtelt wird.
filter(expr,func) Filtert das Array in expr mithilfe der Funktion func .
flatten(arrayOfArrays) Transformiert ein Array von Arrays in ein einzelnes Array.
forall(expr, predFunc) predFuncTestet, ob für alle Elemente im Array enthält.
inline(expr) Explodiert ein Array von Strukturen in eine Tabelle.
inline_outer(expr) Explodiert ein Array von Strukturen in eine Tabelle mit äußerer Semantik.
posexplode(expr) Gibt Zeilen zurück, indem das Array durch Nummerierung von Positionen geschachtelt wird.
posexplode_outer(expr) Gibt Zeilen zurück, indem das Array mit der Nummerierung von Positionen mithilfe von OUTER Semantik geschachtelt wird.
reduce(expr,start,merge[,finish]) Aggregiert Elemente in einem Array mithilfe eines benutzerdefinierten Aggregators.
reverse(array) Gibt eine umgekehrte Zeichenfolge oder ein Array mit umgekehrter Reihenfolge von Elementen zurück.
sequence(start,stop,step) Generiert ein Array von Elementen von start bis stop (einschließlich), inkrementiert um step .
shuffle(array) Gibt eine zufällige Permutation des Arrays in expr zurück.
size(expr) Gibt die Kardinalität von expr zurück.
slice(expr,start,length) Gibt eine Teilmenge eines Arrays zurück.
sort_array(array[,ascendingOrder]) Gibt das Array in expr in sortierter Reihenfolge zurück.
transform(expr, func) Transformiert Elemente in einem Array in expr mithilfe der Funktion func .
zip_with(expr1, expr2, func) Führt die Arrays in und elementweise mithilfe von expr1 in einem einzelnen Array expr2func zusammen.

map-Funktionen

Funktion BESCHREIBUNG
mapExpr[keyExpr] Gibt den Wert bei keyExpr map mapExpr zurück.
cardinality(expr) Gibt die Größe von expr zurück.
element_at(mapExpr, key) Gibt den Wert von mapExpr für key zurück.
explode(expr) Gibt Zeilen zurück, indem die Schachtelung von entschachtelt expr wird.
explode_outer(expr) Gibt Zeilen zurück, indem die Schachtelung expr mithilfe der äußeren Semantik entschachtelt wird.
map([{key1, value1}[, ...]]) Erstellt eine Zuordnung mit den angegebenen Schlüssel-Wert-Paaren.
map_concat([expr1 [, ...]]) Gibt die Vereinigung aller expr Zuordnungsausdrücke zurück.
map_entries(map) Gibt ein ungeordnetes Array aller Einträge in map zurück.
map_filter(expr, func) Filtert Einträge in der Zuordnung in expr mithilfe der Funktion func .
map_from_arrays(Schlüssel, Werte) Erstellt eine Zuordnung mit einem Paar der Arrays keys und values .
map_from_entries(expr) Erstellt eine Zuordnung, die aus dem angegebenen Array von Einträgen erstellt wurde.
map_keys(map) Gibt ein ungeordnetes Array zurück, das die Schlüssel von map enthält.
map_values(map) Gibt ein ungeordnetes Array zurück, das die Werte von map enthält.
map_zip_with(map1, map2, func) Führt und map1 in einer einzelnen Zuordnung map2 zusammen.
size(expr) Gibt die Kardinalität von expr zurück.
transform_keys(expr, func) Transformiert Schlüssel in einer Zuordnung in expr mithilfe der Funktion func .
transform_values(expr, func) Transformiert Werte in einer Zuordnung in expr mithilfe der Funktion func .

Datums-, Zeitstempel- und Intervallfunktionen

Informationen zu Datums- und Zeitstempelformaten finden Sie unter Databricks SQL datetime patterns.

Funktion BESCHREIBUNG
intervalExpr/divisor Gibt das Intervall dividiert durch divisor zurück.
– intervalExpr Gibt den negierten Wert von intervalExpr zurück.
intervalExpr1 – intervalExpr2 Gibt die Subtraktion von intervalExpr2 von intervalExpr1 zurück.
datetimeExpr1 – datetimeExpr2 Gibt die Subtraktion von datetimeExpr2 von datetimeExpr1 zurück.
+ intervalExpr Gibt den Wert von intervalExpr zurück.
intervaExpr1 + intervalExpr2 Gibt die Summe von intervalExpr1 und ntervalExpr2zurück.
intervalExpr * multipliknd Gibt intervalExpr multipliziert mit multiplicand zurück.
add_months(startDate,numMonths) Gibt das Datum zurück, das nach numMonthsstartDate liegt.
current_date() Gibt das aktuelle Datum zu Beginn der Abfrageauswertung zurück.
current_timestamp() Gibt den aktuellen Zeitstempel zu Beginn der Abfrageauswertung zurück.
current_timezone() Gibt die lokale Zeitzone der aktuellen Sitzung zurück.
date(expr) Gibt den Wert in expr DATE um.
date_add(startDate,numDays) Gibt das Datum nach numDaysstartDate zurück.
date_format(expr,fmt) Konvertiert einen Zeitstempel in eine Zeichenfolge im Format fmt .
date_from_unix_date(Tage) Erstellt ein Datum aus der Anzahl der Tage seit 1970-01-01 .
date_part(field,expr) Extrahiert einen Teil des Datums, des Zeitstempels oder des Intervalls.
date_sub(startDate,numDays) Gibt das Datum vor numDaysstartDate zurück.
date_trunc(field,expr) Gibt den Zeitstempel zurück, der auf die in angegebene Einheit gekürzt field wurde.
datediff(endDate,startDate) Gibt die Anzahl der Tage von bis startDateendDate zurück.
day(expr) Gibt den Tag des Monats des Datums oder Zeitstempels zurück.
dayofmonth(expr) Gibt den Tag des Monats des Datums oder Zeitstempels zurück.
dayofweek(expr) Gibt den Wochentag des Datums oder Zeitstempels zurück.
dayofyear(expr) Gibt den Tag des Jahres des Datums oder Zeitstempels zurück.
extract(field FROM source) Gibt field von source zurück.
from_unixtime(unixTime,fmt) Gibt unixTime in fmt zurück.
from_utc_timestamp(expr,timezone) Gibt einen Zeitstempel in expr angegeben in UTC in der Zeitzone timeZone zurück.
hour(expr) Gibt die Stundenkomponente eines Zeitstempels zurück.
last_day(expr) Gibt den letzten Tag des Monats zurück, zu dem das Datum gehört.
make_date(Jahr, Monat, Tag) Erstellt ein Datum aus year den month Feldern , und day .
make_dt_interval([days[, hours[, mins[, secs]]]]) Erstellt ein Tagesintervall aus days , hours und minssecs .
make_interval(Jahre, Monate, Wochen, Tage, Stunden, Minuten, Sek.) Veraltet: Erstellt ein Intervall aus years , , , , und monthsweeksdayshoursminssecs .
make_timestamp(year,month,day,hour,min,sec[,timezone]) Erstellt einen Zeitstempel aus yearmonth den day Feldern , , , hour und minsectimezone .
make_ym_interval([years[, months]]) Erstellt ein Jahr-Monat-Intervall aus years , und months .
minute(expr) Gibt die Minutenkomponente des Zeitstempels in expr zurück.
month(expr) Gibt die Monatskomponente des Zeitstempels in expr zurück.
months_between(expr1,expr2[,roundOff]) Gibt die Anzahl der Monate zurück, die zwischen Datumsangaben oder Zeitstempeln in expr1 und verstrichen expr2 sind.
next_day(expr,dayOfWeek) Gibt das erste Datum zurück, das nach und expr in benannt dayOfWeek ist.
now() Gibt den aktuellen Zeitstempel zu Beginn der Abfrageauswertung zurück.
quarter(expr) Gibt das Quartal des Jahres für expr im Bereich von 1 bis 4 zurück.
second(expr) Gibt die zweite Komponente des Zeitstempels in expr zurück.
timestamp(expr) Wird in expr TIMESTAMP um.
timestamp_micros(expr) Erstellt einen expr Zeitstempel in Mikrosekunden seit der UTC-Epoche.
timestamp_millis(expr) Erstellt einen expr Zeitstempel in Millisekunden seit der UTC-Epoche.
timestamp_seconds(expr) Erstellt expr Zeitstempelsekunden seit der UTC-Epoche.
to_date(expr[,fmt]) Gibt expr die Cast-Methode mithilfe einer optionalen Formatierung in ein Datum zurück.
to_timestamp(expr[,fmt]) Gibt expr die Cast in einen Zeitstempel mithilfe einer optionalen Formatierung zurück.
to_unix_timestamp(expr[,fmt]) Gibt den Zeitstempel in expr als UNIX zurück.
to_utc_timestamp(expr,timezone) Gibt den Zeitstempel expr in in einer anderen Zeitzone als UTC zurück.
trunc(expr, fmt) Gibt ein Datum zurück, bei dem ein Teil des Datums auf die durch das Formatmodell angegebene Einheit abgeschnitten fmt ist.
try_add(expr1, expr2) Gibt die Summe von expr1 und oder NULL im Falle eines expr2 Fehlers zurück.
try_divide(Dividend, Divisor) Gibt dividend dividiert durch divisor oder NULL zurück, wenn divisor 0 ist.
unix_date(expr) Gibt die Anzahl der Tage seit 1970-01-01 zurück.
unix_micros(expr) Gibt die Anzahl der Mikrosekunden seit 1970-01-01 00:00:00 UTC zurück.
unix_millis(expr) Gibt die Anzahl von Millisekunden seit 1970-01-01 00:00:00 UTC zurück.
unix_seconds(expr) Gibt die Anzahl der Sekunden seit 1970-01-01 00:00:00 UTC zurück.
unix_timestamp([expr[, fmt]]) gibt den Zeitstempel UNIX der aktuellen oder angegebenen Zeit zurück.
weekday(expr) Gibt den Wochentag von expr zurück.
weekofyear(expr) Gibt die Woche des Jahres von expr zurück.
year(expr) Gibt die Jahreskomponente von expr zurück.
window(expr, width[, step[, start]]) Erstellt ein springendes gleitendes Fenster über einem Zeitstempelausdruck.

Cast-Funktionen und -Konstruktoren

Informationen zur Umwandlung zwischen Typen finden Sie unter Cast-Funktion (Databricks SQL) und try_cast-Funktion (Databricks SQL).

Funktion BESCHREIBUNG
array([expr [, ...]]) Gibt ein Array mit den Elementen in expr zurück.
bigint(expr) Casts the value expr to BIGINT.
binary(expr) Casts the value of to BINARY. (Der Wert von wird expr in BINARY umformatiert.)
boolean(expr) Wird in expr einen booleschen Wert umveröffentlicht.
cast(expr AS-Typ) Casts the value expr to the target data type type .
expr :: type Casts the value expr to the target data type type .
date(expr) Gibt den Wert in expr DATE um.
decimal(expr) Konvertiert den Wert expr in DECIMAL.
double(expr) Casts the value to DOUBLE. (Der Wert wird expr in DOUBLE umverwertet.)
float(expr) Casts the value expr to FLOAT.
int(expr) Konvertiert den Wert in expr INTEGER.
make_date(Jahr, Monat, Tag) Erstellt ein Datum aus year den month Feldern , und day .
make_dt_interval([days[, hours[, mins[, secs]]]]) Erstellt ein Tagesintervall aus days , hours und minssecs .
make_interval(Jahre, Monate, Wochen, Tage, Stunden, Minuten, Sek.) Erstellt ein Intervall aus years , , , , und monthsweeksdayshoursminssecs .
make_timestamp(year,month,day,hour,min,sec[,timezone]) Erstellt einen Zeitstempel aus yearmonth den day Feldern , , , hour und minsectimezone .
make_ym_interval([years[, months]]) Erstellt ein Jahr-Monat-Intervall aus years , und months .
map([{key1, value1} [, ...]]) Erstellt eine Zuordnung mit den angegebenen Schlüssel-Wert-Paaren.
named_struct({name1, val1} [, ...]) Erstellt eine Struktur mit den angegebenen Feldnamen und -werten.
smallint(expr) Casts the value expr to SMALLINT.
string(expr) Casts the value expr to STRING.
struct(expr1 [, ...]) Erstellt eine Struktur mit den angegebenen Feldwerten.
tinyint(expr) Wird in expr TINYINT um.
timestamp(expr) Wird in expr TIMESTAMP um.
try_cast(expr AS-Typ) Gibt den Wert sicher expr in den Zieldatentyp type um.

CSV-Funktionen

Funktion BESCHREIBUNG
from_csv(csvStr, schema[, options]) Gibt einen Strukturwert mit und csvStrschema zurück.
schema_of_csv(csv[, Optionen]) Gibt das Schema einer CSV-Zeichenfolge im DDL-Format zurück.
to_csv(expr[, Optionen]) Gibt eine CSV-Zeichenfolge mit dem angegebenen Strukturwert zurück.

JSON-Funktionen

Funktion BESCHREIBUNG
jsonStr : jsonPath Gibt aus dem extrahierte Felder jsonStr zurück.
from_json(jsonStr, schema[, options]) Gibt einen Strukturwert mit und jsonStrschema zurück.
get_json_object(expr, path) Extrahiert ein JSON-Objekt aus path .
json_array_length(jsonArray) Gibt die Anzahl der Elemente im äußersten JSON-Array zurück.
json_object_keys(jsonObject) Gibt alle Schlüssel des äußersten JSON-Objekts als Array zurück.
json_tuple(jsonStr, path1 [, ...]) Gibt mehrere JSON-Objekte als Tupel zurück.
schema_of_json(json[, Optionen]) Gibt das Schema einer JSON-Zeichenfolge im DDL-Format zurück.
to_json(expr[, Optionen]) Gibt eine JSON-Zeichenfolge mit der in angegebenen Struktur expr zurück.

XPath-Funktionen

Funktion BESCHREIBUNG
xpath(xml, xpath) Gibt Werte innerhalb der Knoten von xml zurück, die xpath übereinstimmen.
xpath_boolean(xml, xpath) Gibt true zurück, wenn der xpath Ausdruck ergibt oder wenn ein true übereinstimmender Knoten in gefunden xml wird.
xpath_double(xml, xpath) Gibt einen DOUBLE-Wert aus einem XML-Dokument zurück.
xpath_float(xml, xpath) Gibt einen FLOAT-Wert aus einem XML-Dokument zurück.
xpath_int(xml, xpath) Gibt einen INTEGER-Wert aus einem XML-Dokument zurück.
xpath_long(xml, xpath) Gibt einen BIGINT-Wert aus einem XML-Dokument zurück.
xpath_number(xml, xpath) Gibt einen DOUBLE-Wert aus einem XML-Dokument zurück.
xpath_short(xml, xpath) Gibt einen SHORT-Wert aus einem XML-Dokument zurück.
xpath_string(xml, xpath) Gibt den Inhalt des ersten XML-Knotens zurück, der mit dem XPath-Ausdruck übereinstimmt.

Verschiedene Funktionen

Funktion BESCHREIBUNG
assert_true(expr) Gibt einen Fehler zurück, wenn expr nicht true ist.
CASE expr { WHEN opt1 THEN res1 } [...] [ELSE def] ENDE Gibt resN für das erste optN zurück, das gleich expr ist, oder , wenn keiner def übereinstimmt.
CASE { WHEN cond1 THEN res1 } [...] [ELSE def] ENDE Gibt resN für die erste condN zurück, die als TRUE ausgewertet wird, oder def , wenn keine gefunden wurde.
coalesce(expr1, expr2 [, ...]) Gibt das erste Nicht-NULL-Argument zurück.
cube (expr1 [, ...]) Erstellt einen mehrdimensionalen Cube mithilfe der angegebenen Ausdrucksspalten.
current_catalog() Gibt den aktuellen Katalog zurück.
current_database() Gibt die aktuelle Datenbank (Schema) zurück.
current_user() Gibt den aktuellen Benutzer zurück.
decode(expr, { key1, value1 } [, ...] [,defValue]) Gibt den Wert zurück, der dem Schlüssel entspricht.
elt(index, expr1 [, ...] ) Gibt den n-ten Ausdruck zurück.
greatest(expr1 [, ...]) Gibt den größten Wert aller Argumente zurück und überspringt NULL-Werte.
grouping(col) Gibt an, ob eine angegebene Spalte in einem GROUPING SETROLLUP , oder eine CUBE Teilsumme darstellt.
grouping_id([col1 [, ...]]) Gibt die Gruppierungsebene für eine Gruppe von Spalten zurück.
hash(expr1 [, ...]) Gibt einen Hashwert der Argumente zurück.
java_method(class, method[, arg1 [, ...]]) Ruft eine Methode mit Reflektion auf.
if(cond, expr1, expr2) Gibt expr1 zurück, wenn condtrue ist, oder expr2 andernfalls .
iff(cond, expr1, expr2) Gibt expr1 zurück, wenn condtrue ist, oder expr2 andernfalls .
ifnull(expr1, expr2) Gibt expr2 zurück, wenn expr1NULL ist, oder expr1 andernfalls .
input_file_block_length() Gibt die Länge des gelesenen Blocks in Bytes zurück.
input_file_block_start() Gibt den Startoffset des gelesenen Blocks in Bytes zurück.
input_file_name() Gibt den Namen der zu lesenden Datei oder eine leere Zeichenfolge zurück, falls nicht verfügbar.
is_member(Gruppe) Gibt TRUE zurück, wenn der aktuelle Benutzer Mitglied der Gruppe ist.
isnull(expr) Gibt true zurück, wenn expr gleich NULL ist.
isnotnull(expr) Gibt true zurück, wenn expr nicht NULL ist.
least(expr1 [, ...]) Gibt den kleinsten Wert aller Argumente zurück und überspringt NULL-Werte.
monotonically_increasing_id() Gibt monoton steigende 64-Bit-Ganzzahlen zurück.
nvl(expr1, expr2) Gibt expr2 zurück, expr1 wenn ist oder NULLexpr1 andernfalls .
nvl2(expr1, expr2, expr3) Gibt expr2 zurück, expr1 wenn nicht NULL ist, oder expr3 andernfalls .
raise_error(expr) Löst eine Ausnahme mit expr als Meldung aus.
range(end) Gibt eine Tabelle mit Werten innerhalb eines angegebenen Bereichs zurück.
range(start, end [, step [, numParts]]) Gibt eine Tabelle mit Werten innerhalb eines angegebenen Bereichs zurück.
reflect(class, method[, arg1 [, ...]]) Ruft eine Methode mit Reflektion auf.
spark_partition_id() Gibt die aktuelle Partitions-ID zurück.
stack(numRows, expr1 [, ...]) Trennt expr1 , ... in exprNnumRows Zeilen.
uuid() Gibt eine UUID-Zeichenfolge (Universally Unique Identifier) zurück.
window(expr, width[, step[, start]]) Erstellt ein springendes gleitendes Fenster über einem Zeitstempelausdruck.
xxhash64(expr1 [, ...]) Gibt einen 64-Bit-Hashwert der Argumente zurück.
version() Gibt die Apache Spark zurück.