Ausdrucksfunktionen im Zuordnungsdatenfluss

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Tipp

Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alle Aufgaben ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!

Datenflüsse sind sowohl in Azure Data Factory als auch in Azure Synapse-Pipelines verfügbar. Dieser Artikel gilt für Zuordnungsdatenflüsse. Wenn Sie noch nicht mit Transformationen arbeiten, lesen Sie den Einführungsartikel Transformieren von Daten mit einem Zuordnungsdatenfluss.

Der folgende Artikel enthält Details zu Ausdrucksfunktionen, die von Azure Data Factory und Azure Synapse Analytics in Zuordnungsdatenflüssen unterstützt werden.

Liste der Ausdrucksfunktionen

In Data Factory- und Synapse-Pipelines verwenden Sie die Ausdruckssprache des Features für Zuordnungsdatenflüsse, um Datentransformationen zu konfigurieren.

Ausdrucksfunktion Aufgabe
abs Absoluter Wert einer Zahl.
acos Berechnet einen invertierten Kosinuswert.
add Addiert ein Paar Zeichenfolgen oder Zahlen. Addiert ein Datum zu einer Anzahl von Tagen. Fügt einem Zeitstempel eine Dauer hinzu. Fügt ein Array mit ähnlichem Typ an ein anderes an. Entspricht dem Operator „+“.
and Logischer AND-Operator. Entspricht „&&“.
asin Berechnet einen invertierten Sinuswert.
assertErrorMessages Gibt die Zuordnung aller Assert-Meldungen zurück.
atan Berechnet einen invertierten Tangenswert.
atan2 Gibt den Winkel im Bogenmaß zwischen der positiven X-Achse einer Ebene und dem durch die Koordinaten angegebenen Punkt zurück.
between Überprüft, ob der erste Wert zwischen zwei anderen Werten liegt. Numerische Werte, Zeichenfolgenwerte und datetime-Werte können verglichen werden
bitwiseAnd Bitweiser And-Operator für integrale Datentypen. Identisch mit & Operator.
bitwiseOr Bitweiser Or-Operator für integrale Datentypen. Gleich wie Operator |
bitwiseXor Bitweiser Or-Operator für integrale Datentypen. Gleich wie Operator |
blake2b Berechnet den Blake2-Hash von Spalten verschiedener primitiver Datentypen anhand einer Bitlänge. Die Bitlänge darf nur ein Vielfaches von 8 sein und muss zwischen 8 und 512 liegen. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden.
blake2bBinary Berechnet den Blake2-Digest einer Spalte mit unterschiedlichen grundtypischen Datentypen mit einer Bitlänge, die nur Vielfache von 8 zwischen 8 und 512 sein kann. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden:
case Wendet basierend auf alternierenden Bedingungen einen Wert oder den anderen an. Wenn die Anzahl von Eingaben gerade ist, ist der andere Wert für die letzte Bedingung standardmäßig NULL.
cbrt Berechnet die Kubikwurzel einer Zahl.
ceil Gibt den kleinsten Integerwert zurück, der nicht kleiner als die Zahl ist.
coalesce Gibt den ersten Wert ungleich NULL aus einem Satz von Eingaben zurück. Alle Eingaben müssen den gleichen Typ haben.
columnNames Ruft die Namen aller Ausgabespalten für einen Stream ab. Sie können einen optionalen Streamnamen als erstes Argument und optionales zweites Argument übergeben, um nur Schemaabweichungsspalten zurückzugeben.
columns Ruft die Werte aller Ausgabespalten für einen Stream ab. Sie können einen optionalen Streamnamen als zweites Argument übergeben.
compare Vergleicht zwei Werte des gleichen Typs. Bei „Wert 1 < Wert 2“ wird eine negative ganze Zahl zurückgegeben. Bei „Wert 1 == Wert 2“ wird „0“ zurückgegeben. Und bei „Wert 1 > Wert 2“ wird ein positiver Wert zurückgegeben.
concat Verkettet eine variable Anzahl von Zeichenfolgen miteinander. Entspricht dem Operator „+“ mit Zeichenfolgen.
concatWS Verkettet eine variable Anzahl von Zeichenfolgen unter Verwendung eines Trennzeichens miteinander. Der erste Parameter ist das Trennzeichen.
cos Berechnet einen Kosinuswert.
cosh Berechnet einen hyperbolischen Kosinuswert.
crc32 Berechnet den CRC32-Hash einer Gruppe von Spalten verschiedener primitiver Datentypen anhand einer angegebenen Bitlänge. Die Bitlänge muss die Werte 0 (256), 224, 256, 384 oder 512 aufweisen. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden.
degrees Konvertiert Bogenmaße zu Graden.
divide Dividiert ein Zahlenpaar. Entspricht dem Operator /.
dropLeft Entfernt die angegebene Anzahl von Zeichen links von der Zeichenfolge. Wenn die angeforderte Löschung die Länge der Zeichenfolge überschreitet, wird eine leere Zeichenfolge zurückgegeben.
dropRight Entfernt die angegebene Anzahl von Zeichen rechts von der Zeichenfolge. Wenn die angeforderte Löschung die Länge der Zeichenfolge überschreitet, wird eine leere Zeichenfolge zurückgegeben.
endsWith Überprüft, ob die Zeichenfolge mit der angegebenen Zeichenfolge endet.
equals Operator für Vergleich auf Gleichheit. Entspricht dem Operator „==“.
equalsIgnoreCase Operator für Vergleich auf Gleichheit ohne Berücksichtigung der Groß-/Kleinschreibung. Gleich wie Operator <=>.
escape Versieht eine Zeichenfolge mit einem Escapezeichen entsprechend einem Format. Literalwerte für zulässige Formate sind „json“, „xml“, „ecmascript“, „html“ und „java“.
expr Führt zu einem Ausdruck aus einer Zeichenfolge. Dies entspricht dem Schreiben des Ausdrucks in nicht literaler Form und kann zum Übergeben von Parametern als Zeichenfolgendarstellungen verwendet werden.
factorial Berechnet die Fakultät einer Zahl.
false Gibt immer den Wert FALSE zurück. Verwenden Sie die Funktion syntax(false()), wenn eine Spalte mit dem Namen „false“ vorhanden ist.
floor Gibt den größten Integerwert zurück, der nicht größer als die Zahl ist.
fromBase64 Decodiert die angegebene Base64-codierte Zeichenfolge.
greater Operator für Vergleich auf „größer als“. Gleich wie Operator >.
greaterOrEqual Operator für Vergleich auf „größer als oder gleich“. Gleich wie Operator >=.
greatest Gibt den größten Wert in der Liste der Werte als Eingabe zurück, wobei NULL-Werte übersprungen werden. Gibt NULL zurück, wenn alle Eingaben NULL sind.
hasColumn Überprüft anhand des Namens, ob ein Spaltenwert im Stream vorhanden ist. Sie können einen optionalen Streamnamen als zweites Argument übergeben. Spaltennamen, die zur Entwurfszeit bekannt sind, sollten nur mit ihrem Namen angegeben werden. Berechnete Eingaben werden nicht unterstützt. Sie können aber Parameterersetzungen verwenden.
hasError Überprüft, ob Assert mit der angegebenen ID als Fehler markiert ist.
iif Wendet basierend auf einer Bedingung einen Wert oder den anderen an. Wenn „Andere“ nicht angegeben ist, wird NULL angenommen. Die Werte müssen kompatibel sein (numerisch, Zeichenfolge, ...).
iifNull Bei zwei oder mehr Eingaben wird das erste Element zurückgegeben, das nicht NULL ist. Diese Funktion ist gleichbedeutend mit „coalesce“.
initCap Wandelt den ersten Buchstaben jedes Worts in Großbuchstaben um. Wörter werden als durch Leerzeichen getrennt identifiziert.
instr Sucht die Position (basierend auf 1) der Teilzeichenfolge innerhalb einer Zeichenfolge. Bei nicht gefundener Zeichenfolge wird 0 zurückgegeben.
isDelete Überprüft, ob die Zeile zum Löschen markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“.
isError Überprüft, ob die Zeile als Fehler markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“.
isIgnore Überprüft, ob die Zeile zum Ignorieren markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“.
isInsert Überprüft, ob die Zeile zum Einfügen markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“.
isMatch Überprüft, ob die Zeile bei der Suche übereinstimmt. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“.
isNull Überprüft, ob der Wert NULL ist.
isUpdate Überprüft, ob die Zeile zum Aktualisieren markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“.
isUpsert Überprüft, ob die Zeile zum Einfügen markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“.
jaroWinkler Ruft den Jaro-Winkler-Abstand zwischen zwei Zeichenfolgen ab.
least Operator für Vergleich auf „kleiner als oder gleich“. Gleich wie Operator <.
left Extrahiert eine Teilzeichenfolge mit Beginn an Index 1 mit einer Anzahl von Zeichen. Entspricht SUBSTRING(str, 1, n).
length Gibt die Länge der Zeichenfolge zurück.
lesser Operator für Vergleich auf „kleiner als“. Gleich wie Operator <.
lesserOrEqual Operator für Vergleich auf „kleiner als oder gleich“. Gleich wie Operator <.
levenshtein Ruft die Levenshtein-Distanz zwischen zwei Zeichenfolgen ab.
like Das Muster ist eine Zeichenfolge, die buchstabenweise verglichen wird. Ausnahmen sind die folgenden Sonderzeichen: „_“ entspricht einem einzelnen Zeichen in der Eingabe (ähnlich „.“ in regulären posix-Ausdrücken).
locate Sucht die Position (basierend auf 1) der Teilzeichenfolge innerhalb einer Zeichenfolge ab einer bestimmten Position. Wenn die Position nicht angegeben ist, wird vom dem Anfang der Zeichenfolge ausgegangen. Bei nicht gefundener Zeichenfolge wird 0 zurückgegeben.
log Berechnet den Logarithmuswert. Eine optionale Basis kann angegeben werden; andernfalls wird die Eulersche Zahl verwendet.
log10 Berechnet den Logarithmuswert über der Basis 10.
lower Wandelt eine Zeichenfolge in Kleinschreibung um.
lpad Füllt die Zeichenfolge nach links mit der angegebenen Auffüllung bis zu einer bestimmten Länge auf. Ist die Zeichenfolge größer oder gleich der Länge, wird sie auf die Länge gekürzt.
ltrim Entfernt vorangestellte Zeichen aus einer Zeichenfolge. Wenn der zweite Parameter nicht angegeben ist, werden Leerstellen entfernt. Andernfalls werden Zeichen entfernt, die im zweiten Parameter angegeben sind.
md5 Berechnet den MD5-Hash einer Gruppe von Spalten verschiedener primitiver Datentypen und gibt eine hexadezimale Zeichenfolge mit 32 Zeichen zurück. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden.
minus Subtrahiert Zahlen. Subtrahiert eine Anzahl von Tagen von einem Datum. Subtrahiert die Dauer von einem Zeitstempel. Subtrahiert einen Zeitstempel vom anderen, um den Unterschied in Millisekunden zu erhalten. Entspricht dem Operator „-“.
mod Führt einen Modulo für ein Zahlenpaar aus. Entspricht dem Operator „%“.
multiply Multipliziert ein Paar Zahlen. Entspricht dem Operator „*“.
negate Negiert eine Zahl. Wandelt positive Zahlen in negative um (und umgekehrt).
nextSequence Gibt die nächste eindeutige Folge zurück. Die Zahl ist nur innerhalb einer Partition aufeinanderfolgend, und ihr ist die Partitions-ID (partitionId) vorangestellt.
normalize Normalisiert den Zeichenfolgenwert zum Trennen von Unicode-Akzentzeichen.
not Logischer Negationsoperator.
notEquals Operator für Vergleich auf Ungleichheit. Entspricht dem Operator „!=“.
null Gibt einen NULL-Wert zurück. Verwenden Sie die Funktion syntax(null()), wenn eine Spalte mit dem Namen „null“ vorhanden ist. Jeder Vorgang, in dem dieser Ausdruck verwendet wird, hat als Ergebnis NULL.
or Logischer OR-Operator. Entspricht „||“.
pMod Führt einen positiven Modulo für ein Zahlenpaar aus.
partitionId Gibt die aktuelle Partitions-ID zurück, in der sich die Eingabezeile befindet.
power Potenziert eine Zahl um den Potenzwert einer anderen.
radians Konvertiert Grad in Radiant
random Gibt eine Zufallszahl mit einem optionalen Seed innerhalb einer Partition zurück. Der Seed sollte ein fester Wert sein und wird zusammen mit der partitionId zum Erzeugen von Zufallswerten verwendet.
regexExtract Extrahiert eine übereinstimmende Teilzeichenfolge anhand eines angegebenen RegEx-Musters. Der letzte Parameter identifiziert die Übereinstimmungsgruppe und ist standardmäßig 1, wenn er nicht angegeben ist. `<regex>` (invertiertes Hochkomma) stimmt mit einer Zeichenfolge ohne Escapezeichen überein.
regexMatch Überprüft, ob die Zeichenfolge mit dem angegebenen RegEx-Muster übereinstimmt. `<regex>` (invertiertes Hochkomma) stimmt mit einer Zeichenfolge ohne Escapezeichen überein.
regexReplace Ersetzt alle Vorkommen eines RegEx-Musters durch eine andere Teilzeichenfolge in der angegebenen Zeichenfolge. `<regex>` (invertiertes Hochkomma) stimmt mit einer Zeichenfolge ohne Escapezeichen überein.
regexSplit Unterteilt eine Zeichenfolge anhand eines Trennzeichens basierend auf einem regulären Ausdruck und gibt ein Array mit Zeichenfolgen zurück.
replace Ersetzt alle Vorkommen einer Teilzeichenfolge durch eine andere Teilzeichenfolge in der angegebenen Zeichenfolge. Wenn der letzte Parameter weggelassen wird, wird standardmäßig eine leere Zeichenfolge angegeben.
reverse Kehrt eine Zeichenfolge um.
right Extrahiert eine Teilzeichenfolge mit einer Anzahl von Zeichen von rechts. Entspricht SUBSTRING(str, LENGTH(str) - n, n).
rlike Überprüft, ob die Zeichenfolge mit dem angegebenen RegEx-Muster übereinstimmt.
round Rundet eine Zahl mit optional angegebenen Dezimalstellen und einem optionalen Rundungsmodus. Wenn die Dezimalstellen nicht angegeben sind, lautet der Standardwert 0. Wenn der Modus nicht angegeben ist, wird standardmäßig ROUND_HALF_UP(5) verwendet. Die Werte für die Rundung umfassen
rpad Füllt die Zeichenfolge nach rechts mit der angegebenen Auffüllung bis zu einer bestimmten Länge auf. Ist die Zeichenfolge größer oder gleich der Länge, wird sie auf die Länge gekürzt.
rtrim Entfernt nachgestellte Zeichen aus einer Zeichenfolge. Wenn der zweite Parameter nicht angegeben ist, werden Leerstellen entfernt. Andernfalls werden Zeichen entfernt, die im zweiten Parameter angegeben sind.
sha1 Berechnet den SHA-1-Hash einer Gruppe von Spalten verschiedener primitiver Datentypen und gibt eine hexadezimale Zeichenfolge mit 40 Zeichen zurück. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden.
sha2 Berechnet den SHA-2-Hash einer Gruppe von Spalten verschiedener primitiver Datentypen mit einer angegebenen Bitlänge, die nur die Werte 0 (256), 224, 256, 384, 512 aufweisen kann. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden.
sin Berechnet einen Sinuswert.
sinh Berechnet einen hyperbolischen Sinuswert.
soundex Ruft den Code soundex für die Zeichenfolge ab.
split Unterteilt eine Zeichenfolge basierend auf einem Trennzeichen und gibt ein Array mit Zeichenfolgen zurück.
sqrt Berechnet die Quadratwurzel einer Zahl.
startsWith Überprüft, ob die Zeichenfolge mit der angegebenen Zeichenfolge beginnt.
substring Extrahiert eine Teilzeichenfolge mit einer bestimmten Länge ab einer Position. Die Position basiert auf 1. Wenn die Länge nicht angegeben ist, wird standardmäßig bis zum Ende der Zeichenfolge extrahiert.
substringIndex Extrahiert die Teilzeichenfolge vor den count-Vorkommen des Trennzeichens. Wenn count positiv ist, wird alles links vom letzten Trennzeichen (von links gezählt) zurückgegeben. Wenn count negativ ist, wird alles rechts vom letzten Trennzeichen (von rechts gezählt) zurückgegeben.
tan Berechnet einen Tangenswert.
tanh Berechnet einen hyperbolischen Tangenswert.
translate Ersetzt eine Gruppe von Zeichen durch eine andere Gruppe von Zeichen in der Zeichenfolge. Zeichen werden 1:1 ersetzt.
trim Entfernt vorangestellte und nachgestellte Zeichen aus einer Zeichenfolge. Wenn der zweite Parameter nicht angegeben ist, werden Leerstellen entfernt. Andernfalls werden Zeichen entfernt, die im zweiten Parameter angegeben sind.
true Gibt immer den Wert TRUE zurück. Verwenden Sie die Funktion syntax(true()), wenn eine Spalte mit dem Namen „true“ vorhanden ist.
typeMatch Stimmt mit dem Typ der Spalte überein. Kann nur in Musterausdrücken verwendet werden. „number“ stimmt mit „short“, „integer“, „long“, „double“, „float“ oder „decimal“ überein, „integral“ stimmt mit „short“, „integer“ oder „long“ überein, „fractional“ stimmt mit „double“, „float“ oder „decimal“ überein, und „datetime“ stimmt mit „date“ oder „timestamp“ überein.
unescape Entfernt die Escapezeichen einer Zeichenfolge entsprechend einem Format. Literalwerte für zulässige Formate sind „json“, „xml“, „ecmascript“, „html“ und „java“.
upper Wandelt eine Zeichenfolge in Großschreibung um.
uuid Gibt die generierte UUID zurück.
xor Logischer XOR-Operator. Entspricht dem Operator „^“.