Funkcja encode

Dotyczy:check marked yes Databricks SQL check marked yes Databricks Runtime

Zwraca binarną reprezentację ciągu przy użyciu charSet kodowania znaków.

Składnia

encode(expr, charSet)

Argumenty

  • exprSTRING: wyrażenie, które ma być zakodowane.
  • charSetSTRING: wyrażenie określające kodowanie.

Zwroty

Klasa BINARY.

Obsługiwane są następujące kodowania zestawu znaków (bez uwzględniania wielkości liter):

  • 'US-ASCII': Siedem-bitowe ASCII, ISO646-US.
  • 'ISO-8859-1': alfabet łaciński ISO nr 1, ISO-LATIN-1.
  • 'UTF-8': Ośmio bitowy format przekształcenia UCS.
  • 'UTF-16BE': Szesnaście-bitowy format przekształcenia UCS, kolejność bajtów big-endian.
  • 'UTF-16LE': Szesnaście-bitowy format przekształcenia UCS, mała kolejność bajtów.
  • 'UTF-16': Szesnaście-bitowy format przekształcenia UCS, kolejność bajtów zidentyfikowana przez opcjonalny znacznik kolejności bajtów.

Przykłady

-- Wrap encode in hex to normalize UI dependent BINARY output.
> SELECT hex(encode('Spark SQL', 'UTF-16'));
 FEFF0053007000610072006B002000530051004C

> SELECT hex(encode('Spark SQL', 'US-ASCII'));
537061726B2053514C

> SELECT decode(X'FEFF0053007000610072006B002000530051004C', 'UTF-16')
 Spark SQL