Funkciók
A következőre vonatkozik: yes Databricks Runtime
A Spark SQL két funkciófunkciót biztosít a sokféle igény kielégítéséhez: a beépített függvényeket és a felhasználó által definiált függvényeket (UDF-eket).
A függvényfeloldással és a függvényhívással kapcsolatos további információkért lásd: Függvényhívás.
Beépített függvények
Ez a cikk az aggregációhoz, tömbökhöz és térképekhez, dátumokhoz és időbélyegekhez, valamint JSON-adatokhoz gyakran használt beépített függvények kategóriáinak használatát és leírását mutatja be.
Felhasználó által definiált SQL- és Python-függvények
Az SQL- és Python-felhasználó által definiált függvények (UDF-ek) olyan függvények, amelyek skaláris értékeket vagy eredményhalmazokat adhatnak vissza.
További információt a CREATE FÜGGVÉNY (SQL, Python) című témakörben talál.
Külső felhasználó által definiált függvények
Az UDF-ek lehetővé teszik saját függvények meghatározását, ha a rendszer beépített függvényei nem elegendőek a kívánt feladat végrehajtásához. Az UDF-ek használatához először definiálja a függvényt, majd regisztrálja a függvényt a Sparkban, végül hívja meg a regisztrált függvényt. Az UDF-k egyetlen sorban vagy egyszerre több sorban is működhetnek. A Spark SQL támogatja az UDF-ek, a felhasználó által definiált összesítő függvények (UDAF) és a felhasználó által definiált táblafüggvények (UDTF) meglévő Hive-implementációinak integrálását is.