Megosztás a következőn keresztül:


Funkciók

A következőre vonatkozik: yes Databricks Runtime jelölésű ellenőrzés

A Spark SQL két funkciófunkciót biztosít a sokféle igény kielégítéséhez: a beépített függvényeket és a felhasználó által definiált függvényeket (UDF-eket).

A függvényfeloldással és a függvényhívással kapcsolatos további információkért lásd: Függvényhívás.

Beépített függvények

Ez a cikk az aggregációhoz, tömbökhöz és térképekhez, dátumokhoz és időbélyegekhez, valamint JSON-adatokhoz gyakran használt beépített függvények kategóriáinak használatát és leírását mutatja be.

Felhasználó által definiált SQL- és Python-függvények

Az SQL- és Python-felhasználó által definiált függvények (UDF-ek) olyan függvények, amelyek skaláris értékeket vagy eredményhalmazokat adhatnak vissza.

További információt a CREATE FÜGGVÉNY (SQL, Python) című témakörben talál.

Külső felhasználó által definiált függvények

Az UDF-ek lehetővé teszik saját függvények meghatározását, ha a rendszer beépített függvényei nem elegendőek a kívánt feladat végrehajtásához. Az UDF-ek használatához először definiálja a függvényt, majd regisztrálja a függvényt a Sparkban, végül hívja meg a regisztrált függvényt. Az UDF-k egyetlen sorban vagy egyszerre több sorban is működhetnek. A Spark SQL támogatja az UDF-ek, a felhasználó által definiált összesítő függvények (UDAF) és a felhasználó által definiált táblafüggvények (UDTF) meglévő Hive-implementációinak integrálását is.