Functions

Se aplica a:casilla marcada como Sí Databricks Runtime

Spark SQL proporciona dos características de función para satisfacer una amplia gama de necesidades: funciones integradas y funciones definidas por el usuario (UDF).

Para obtener información sobre la resolución de funciones y la invocación de función, consulte: Invocación de función.

Funciones integradas

En este artículo se presentan los usos y descripciones de categorías de funciones integradas usadas con frecuencia para agregaciones, matrices y mapas, fechas y marcas de tiempo y datos JSON.

Funciones definidas por el usuario de SQL y Python

Las funciones definidas por el usuario de SQL y Python (UDF) son funciones que puede definir usted mismo y que pueden devolver valores escalares o conjuntos de resultados.

Consulte CREATE FUNCTION (SQL, Python) para saber más.

Funciones externas definidas por el usuario

Las UDF le permiten definir sus propias funciones cuando las funciones integradas del sistema no son suficientes para realizar la tarea deseada. Para usar las UDF, primero defina la función, registre la función con Spark y, por último, llame a la función registrada. Una UDF puede actuar en una sola fila o actuar en varias filas a la vez. Spark SQL también admite la integración de implementaciones existentes de Hive de UDF, funciones de agregado definidas por el usuario (UDAF) y funciones de tabla definidas por el usuario (UDTF).