Buscar el tamaño de una tabla

En este artículo se explica cómo encontrar el tamaño de una tabla.

El comando que se usa depende de si está intentando encontrar el tamaño de una tabla Delta o una tabla no Delta.

Tamaño de una tabla Delta

Para encontrar el tamaño de una tabla Delta, puede usar un comando SQL Apache Spark.

import com.databricks.sql.transaction.tahoe._
val deltaLog = DeltaLog.forTable(spark, "dbfs:/<path-to-delta-table>")
val snapshot = deltaLog.snapshot               // the current delta table snapshot
println(s"Total file size (bytes): ${deltaLog.snapshot.sizeInBytes}"

Tamaño de una tabla no Delta

Puede determinar el tamaño de una tabla no Delta calculando la suma total de los archivos individuales dentro del directorio subyacente.

También puede usar queryExecution.analyzed.stats para devolver el tamaño.

spark.read.table("<non-delta-table-name>").queryExecution.analyzed.stats