Hitta storleken på en tabell

Den här artikeln förklarar hur du hittar storleken på en tabell.

Kommandot är beroende av om du försöker hitta storleken på en delta tabell eller en tabell som inte är i ändrings läge.

Storlek på en delta tabell

Du kan använda ett Apache Spark SQL-kommando för att hitta storleken på en delta tabell.

import com.databricks.sql.transaction.tahoe._
val deltaLog = DeltaLog.forTable(spark, "dbfs:/<path-to-delta-table>")
val snapshot = deltaLog.snapshot               // the current delta table snapshot
println(s"Total file size (bytes): ${deltaLog.snapshot.sizeInBytes}"

Storlek på en icke-delta tabell

Du kan fastställa storleken på en icke-delta tabell genom att beräkna den totala summan av de enskilda filerna i den underliggande katalogen.

Du kan också använda queryExecution.analyzed.stats för att returnera storleken.

spark.read.table("<non-delta-table-name>").queryExecution.analyzed.stats