DAMMSUG
Rensa filer som är associerade med en tabell. Det finns olika versioner av det här kommandot för Apache Spark och delta tabeller.
Vakuum en spark-tabell
Med rekursivt vakuum kataloger som är kopplade till Spark-tabellen och ta bort icke allokerade filer som är äldre än ett kvarhållning tröskelvärde. Standard tröskelvärdet är 7 dagar. Azure Databricks utlöser automatiskt VACUUM
åtgärder när data skrivs. Se Rensa ej allokerade filer.
Syntax
VACUUM [ table_identifier | path] [RETAIN num HOURS]
table_identifier
[database_name.] table_name
: Ett tabell namn, eventuellt kvalificerat med ett databas namn.sökväg
Sökväg till tabellens filer.
KVARHÅLL antal timmar
Tröskelvärdet för kvarhållning.
Vakuum a delta tabell (delta Lake på Azure Databricks)
Rekursivt vakuum kataloger som är kopplade till delta tabellen och ta bort datafiler som inte längre är i det senaste läget för transaktions loggen för tabellen och som är äldre än ett kvarhållning tröskelvärde.
Filerna tas bort enligt den tid de har tagits bort logiskt från Deltaens transaktions logg + kvarhållningsperiod, inte deras ändrings tids stämplingar i lagrings systemet.
Standard tröskelvärdet är 7 dagar. Azure Databricks utlöser inte automatiskt VACUUM
åtgärder i delta tabeller. Se ta bort filer som inte längre refereras till av en delta tabell.
Om du kör VACUUM
i en delta tabell förlorar du kapacitets tiden tillbaka till en tidigare version än den angivna data lagrings perioden.
VACUUM table_identifier [RETAIN num HOURS] [DRY RUN]
table_identifier
[database_name.] table_name
: Ett tabell namn, eventuellt kvalificerat med ett databas namn.delta.`<path-to-table>`
: Platsen för en befintlig delta tabell.
KVARHÅLL antal timmar
Tröskelvärdet för kvarhållning.
TORR KÖRNING
Returnera en lista över filer som ska tas bort.