DAMMSUG

Rensa filer som är associerade med en tabell. Det finns olika versioner av det här kommandot för Apache Spark och delta tabeller.

Vakuum en spark-tabell

Med rekursivt vakuum kataloger som är kopplade till Spark-tabellen och ta bort icke allokerade filer som är äldre än ett kvarhållning tröskelvärde. Standard tröskelvärdet är 7 dagar. Azure Databricks utlöser automatiskt VACUUM åtgärder när data skrivs. Se Rensa ej allokerade filer.

Syntax

VACUUM [ table_identifier | path] [RETAIN num HOURS]
  • table_identifier

    [database_name.] table_name: Ett tabell namn, eventuellt kvalificerat med ett databas namn.

  • sökväg

    Sökväg till tabellens filer.

  • KVARHÅLL antal timmar

    Tröskelvärdet för kvarhållning.

Vakuum a delta tabell (delta Lake på Azure Databricks)

Rekursivt vakuum kataloger som är kopplade till delta tabellen och ta bort datafiler som inte längre är i det senaste läget för transaktions loggen för tabellen och som är äldre än ett kvarhållning tröskelvärde. Filerna tas bort enligt den tid de har tagits bort logiskt från Deltaens transaktions logg + kvarhållningsperiod, inte deras ändrings tids stämplingar i lagrings systemet. Standard tröskelvärdet är 7 dagar. Azure Databricks utlöser inte automatiskt VACUUM åtgärder i delta tabeller. Se ta bort filer som inte längre refereras till av en delta tabell.

Om du kör VACUUM i en delta tabell förlorar du kapacitets tiden tillbaka till en tidigare version än den angivna data lagrings perioden.

VACUUM table_identifier [RETAIN num HOURS] [DRY RUN]
  • table_identifier

    • [database_name.] table_name: Ett tabell namn, eventuellt kvalificerat med ett databas namn.
    • delta.`<path-to-table>`: Platsen för en befintlig delta tabell.
  • KVARHÅLL antal timmar

    Tröskelvärdet för kvarhållning.

  • TORR KÖRNING

    Returnera en lista över filer som ska tas bort.