CACHE (Delta Lake i Azure Databricks)

Cachelagrar data som nås av den angivna enkla SELECT frågan i delta- cachen. Du kan välja en delmängd med kolumner som ska cachelagras genom att tillhandahålla en lista med kolumn namn och välja en delmängd av raderna genom att tillhandahålla ett predikat. Detta gör att efterföljande frågor kan undvika genomsökning av de ursprungliga filerna så mycket som möjligt. Den här konstruktionen gäller endast för Parquet-tabeller. Vyer stöds också, men de utökade frågorna är begränsade till enkla frågor, enligt beskrivningen ovan.

Syntax

CACHE SELECT column_name[, column_name, ...] FROM table_identifier [ WHERE boolean_expression ]

Se delta-och Apache Spark-cachelagring för skillnaderna mellan RDD-cache och Databricks IO-cache.

  • table_identifier
    • [database_name.] table_name: Ett tabell namn, eventuellt kvalificerat med ett databas namn.
    • delta.<Sök väg till tabell> : platsen för en befintlig delta tabell.

Exempel

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3