Cachevälj (Delta Lake på Azure Databricks)

CACHE SELECT column_name[, column_name, ...] FROM [db_name.]table_name [ WHERE boolean_expression ]

Cachelagrade data som nås av den angivna enkla SELECT frågan i Delta-cachen. Du kan välja en delmängd av kolumner som ska cachelagras genom att ange en lista med kolumnnamn och välja en delmängd av rader genom att ange ett predikat. På så sätt kan efterföljande frågor undvika att genomsöka de ursprungliga filerna så mycket som möjligt. Den här konstruktionen gäller endast för Parquet-tabeller. Vyer stöds också, men de utökade frågorna är begränsade till enkla frågor, enligt beskrivningen ovan.

Se Delta- och Apache Spark-cachelagring för skillnaderna mellan RDD-cachen och Databricks IO-cachen.

Exempel

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3