CACHE SELECT

Gäller för:markerad ja Databricks Runtime

Kommentar

I SQL-lager eller i Databricks Runtime 14.2 och senare ignoreras funktionen CACHE SELECT .

Cachelagrar data som nås av den angivna enkla SELECT frågan i diskcachen. Du kan välja en delmängd av kolumner som ska cachelagras genom att ange en lista med kolumnnamn och välja en delmängd av rader genom att ange ett predikat. På så sätt kan efterföljande frågor undvika att skanna de ursprungliga filerna så mycket som möjligt. Den här konstruktionen gäller endast för Delta-tabeller och Parquet-tabeller. Vyer stöds också, men de utökade frågorna är begränsade till enkla frågor enligt beskrivningen ovan.

Syntax

CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]

Se Diskcache jämfört med Spark-cache för skillnaderna mellan diskcachelagring och Apache Spark-cachen.

Parametrar

Exempel

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3