CACHE (Delta Lake v Azure Databricks)

Uloží data, ke kterým se přistupovalo pomocí zadaného jednoduchého SELECT dotazu, do mezipaměti rozdílové mezipaměti. Můžete vybrat podmnožinu sloupců, které se mají ukládat do mezipaměti, a poskytnout tak seznam názvů sloupců a vybrat podmnožinu řádků zadáním predikátu. Tím umožníte, aby se v dalších dotazech nekontrolovaly původní soubory co nejvíce. Tato konstrukce se vztahuje pouze na tabulky Parquet. Zobrazení jsou také podporována, ale rozšířené dotazy jsou omezeny na jednoduché dotazy, jak je popsáno výše.

Syntax

CACHE SELECT column_name[, column_name, ...] FROM table_identifier [ WHERE boolean_expression ]

Rozdíly mezi mezipamětí RDD a vstupně-výstupní mezipaměti datacihly najdete v tématu ukládání rozdílových a Apache Spark do mezipaměti .

  • table_identifier
    • [database_name.] table_name: Název tabulky, volitelně kvalifikovaný s názvem databáze.
    • delta.`<path-to-table>`: Umístění existující rozdílové tabulky.

Příklady

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3