CACHE SELECT

Van toepassing op:vinkje als ja aan Databricks Runtime

Notitie

In SQL-warehouses of in Databricks Runtime 14.2 en hoger wordt de functie CACHE SELECT genegeerd.

Slaat de gegevens in de cache op die worden geopend door de opgegeven eenvoudige SELECT query in de schijfcache. U kunt een subset kolommen kiezen die in de cache moeten worden opgeslagen door een lijst met kolomnamen op te geven en een subset van rijen te kiezen door een predicaat op te geven. Hierdoor kunnen volgende query's voorkomen dat de oorspronkelijke bestanden zoveel mogelijk worden gescand. Deze constructie is alleen van toepassing op Delta-tabellen en Parquet-tabellen. Weergaven worden ook ondersteund, maar de uitgebreide query's zijn beperkt tot de eenvoudige query's, zoals hierboven beschreven.

Syntaxis

CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]

Zie Schijfcache versus Spark-cache voor de verschillen tussen schijfcache en de Apache Spark-cache.

Parameters

  • Table_name

    Identificeert een bestaande tabel. De naam mag geen tijdelijke specificatie bevatten.

Voorbeelden

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3