CACHE (Delta Lake sur Azure Databricks)

Met en cache les données accessibles par la requête simple spécifiée SELECT dans le cache Delta. Vous pouvez choisir un sous-ensemble de colonnes à mettre en cache en fournissant une liste de noms de colonnes et en choisissant un sous-ensemble de lignes en fournissant un prédicat. Cela permet aux requêtes suivantes d’éviter d’analyser les fichiers d’origine le plus possible. Cette construction s’applique uniquement aux tables parquet. Les vues sont également prises en charge, mais les requêtes développées sont limitées aux requêtes simples, comme décrit ci-dessus.

Syntaxe

CACHE SELECT column_name[, column_name, ...] FROM table_identifier [ WHERE boolean_expression ]

Consultez la page mise en cache Delta et Apache Spark pour connaître les différences entre le cache Delta et le cache Apache Spark.

  • table_identifier
    • [database_name.] table_name: Un nom de table, éventuellement qualifié avec un nom de base de données.
    • delta.`<path-to-table>`: L’emplacement d’une table Delta existante.

Exemples

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3