CACHE (Delta Lake sur Azure Databricks)CACHE (Delta Lake on Azure Databricks)

CACHE SELECT column_name[, column_name, ...] FROM [db_name.]table_name [ WHERE boolean_expression ]

Met en cache les données accessibles par la SELECT requête simple spécifiée dans le cache Delta.Cache the data accessed by the specified simple SELECT query in the Delta cache. Vous pouvez choisir un sous-ensemble de colonnes à mettre en cache en fournissant une liste de noms de colonnes et en choisissant un sous-ensemble de lignes en fournissant un prédicat.You can choose a subset of columns to be cached by providing a list of column names and choose a subset of rows by providing a predicate. Cela permet aux requêtes suivantes d’éviter d’analyser les fichiers d’origine le plus possible.This enables subsequent queries to avoid scanning the original files as much as possible. Cette construction s’applique uniquement aux tables parquet.This construct is applicable only to Parquet tables. Les vues sont également prises en charge, mais les requêtes développées sont limitées aux requêtes simples, comme décrit ci-dessus.Views are also supported, but the expanded queries are restricted to the simple queries, as described above.

Consultez la page mise en cache Delta et Apache Spark pour connaître les différences entre le cache RDD et le cache d’e/s Databricks.See Delta and Apache Spark caching for the differences between the RDD cache and the Databricks IO cache.

ExemplesExamples

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3