CACHE SELECT

项目
04/22/2024

适用于：勾选“是” Databricks Runtime

注意

在 SQL 仓库或 Databricks Runtime 14.2 及更高版本中，将忽略 CACHE SELECT 函数。

在磁盘缓存中缓存由指定的简单 SELECT 查询访问的数据。可以通过提供列名称列表来选择要缓存的列的子集，并通过提供谓词来选择行的子集。这使得后续查询可以尽可能避免扫描原始文件。此构造仅适用于 Delta 表和 Parquet 表。如上所述，还支持视图，但扩展的查询仅限于简单查询。

语法

CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]

请参阅磁盘缓存与Spark 缓存，了解磁盘缓存和 Apache Spark 缓存之间的差异。

参数

table_name

标识现有表。名称不得包含时态规范。

示例

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3