SELEÇÃO DA CACHE
Aplica-se a: do SQL do Databricks Databricks Runtime
Coloca em cache os dados acedidos pela consulta simples SELECT
especificada na cache do disco.
Pode escolher um subconjunto de colunas a colocar em cache ao fornecer uma lista de nomes de colunas e escolher um subconjunto de linhas ao fornecer um predicado.
Isto permite que as consultas subsequentes evitem analisar os ficheiros originais o máximo possível.
Esta construção é aplicável apenas a tabelas Delta e tabelas Parquet.
As vistas também são suportadas, mas as consultas expandidas estão restritas às consultas simples, conforme descrito acima.
Sintaxe
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
Veja Colocação em cache automática e manual para ver as diferenças entre a colocação em cache do disco e a cache do Apache Spark.
Parâmetros
-
Identifica uma tabela existente. O nome não pode incluir uma especificação temporal.
Exemplos
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3