CACHE (Delta Lake no Azure Databricks)

Caches os dados acedidos pela consulta simples especificada SELECT na cache Delta. Pode escolher um subconjunto de colunas a serem emconsecados fornecendo uma lista de nomes de colunas e escolher um subconjunto de linhas fornecendo um predicado. Isto permite que as consultas subsequentes evitem digitalizar os ficheiros originais tanto quanto possível. Esta construção aplica-se apenas às tabelas Parquet. As vistas também são apoiadas, mas as consultas expandidas são restritas às consultas simples, como descrito acima.

Syntax

CACHE SELECT column_name[, column_name, ...] FROM table_identifier [ WHERE boolean_expression ]

Consulte a Delta e a Apache Spark para as diferenças entre a cache RDD e a cache Descricks IO.

  • table_identifier
    • [database_name.] table_name: Nome de mesa, opcionalmente qualificado com nome de base de dados.
    • delta.<>de caminho a mesa: A localização de uma tabela Delta existente.

Exemplos

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3