CACHE (Azure Databricks’te Delta Lake)

Belirtilen basit sorgu tarafından erişilen verileri SELECT Delta önbelleğinde önbelleğe alan. Sütun adlarının listesini sağlayarak önbelleğe alınecek sütunların bir alt kümesini seçebilir ve bir gereklilik sağlayarak satırların bir alt kümesini seçebilirsiniz. Bu, sonraki sorguların mümkün olduğunca özgün dosyaları taramayı önlemelerini sağlar. Bu yapı yalnızca Parquet tabloları için geçerlidir. Görünümler de de desteklenmemektedir, ancak genişletilmiş sorgular yukarıda açıklandığı gibi basit sorgularla sınırlıdır.

Syntax

CACHE SELECT column_name[, column_name, ...] FROM table_identifier [ WHERE boolean_expression ]

RDD önbelleği Apache Spark Databricks IO önbelleği arasındaki farklar için bkz. Delta ve Apache Spark önbelleği.

  • table_identifier
    • [database_name.] table_name: İsteğe bağlı olarak bir veritabanı adıyla nitelikli bir tablo adı.
    • delta.`<path-to-table>`: Mevcut Delta tablonun konumu.

Örnekler

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3