Cache (Delta Lake on Azure Databricks)CACHE (Delta Lake on Azure Databricks)

CACHE SELECT column_name[, column_name, ...] FROM [db_name.]table_name [ WHERE boolean_expression ]

Zwischenspeichern der Daten, auf die durch die angegebene einfache SELECT Abfrage im Delta Cachezugegriffen wird.Cache the data accessed by the specified simple SELECT query in the Delta cache. Sie können eine Teilmenge von Spalten auswählen, die zwischengespeichert werden sollen, indem Sie eine Liste mit Spaltennamen bereitstellen und eine Teilmenge der Zeilen auswählen, indem Sie ein Prädikat bereitstellen.You can choose a subset of columns to be cached by providing a list of column names and choose a subset of rows by providing a predicate. Dies ermöglicht nachfolgende Abfragen, um zu vermeiden, dass die ursprünglichen Dateien so weit wie möglich gescannt werden.This enables subsequent queries to avoid scanning the original files as much as possible. Dieses Konstrukt gilt nur für Parkett Tabellen.This construct is applicable only to Parquet tables. Sichten werden ebenfalls unterstützt, aber die erweiterten Abfragen sind auf einfache Abfragen beschränkt, wie oben beschrieben.Views are also supported, but the expanded queries are restricted to the simple queries, as described above.

Unter Unterschiede zwischen dem RDD-Cache und dem databricks IO-Cache finden Sie unter Delta-und Apache Spark Caching .See Delta and Apache Spark caching for the differences between the RDD cache and the Databricks IO cache.

BeispieleExamples

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3