CACHE SELECT

Gilt für:Häkchen Databricks Runtime

Hinweis

In SQL-Warehouses oder in Databricks Runtime 14.2 und höher wird die CACHE SELECT-Funktion ignoriert.

Speichert die Daten zwischen, auf die von der angegebenen einfachen SELECT-Abfrage im Datenträgercache zugegriffen wird. Sie können eine Teilmenge von Spalten auswählen, die zwischengespeichert werden soll, indem Sie eine Liste von Spaltennamen bereitstellen und mithilfe eines Prädikats eine Teilmenge von Zeilen auswählen. Dies ermöglicht nachfolgende Abfragen wodurch eine Überprüfung der Originaldateien so weit wie möglich vermieden wird. Dieses Konstrukt ist nur auf Delta- und Parquet-Tabellen anwendbar. Ansichten werden ebenfalls unterstützt, doch die erweiterten Abfragen sind auf die oben beschriebenen einfachen Abfragen beschränkt.

Syntax

CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]

Unter Datenträgercache verglichen mit Spark-Cache finden Sie Unterschiede zwischen Datenträgercaching und dem Apache Spark-Cache.

Parameter

Beispiele

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3