REFRESH CACHE

Gilt für:Häkchen Databricks Runtime

Macht alle zwischengespeicherten Daten (und die zugehörigen Metadaten) im Apache Spark-Cache für alle Datasets, die den angegebenen Datenquellenpfad enthalten, ungültig und aktualisiert sie. Der Pfadabgleich erfolgt anhand des Präfixes. / macht würde somit alles, was zwischengespeichert wird, ungültig machen.

Weitere Informationen zum Aktualisieren der Daten in Streamingtabellen und materialisierten Sichten finden Sie unter REFRESH (MATERIALIZED VIEW und STREAMING TABLE).

Syntax

REFRESH resource_path

Unter Datenträgercache verglichen mit Spark-Cache finden Sie Unterschiede zwischen Datenträgercaching und dem Apache Spark-Cache.

Parameter

  • resource_path

    Der Pfad der Ressource, die aktualisiert werden soll.

Beispiele

-- The Path is resolved using the datasource's File Index.
> CREATE TABLE test(ID INT) using parquet;
> INSERT INTO test SELECT 1000;
> CACHE TABLE test;
> INSERT INTO test SELECT 100;
> REFRESH "hdfs://path/to/table";