CACHE SELECT (Delta Lake a Azure Databricks)

Gyorsítótárazza a megadott egyszerű lekérdezés által elért adatokat SELECT a SELECT A gyorsítótárazni kívánt oszlopok egy részhalmazát kiválaszthatja az oszlopnevek listájának megszűrése és a sorok egy részhalmazának predikátum megszabadása alapján. Ez lehetővé teszi a további lekérdezések számára az eredeti fájlok lehető legnagyobb vizsgálatának elkerülését. Ez a szerkezet csak a Parquet-táblákra vonatkozik. A nézetek is támogatottak, de a kibontott lekérdezések a fent leírt egyszerű lekérdezésekre korlátozódnak.

Syntax

CACHE SELECT column_name[, column_name, ...] FROM table_identifier [ WHERE boolean_expression ]

A Delta-Apache Spark és a gyorsítótárazás közötti különbségeket a Delta és a Apache Spark gyorsítótárazásban.

  • table_identifier
    • [database_name.] table_name: Táblanév, igény szerint adatbázisnévvel is megszabadulva.
    • delta.`<path-to-table>`: Egy meglévő Delta-tábla helye.

Példák

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3