캐시 테이블
적용 대상: Databricks Runtime으로 표시됨
Apache Spark 캐시에서 지정된 스토리지 수준으로 테이블 또는 쿼리의 출력 내용을 캐시합니다. 쿼리가 캐시되면 이 쿼리에 대한 임시 보기가 만들어집니다. 이렇게 하면 이후 쿼리에서 원래 파일의 검색이 줄어듭니다.
구문
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
디스크 캐싱과 Apache Spark 캐시 간의 차이점은 자동 및 수동 캐싱을 참조하세요.
매개 변수
게으른
테이블을 처음 사용할 때만 즉시 캐시합니다.
-
캐시할 델타 테이블 또는 뷰를 식별합니다. 이름에 임시 사양이 포함되어서는 안됩니다. 테이블을 찾을 수 없는 경우 Azure Databricks에서 TABLE_OR_VIEW_NOT_FOUND 오류가 발생합니다.
OPTIONS( 'storageLevel' [ = ] value )
OPTIONS
키 및 값 쌍이 있는storageLevel
절입니다. 이외의 키를storageLevel
사용할 때 경고가 발생합니다. 에 대한storageLevel
유효한 옵션은 다음과 같습니다.NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
에 대해 잘못된 값이 설정
storageLevel
되면 예외가 throw됩니다. 가 절을 사용하여OPTIONS
명시적으로 설정되지 않은 경우storageLevel
기본값storageLevel
은 로MEMORY_AND_DISK
설정됩니다.쿼리
캐시할 행을 생성하는 쿼리입니다. 다음 형식 중 하나일 수 있습니다.
- 문
SELECT
- 문
TABLE
- 문
FROM
- 문
예
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;