캐시 테이블

적용 대상:검사 예 Databricks Runtime으로 표시됨

Apache Spark 캐시에서 지정된 스토리지 수준으로 테이블 또는 쿼리의 출력 내용을 캐시합니다. 쿼리가 캐시되면 이 쿼리에 대한 임시 보기가 만들어집니다. 이렇게 하면 이후 쿼리에서 원래 파일의 검색이 줄어듭니다.

구문

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

디스크 캐싱과 Apache Spark 캐시 간의 차이점은 자동 및 수동 캐싱을 참조하세요.

매개 변수

  • 게으른

    테이블을 처음 사용할 때만 즉시 캐시합니다.

  • Table_name

    캐시할 델타 테이블 또는 뷰를 식별합니다. 이름에 임시 사양이 포함되어서는 안됩니다. 테이블을 찾을 수 없는 경우 Azure Databricks에서 TABLE_OR_VIEW_NOT_FOUND 오류가 발생합니다.

  • OPTIONS( 'storageLevel' [ = ] value )

    OPTIONS 키 및 값 쌍이 있는 storageLevel 절입니다. 이외의 키를 storageLevel 사용할 때 경고가 발생합니다. 에 대한 storageLevel 유효한 옵션은 다음과 같습니다.

    • NONE
      • DISK_ONLY
      • DISK_ONLY_2
      • MEMORY_ONLY
      • MEMORY_ONLY_2
      • MEMORY_ONLY_SER
      • MEMORY_ONLY_SER_2
      • MEMORY_AND_DISK
      • MEMORY_AND_DISK_2
      • MEMORY_AND_DISK_SER
      • MEMORY_AND_DISK_SER_2
      • OFF_HEAP

    에 대해 잘못된 값이 설정 storageLevel되면 예외가 throw됩니다. 가 절을 사용하여 OPTIONS 명시적으로 설정되지 않은 경우 storageLevel 기본값 storageLevel 은 로 MEMORY_AND_DISK설정됩니다.

  • 쿼리

    캐시할 행을 생성하는 쿼리입니다. 다음 형식 중 하나일 수 있습니다.

    • SELECT
    • TABLE
    • FROM

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;