共用方式為


cloud_files_state table-valued 函式

適用於:檢查標示為是 Databricks SQL 檢查標示為是 Databricks Runtime 11.3 LTS 和更新版本

傳回自動載入器或 read_files 數據流的檔案層級狀態。

語法

cloud_files_state( { TABLE ( table_name ) | checkpoint } )

引數

  • table_name:由 寫入read_files之串流數據表的標識碼。 名稱不得包含時態規格。 適用於 Databricks Runtime 13.3 LTS 和更新版本。
  • checkpoint:常 STRING 值。 使用自動載入器來源之數據流的檢查點目錄。 請參閱 什麼是自動載入器?

傳回

傳回具有下列架構的數據表:

  • path STRING NOT NULL PRIMARY KEY

    檔案的路徑。

  • size BIGINT NOT NULL

    以位元組為單位的檔案大小。

  • create_time TIMESTAMP NOT NULL

    建立檔案的時間。

  • discovery_time TIMESTAMP NOT NULL

    重要

    這項功能處於個人預覽版狀態。 若要試用,請洽詢您的 Azure Databricks 連絡人。

    探索到檔案的時間。

  • commit_time TIMESTAMP

    重要

    這項功能處於個人預覽版狀態。 若要試用,請洽詢您的 Azure Databricks 連絡人。

    檔案在處理后認可到檢查點的時間。 NULL 如果尚未處理檔案,則為 。 可能會處理檔案,但稍後可能會任意標示為已認可。 將檔案標示為已認可表示自動載入器不需要檔案再次處理。

  • archive_time TIMESTAMP

    重要

    這項功能處於個人預覽版狀態。 若要試用,請洽詢您的 Azure Databricks 連絡人。

    封存盤案的時間。 NULL 如果檔案尚未封存,則為 。

  • source_id STRING

    串流查詢中自動載入器來源的標識碼。 這個值適用於 '0' 從單一雲端物件存放區位置擷取的數據流。

權限

您需要具備:

範例

-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
  /some/input/path
  /other/input/path

-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
  /some/input/path
  /other/input/path

-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
  /some/input/path
  /other/input/path