cloud_files_state
table-valued 函式
適用於: Databricks SQL Databricks Runtime 11.3 LTS 和更新版本
傳回自動載入器或 read_files
數據流的檔案層級狀態。
語法
cloud_files_state( { TABLE ( table_name ) | checkpoint } )
引數
- table_name:由 寫入
read_files
之串流數據表的標識碼。 名稱不得包含時態規格。 適用於 Databricks Runtime 13.3 LTS 和更新版本。 checkpoint
:常STRING
值。 使用自動載入器來源之數據流的檢查點目錄。 請參閱 什麼是自動載入器?。
傳回
傳回具有下列架構的數據表:
path STRING NOT NULL PRIMARY KEY
檔案的路徑。
size BIGINT NOT NULL
以位元組為單位的檔案大小。
create_time TIMESTAMP NOT NULL
建立檔案的時間。
discovery_time TIMESTAMP NOT NULL
重要
這項功能處於個人預覽版狀態。 若要試用,請洽詢您的 Azure Databricks 連絡人。
探索到檔案的時間。
commit_time TIMESTAMP
重要
這項功能處於個人預覽版狀態。 若要試用,請洽詢您的 Azure Databricks 連絡人。
檔案在處理后認可到檢查點的時間。
NULL
如果尚未處理檔案,則為 。 可能會處理檔案,但稍後可能會任意標示為已認可。 將檔案標示為已認可表示自動載入器不需要檔案再次處理。archive_time TIMESTAMP
重要
這項功能處於個人預覽版狀態。 若要試用,請洽詢您的 Azure Databricks 連絡人。
封存盤案的時間。
NULL
如果檔案尚未封存,則為 。source_id STRING
串流查詢中自動載入器來源的標識碼。 這個值適用於
'0'
從單一雲端物件存放區位置擷取的數據流。
權限
您需要具備:
OWNER
如果使用串流數據表標識符,則為串流數據表的許可權。READ FILES
如果在外部位置下 提供檢查點,則為檢查點位置的許可權。
範例
-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
/some/input/path
/other/input/path
-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
/some/input/path
/other/input/path
-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
/some/input/path
/other/input/path
相關文章
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應