瞭解快取使用模型

快取使用模型可讓您自定義 Azure HPC Cache 儲存檔案的方式,以加速工作流程。

基本檔案快取概念

檔案快取是 Azure HPC Cache 加速用戶端要求的方式。 它會使用這些基本作法:

  • 讀取快取 - Azure HPC Cache 會保留用戶端向記憶體系統要求的檔案複本。 下次用戶端要求相同的檔案時,HPC Cache 可以在快取中提供版本,而不必再次從後端記憶體系統擷取檔案。 寫入要求會傳遞至後端記憶體系統。

  • 寫入快 取 - 選擇性地,Azure HPC Cache 可以儲存從用戶端電腦傳送的任何變更檔案複本。 如果多個客戶端在短時間內對同一個檔案進行變更,快取可以收集快取中的所有變更,而不必個別寫入後端記憶體系統。 在指定的時間量沒有變更之後,快取會將檔案移至長期儲存系統。

  • 驗證定時器 - 驗證定時器 設定會決定快取與其本機檔案複本與後端儲存系統上遠端版本的比較頻率。 如果後端復本比快取複本還新,快取會擷取遠端複本,並儲存它以供日後要求使用。

    驗證定時器設定會顯示快取 何時會自動 比較其檔案與遠端記憶體中的來源檔案。 不過,您可以執行包含 readdirplus 要求的目錄作業,強制 Azure HPC Cache 比較檔案。 Readdirplus 是傳回目錄元數據的標準 NFS API(也稱為擴充讀取),這會導致快取比較和更新檔案。

  • 回寫定時器 - 對於具有讀寫快取的快取,回寫定時器 是快取在將變更的檔案複製到後端記憶體系統之前等待的時間上限。

Azure HPC Cache 內建的使用模型對於這些設定有不同的值,因此您可以為您的情況選擇最佳組合。

為您的工作流程選擇正確的使用模型

您必須為每個您使用的 NFS 通訊協定記憶體目標選擇使用模型。 Azure Blob 記憶體目標具有無法自定義的內建使用模型。

HPC Cache 使用模型可讓您選擇如何平衡快速回應與取得過時數據的風險。 如果您想要優化讀取檔案的速度,您可能不在乎快取中的檔案是否針對後端檔案進行檢查。 另一方面,如果您想要確定檔案一律與遠端記憶體保持最新狀態,請選擇模型,並將驗證定時器設定為低數位以經常檢查。

以下是使用模型選項:

  • 唯讀 快取 - 如果您想要加速檔案的讀取存取,請使用此選項。 當您的工作流程涉及最少的寫入作業時,請選擇此選項,例如 0% 到 5%。

    此選項會快取用戶端讀取,但不會快取寫入。 寫入會傳遞至後端記憶體。

    儲存在快取中的檔案不會自動與 NFS 記憶體磁碟區上的檔案進行比較。 (請閱讀上述驗證定時器的描述,以瞭解如何手動比較它們。

    選擇 [只讀快取 ] 選項時,您可以變更 [驗證定時器]。 預設值為 30 秒。 此值必須是介於 1 到 31536000 秒(1 年)之間的整數(無小數點)。

  • 讀寫快 取 - 此選項會快取讀取和寫入作業。 使用此選項時,大部分的用戶端都預期會透過 Azure HPC Cache 存取檔案,而不是直接掛接後端記憶體。 快取的檔案將會有尚未複製到後端的最新變更。

    在此使用模型中,快取中的檔案預設只會每隔八小時針對後端記憶體上的檔案進行檢查。 檔案的快取版本會假設為較目前的版本。 快取中修改過的檔案預設會在快取中一小時后寫入後端記憶體系統。

    選擇 讀寫快 取選項時,您可以同時變更驗證定時器和回寫定時器。 驗證定時器預設值為28,800秒(8小時)。 值必須是介於 1 到 31536000 之間的整數(不含小數點)。 回寫定時器預設值為3600秒(1小時)。 此值必須是介於 1 到 31536000 秒(1 年)之間的整數(無小數點)。

下表會摘要說明使用量模型的差異:

使用量模型 快取模式 驗證定時器 回寫定時器
唯讀快取 參閱 30 秒
讀寫快取 讀取/寫入 8 小時 1 小時

警告

變更使用模型會導致服務中斷。 使用模型轉換時,HPC Cache 用戶端將不會收到回應。 如果您必須變更使用模型,建議您在排程維護期間進行變更,以避免客戶端中斷。

如果您有關於 Azure HPC Cache 工作流程最佳使用模型的問題,請與您的 Azure 代表交談,或開啟支援要求以取得協助。

提示

公用程式可用來將特定個別檔案寫入記憶體目標,而不需寫入整個快取內容。 在 Azure HPC Cache 中自定義檔案回寫中深入瞭解flush_file.py腳本。

下一步