Общие сведения о моделях использования кэша

Модели использования кэша позволяют настроить хранение файлов в Azure HPC Cache для ускорения рабочего процесса.

Основные понятия кэширования файлов

Кэширование файлов служит для ускоренного выполнения клиентских запросов в Azure HPC Cache. Для этого используются следующие основные методики.

  • Кэширование чтения — в Azure HPC Cache хранятся копии файлов, запрашиваемых клиентами из системы хранения. Когда клиент снова запрашивает тот же файл, версия этого файла извлекается из HPC Cache, а не из серверной системы хранения. Запросы на запись передаются в систему хранилища внутреннего сервера.

  • Кэширование записи — при необходимости в Azure HPC Cache можно сохранить копии любых измененных файлов, отправленных с компьютеров клиента. Если несколько клиентов вносят изменения в один и тот же файл в течение короткого периода, все изменения будут сопоставлены в кэше. Это избавляет от необходимости записывать в серверную систему хранения каждое изменение по отдельности. Если в течение указанного времени в файл не будут внесены изменения, он переносится в долгосрочную систему хранения.

  • Таймер проверки — параметр таймера проверки определяет, насколько часто кэш сравнивает локальную копию файла с удаленной версией в серверной системе хранилища. Если копия на сервере новее, чем кэшированная копия, удаленная копия будет извлечена из кэша и сохранена для будущих запросов.

    Параметр таймера проверки показывает, когда кэш автоматически сравнивает свои файлы с исходными файлами в удаленном хранилище. Тем не менее можно принудительно использовать Azure HPC Cache для сравнения файлов путем выполнения операции с каталогом, включающей запрос readdirplus. Readdirplus — это стандартный API NFS (он также называется расширенным чтением), который возвращает метаданные каталога, что приводит к сравнению и обновлению файлов в кэше.

  • Таймер обратной записи — для кэша с кэшированием чтения и записи таймер обратной записи — это максимальное время в секундах, которое кэш ожидает до копирования измененного файла в систему хранилища внутреннего сервера.

Модели использования, встроенные в Azure HPC Cache, имеют разные значения для этих параметров, что позволяет выбрать оптимальное сочетание для конкретной ситуации.

Выбор правильной модели использования для рабочего процесса

Необходимо выбрать модель использования для каждого целевого расположения хранилища, использующего протокол NFS. Целевые объекты хранилища BLOB-объектов Azure имеют встроенную модель использования, которую нельзя изменить.

Модели использования кэша HPC Cache позволяют уравновесить скорость реагирования и риск получения устаревших данных. Чтобы оптимизировать скорость чтения файлов, можно отказаться от сверки файлов в кэше и файлов на сервере. С другой стороны, если вы хотите убедиться, что файлы всегда актуальны в удаленном хранилище, выберите модель и установите таймер проверки на низкое число, чтобы проверка часто.

Ниже перечислены варианты моделей использования.

  • Кэширование только для чтения. Используйте этот параметр, если требуется ускорить доступ на чтение к файлам. Выберите этот параметр, если рабочий процесс включает минимальные операции записи, такие как 0% до 5%.

    При выборе этой модели выполняется кэширование операции чтения клиента, но не операций записи. Записывает данные в внутреннее хранилище.

    Файлы, хранящиеся в кэше, не сравниваются автоматически с файлами на томе хранилища NFS. (Ознакомьтесь с описанием таймера проверки выше, чтобы узнать, как сравнить их вручную.)

    При выборе параметра кэширования только для чтения можно изменить таймер проверки. Значение по умолчанию — 30 секунд. Значение должно быть целым числом (без десятичных знаков) от 1 до 31536000 секунд (1 год) включительно.

  • Кэширование чтения и записи. Этот параметр кэширует операции чтения и записи. При использовании этого параметра большинство клиентов, как ожидается, будут получать доступ к файлам через Azure HPC Cache, а не подключать внутреннее хранилище напрямую. Кэшированные файлы содержат последние изменения, которые еще не были скопированы в хранилище на сервере.

    В этой модели использования файлы в кэше по умолчанию проверка только для файлов в серверном хранилище каждые восемь часов. Предполагается, что кэшированная версия файла является более актуальной. Измененный файл в кэше записывается в серверную систему хранения после того, как он был в кэше в течение часа по умолчанию.

    При выборе параметра кэширования чтения и записи можно изменить таймер проверки и таймер обратной записи. Значение таймера проверки по умолчанию — 28 800 секунд (8 часов). Значение должно быть целым числом (без десятичных разрядов) от 1 до 31536000 включительно. Значение таймера обратной записи по умолчанию составляет 3600 секунд (1 час). Значение должно быть целым числом (без десятичных знаков) от 1 до 31536000 секунд (1 год) включительно.

В приведенной ниже таблице перечислены различия в моделях использования

Модель использования Режим кэширования Таймер проверки Таймер обратной записи
Кэширование только для чтения Чтение 30 секунд нет
Кэширование чтения и записи Чтение/запись 8 часов 1 ч

Предупреждение

Изменение моделей использования приводит к нарушению работы службы. Клиенты HPC Cache не получат ответы во время перехода модели использования. Если необходимо изменить модели использования, рекомендуется внести изменения во время запланированного периода обслуживания, чтобы предотвратить нарушение работы клиента.

Если у вас есть вопросы о выборе наилучшей модели использования для рабочего процесса Azure HPC Cache, обратитесь к представителю Azure или отправьте запрос в службу поддержки.

Совет

Служебная программа доступна для записи отдельных файлов обратно в целевой объект хранилища без записи всего содержимого кэша. Дополнительные сведения о скрипте flush_file.py в настройке обратной записи файлов в Azure HPC Cache.

Следующие шаги