클라우드 계층화 개요

Azure 파일 동기화의 선택적 기능인 클라우드 계층화는 온-프레미스 파일 서버의 성능을 유지하면서 필요한 로컬 스토리지의 양을 줄입니다.

이 기능을 사용하도록 설정하면 자주 액세스하는(핫) 파일만 로컬 서버에 저장됩니다. 자주 액세스하지 않는(쿨) 파일은 네임스페이스(파일 및 폴더 구조)와 파일 콘텐츠로 분할됩니다. 네임스페이스는 로컬로 저장되고, 파일 콘텐츠는 클라우드의 Azure 파일 공유에 저장됩니다.

사용자가 계층화된 파일을 열면 Azure 파일 동기화에서 Azure 파일 공유의 파일 데이터를 원활하게 회수합니다.

클라우드 계층화 작동 방법

클라우드 계층화 정책

클라우드 계층화를 사용하도록 설정할 때 쿨 파일을 계층화하는 시기를 Azure 파일 동기화에 알리기 위해 사용 가능한 볼륨 공간 정책날짜 정책이라는 두 가지 정책을 설정할 수 있습니다.

사용 가능한 볼륨 공간 정책

사용 가능한 볼륨 공간 정책은 로컬 디스크에서 일정 공간을 차지하는 경우 쿨 파일을 클라우드에 계층화하도록 Azure 파일 동기화에 지시합니다.

예를 들어 로컬 디스크 용량이 200GiB이고 40GiB 이상의 로컬 디스크 용량을 항상 사용 가능한 상태로 유지하려면 사용 가능한 볼륨 공간 정책을 20%로 설정해야 합니다. 사용 가능한 볼륨 공간은 개별 디렉터리 또는 서버 엔드포인트 수준이 아니라 볼륨 수준에서 적용됩니다.

날짜 정책

날짜 정책을 사용하는 경우 쿨 파일은 x일 동안 액세스(즉, 읽기 또는 쓰기)되지 않은 경우 클라우드에 계층화됩니다. 예를 들어 15일 넘게 액세스하지 않은 파일이 일반적으로 보관 파일인 경우 날짜 정책을 15일로 설정해야 합니다.

날짜 정책과 사용 가능한 볼륨 공간 정책이 함께 작동하는 방법에 대한 자세한 예는 Azure 파일 동기화 클라우드 계층화 정책 선택을 참조하세요.

Windows Server 데이터 중복 제거

데이터 중복 제거는 Windows Server 2016부터 클라우드 계층화가 사용하도록 설정된 볼륨에서 지원됩니다. 자세한 내용은 Azure 파일 동기화 배포 계획을 참조하세요.

클라우드 계층화 열 지도

Azure 파일 동기화 시간이 지남에 따라 파일 액세스(읽기 및 쓰기 작업)를 모니터링하고 파일에 액세스하는 최근 및 빈도에 따라 모든 파일에 열 점수를 할당합니다. 이러한 점수를 사용하여 각 서버 엔드포인트에서 네임스페이스의 "열 지도"를 빌드합니다. 이 열 지도는 클라우드 계층화가 사용하도록 설정된 위치에서 열 점수를 기준으로 정렬된 모든 동기화 파일의 목록입니다. 최근에 열고 자주 액세스한 파일은 핫 파일로 간주하고, 거의 건드리지 않은 채 한동안 액세스하지 않은 파일은 쿨 파일로 간주합니다.

해당 열 지도에서 개별 파일의 상대 위치를 결정하기 위해 시스템에서 최대 타임스탬프를 MAX(마지막 액세스 시간, 마지막 수정한 시간, 만든 시간) 순서로 사용합니다.

일반적으로 마지막 액세스 시간을 추적하여 사용할 수 있습니다. 그러나 클라우드 계층화가 사용하도록 설정된 새 서버 엔드포인트가 만들어지면 파일 액세스를 관찰할 시간이 충분히 제공되지 않습니다. 유효한 마지막 액세스 시간이 없는 경우 마지막 수정 시간을 대신 사용하여 열 지도의 상대 위치를 평가합니다.

날짜 정책은 동일한 방식으로 작동합니다. 마지막 액세스 시간이 없는 경우 날짜 정책이 마지막 수정 시간에 적용됩니다. 이를 사용할 수 없는 경우 파일을 만든 시간으로 대체됩니다. 시간이 지남에 따라 시스템은 더 많은 파일 액세스 요청을 관찰하고 자체적으로 추적되는 마지막 액세스 시간을 자동으로 사용하기 시작합니다.

참고 항목

클라우드 계층화는 마지막 액세스 시간을 추적하는 NTFS 기능을 사용하지 않습니다. 이 NTFS 기능은 기본적으로 해제되어 있으며, 성능 고려 사항으로 인해 이 기능을 수동으로 사용하도록 설정하지 않는 것이 좋습니다. 클라우드 계층화는 마지막 액세스 시간을 별도로 추적합니다.

자동 관리 회수

파일이 만들어지거나 수정되면 파일을 지정한 서버로 자동으로 회수할 수 있습니다. 자동 관리 회수를 통해 지정된 각 서버에서 새 파일 또는 수정된 파일을 쉽게 사용할 수 있습니다.

미국과 인도에 지사를 두고 있는 다국적 기업을 예로 들어 보겠습니다. 정보 근로자는 새 프로젝트를 위해 오전(미국 시간 기준)에 새 폴더와 파일을 만들고 하루 종일 작업합니다. Azure 파일 동기화는 폴더 및 파일을 Azure 파일 공유(클라우드 엔드포인트)와 동기화합니다. 인도의 정보 근로자는 자신의 표준 시간대에 따라 프로젝트 작업을 계속합니다. 아침에 도착하면 인도 팀이 로컬 캐시에서 효율적으로 작업할 수 있도록 로컬 Azure 파일 동기화가 사용하도록 설정된 인도의 서버가 이러한 새 파일을 로컬에서 사용할 수 있어야 합니다. 이 모드를 사용하도록 설정하면 Azure 파일 공유에서 파일을 변경하거나 만드는 즉시 사전에 파일을 회수하여 파일 액세스 시간이 향상됩니다.

서버로 회수된 파일이 로컬에서 필요하지 않은 경우 불필요한 회수로 인해 송신 트래픽과 비용이 늘어날 수 있습니다. 따라서 클라우드의 최근 변경 내용을 사용하여 서버의 캐시를 미리 채우면 해당 서버의 파일을 사용하는 사용자 또는 애플리케이션에 긍정적인 영향을 준다고 알고 있는 경우에만 자동 관리 회수를 사용하도록 설정합니다.

자동 관리 회수를 사용하도록 설정하면 서버에서 대역폭 사용량이 증가할 수 있으며, 회수되는 파일의 증가로 인해 로컬 서버의 다른 비교적 새로운 콘텐츠가 적극적으로 계층화될 수 있습니다. 따라서 계층화되는 파일이 서버에서 핫 파일로 간주할 경우 너무 빨리 계층화되면 더 많은 회수가 발생할 수 있습니다.

자동 관리 회수에 대한 자세한 내용은 Azure 파일 동기화 배포를 참조하세요.

계층화된 파일 및 로컬에 캐시된 파일의 동작

클라우드 계층화는 네임스페이스(파일/폴더 계층 구조 및 파일 속성)와 파일 콘텐츠를 분리하는 것입니다.

계층화된 파일

계층화된 파일의 경우 파일 콘텐츠 자체가 로컬로 저장되지 않으므로 디스크의 크기는 0입니다. 파일이 계층화되는 경우 Azure 파일 동기화 파일 시스템 필터(StorageSync.sys)에서 로컬로 파일을 포인터(재분석 지점)로 바꿉니다. 재분석 지점은 Azure 파일 공유의 파일에 대한 URL을 나타냅니다. 계층화된 파일의 경우 NTFS에서 offline 특성과 FILE_ATTRIBUTE_RECALL_ON_DATA_ACCESS 특성이 모두 설정되므로 타사 애플리케이션이 계층화된 파일을 안전하게 식별할 수 있습니다.

A screenshot of a file's properties when it is tiered - namespace only.

로컬에 캐시된 파일

온-프레미스 파일 서버에 저장된 파일의 경우 전체 파일(파일 속성 + 파일 콘텐츠)이 로컬에 저장되므로 디스크의 크기는 파일의 논리적 크기와 거의 같습니다.

A screenshot of a file's properties when it is not tiered - namespace + file content.

파일을 부분적으로 계층화할 수 있습니다(또는 부분적으로 회수). 부분적으로 계층화된 파일에서는 파일 일부만 디스크에 저장됩니다. 파일에 대한 스트리밍 액세스를 지원하는 애플리케이션에서 파일을 부분적으로 읽는 경우 볼륨에서 파일을 부분적으로 회수했을 수 있습니다. 멀티미디어 플레이어 및 zip 유틸리티를 예로 들 수 있습니다. Azure 파일 동기화는 효율적하며 연결된 Azure 파일 공유에서 요청된 정보만 회수합니다.

참고 항목

크기는 파일의 논리적 크기를 나타냅니다. 디스크의 크기는 디스크에 저장된 파일 스트림의 물리적 크기를 나타냅니다.

디스크 공간 부족 모드

서버 엔드포인트가 있는 디스크는 클라우드 계층화를 사용하도록 설정한 경우에도 다양한 이유로 인해 공간이 부족할 수 있습니다. 그 이유는 다음과 같습니다.

  • 서버 엔드포인트 경로 외부의 디스크에 수동으로 복사되는 데이터
  • 느리거나 지연된 동기화로 인해 파일이 계층화되지 않음
  • 계층화된 파일의 과도한 회수

디스크 공간이 부족하면 Azure 파일 동기화가 제대로 작동하지 않고 사용할 수 없게 될 수도 있습니다. Azure 파일 동기화가 이러한 발생을 완전히 방지하는 것은 불가능하지만, 디스크 공간 부족 모드(15.1부터 Azure 파일 동기화 에이전트 버전에서 사용 가능)는 서버 엔드포인트가 이러한 상황에 도달하지 못하도록 하고 서버가 이러한 상황에서 더 빨리 벗어나는 데 도움이 되도록 설계되었습니다.

클라우드 계층화가 사용하도록 설정된 서버 엔드포인트의 경우 볼륨의 여유 공간이 계산된 임계값 아래로 떨어지면 볼륨은 디스크 공간 부족 모드에 있는 것입니다.

디스크 공간 부족 모드에서 Azure 파일 동기화 에이전트는 두 가지 작업을 다르게 수행합니다.

  • 자동 관리 계층화: 이 모드에서 파일 동기화 에이전트는 파일을 보다 사전에 클라우드로 계층화합니다. 동기화 에이전트는 매시간의 일반 빈도 대신 매 분마다 계층화되는 파일을 확인합니다. 볼륨 사용 가능한 공간 정책 계층화는 일반적으로 전체 업로드가 완료될 때까지 초기 업로드 동기화 중에 발생하지 않습니다. 그러나 디스크 공간 부족 모드에서는 초기 업로드 동기화 중에 계층화가 사용하도록 설정되며, 개별 파일이 Azure 파일 공유에 업로드되면 파일 계층화에 대해 고려됩니다.

  • 비영구 회수: 사용자가 계층화된 파일을 열면 Azure 파일 공유에서 회수된 파일이 디스크에 직접 유지되지 않습니다. Invoke-StorageSyncFileRecall cmdlet에서 시작한 회수는 이 규칙의 예외이며 디스크에 유지됩니다.

사용 가능한 볼륨 공간이 임계값을 초과하면 Azure 파일 동기화가 자동으로 정상 상태로 되돌아갑니다. 디스크 공간 부족 모드는 클라우드 계층화가 사용하도록 설정된 서버에만 적용되며 항상 사용 가능한 볼륨 공간 정책을 준수합니다.

볼륨에 계층화가 사용하도록 설정된 서버 엔드포인트와 계층화가 활성화되지 않은 서버 엔드포인트가 두 개 있는 경우 디스크 공간 부족 모드는 계층화가 사용하도록 설정된 서버 엔드포인트에만 적용됩니다.

디스크 공간 부족 모드에 대한 임계값은 어떻게 계산되나요?

다음 세 개 숫자 중 최소값을 사용하여 임계값을 계산합니다.

  • 볼륨 크기의 10%(GiB)
  • 사용 가능한 볼륨 공간 정책(GiB)
  • 20GiB

다음 표에는 임계값을 계산하는 방법과 볼륨이 디스크 공간 부족 모드인 경우에 대한 몇 가지 예제가 포함되어 있습니다.

볼륨 크기 볼륨 크기의 10% 사용 가능한 볼륨 공간 정책 임계값 = 최소(볼륨 크기의 10%, 사용 가능한 볼륨 공간 정책, 20GB) 현재 사용 가능한 볼륨 공간 디스크 공간 부족 모드인가요? 원인
100GiB 10GiB 7%(7GiB) 7GiB = 최소(10GiB, 7GiB, 20GiB) 9%(9GiB) 아니요 현재 사용 가능한 볼륨 공간(9GiB) > 임계값(7GiB)
100GiB 10GiB 7%(7GiB) 7GiB = 최소(10GiB, 7GiB, 20GiB) 5%(5GiB) 현재 사용 가능한 볼륨 공간(5GiB) < 임계값(7GiB)
300GiB 30GiB 8%(24GiB) 20GiB = 최소(30GiB, 24GiB, 20GiB) 7%(21GiB) 아니요 현재 사용 가능한 볼륨 공간(21GiB) > 임계값(20GiB)
300GiB 30GiB 8%(24GiB) 20GiB = 최소(30GiB, 24GiB, 20GiB) 6%(18GiB) 현재 사용 가능한 볼륨 공간(18GiB) < 임계값(20GiB)

디스크 공간 부족 모드는 사용 가능한 볼륨 공간 정책과 어떻게 함께 작동하나요?

디스크 공간 부족 모드는 항상 사용 가능한 볼륨 공간 정책을 따릅니다. 임계값 계산은 사용자가 설정한 사용 가능한 볼륨 공간 정책을 준수하도록 설계되었습니다.

서버 엔드포인트가 디스크 부족 모드인 가장 일반적인 원인은 무엇인가요?

디스크 부족 모드의 주요 원인은 계층화 사용 서버 엔드포인트가 있는 디스크로 대량의 데이터를 복사하거나 이동하는 것입니다.

디스크 공간 부족 모드에서 벗어나려면 어떻게 해야 할까요?

서버 엔드포인트에서 디스크 부족 모드를 종료하는 두 가지 방법은 다음과 같습니다.

  1. 디스크 부족 모드는 개입 없이 회수를 지속하지 않고 파일을 더 자주 계층화하여 자동으로 정상 동작으로 전환됩니다.
  2. 볼륨 크기를 늘리거나 서버 엔드포인트 외부의 공간을 확보하여 수동으로 프로세스 속도를 높일 수 있습니다.

서버가 디스크 공간 부족 모드인지 확인하는 방법은 무엇인가요?

  • 서버 엔드포인트가 디스크 부족 모드인 경우 서버 엔드포인트의 오류 + 문제 해결 탭의 클라우드 계층화 상태 섹션에 있는 Azure Portal에 표시됩니다.
  • 이벤트 ID 19000은 각 서버 엔드포인트에 대해 1분마다 원격 분석 이벤트 로그에 기록됩니다. 이 이벤트를 사용하여 서버 엔드포인트가 디스크 부족 모드인지 확인합니다(IsLowDiskMode = true). 원격 분석 이벤트 로그는 Applications 및 Services\Microsoft\FileSync\Agent 아래 이벤트 뷰어에 있습니다.

다음 단계