Azure NetApp Files에 SAS Grid 9.4 배포

Azure NetApp Files
Azure Virtual Machines

SAS 분석 소프트웨어는 데이터로부터 인사이트를 획득하여 지능형 결정을 내리는 데 사용할 수 있는 서비스 및 도구 모음을 제공합니다. SAS 솔루션은 분석, 인공 지능, 비즈니스 인텔리전스, 고객 인텔리전스, 데이터 관리, 사기 및 보안 인텔리전스를 제공합니다.

SAS Grid on Azure를 배포하는 경우, Azure NetApp Files실행 가능한 기본 스토리지 옵션입니다. Azure NetApp Files의 확장 가능한 서비스를 사용하는 경우 서비스를 중단하지 않고 언제든지 스토리지 할당을 확장하거나 축소할 수 있습니다. 스토리지 서비스 수준을 성능 요구 사항에 맞춰 동적으로 조정할 수도 있습니다.

SAS는 Microsoft가 검증한 다음과 같은 기본 플랫폼을 제공합니다.

  • SAS Grid 9.4
  • SAS Viya

SAS Grid 9.4는 Linux에서 유효성을 검사했습니다.

이 문서는 SASDATA 스토리지용 Azure NetApp Files를 사용하여 SAS Grid 9.4 on Azure를 실행하는 일반 정보를 제공합니다. 또한 SASWORK의 스토리지 옵션에 대한 지침을 제공합니다. 이 지침은 자체 테넌트의 Azure에서 자체 SAS 솔루션을 호스트한다는 가정에 기반합니다. SAS는 SAS Grid on Azure를 호스트하지 않습니다.

아키텍처

SAS Grid on Azure를 실행하는 아키텍처를 보여주는 다이어그램.

이 문서에서 모든 다이어그램의 PowerPoint 파일을 다운로드합니다.

데이터 흐름

컴퓨팅 계층은 SASDATA(및 선택적으로 SASWORK) 볼륨을 사용하여 그리드 간에 데이터를 공유합니다. SASDATA는 Azure NetApp Files의 NFS 연결 볼륨입니다.

  • 컴퓨팅 노드는 SASDATA에서 입력 데이터를 읽고 SASDATA에 결과를 다시 씁니다.
  • 분석 작업의 후속 부분은 컴퓨팅 계층의 다른 노드에서 실행할 수 있습니다. 동일한 절차를 사용하여 처리해야 하는 정보를 가져와서 저장합니다.

잠재적인 사용 사례

Azure NetApp Files를 사용하는 확장성 있는 SAS Grid 배포는 다음과 같은 사용 사례에 적용할 수 있습니다.

  • 재무 분석
  • 부정 행위 감지
  • 멸종 위기에 처한 종의 추적 및 보호
  • 과학 및 의학
  • 분석 및 AI

스토리지 성능의 요구 사항

Azure에서 SAS 9.4(SAS Grid 또는 SAS Analytics Pro)를 배포하는 경우 Azure NetApp Files는 크기가 제한된 SAS Grid 클러스터에 대해 실행 가능한 기본 스토리지 옵션입니다. SAS는 물리적 코어당 100MiB/초의 처리량을 권장합니다. 권장 사항에 따라 SASDATA(영구 SAS 데이터 파일)용 Azure NetApp Files 볼륨을 사용하는 SAS Grid 클러스터는 여러 Azure 가상 머신에서 32~48개의 물리적 코어로 확장할 수 있습니다. SAS 클러스터 크기는 SAS 클러스터당 단일 SASDATA 네임스페이스의 아키텍처 제약 조건과 사용 가능한 단일 Azure NetApp Files 볼륨 대역폭에 기반합니다. 코어 수 지침은 시간이 지남에 따라 Azure 인프라(컴퓨팅, 네트워크 및 파일 시스템 스토리지 대역폭당)가 증가하는 대로 다시 검토됩니다.

Azure NetApp Files 볼륨 성능 기대치

단일 Azure NetApp Files 볼륨은 최대 4,500MiB/초의 읽기 및 1,500MiB/초의 쓰기를 처리할 수 있습니다. 송신 대역폭이 충분한 Azure 인스턴스 유형이 있는 경우 단일 가상 머신은 단일 Azure NetApp Files 볼륨의 모든 쓰기 대역폭을 사용할 수 있습니다. 이 중에서 가장 큰 단일 가상 머신만 단일 볼륨의 모든 읽기 대역폭을 사용할 수 있습니다.

SAS 9.4의 주요 공유 워크로드인 SASDATA의 읽기/쓰기 비율은 80:20입니다. 읽기/쓰기가 64KiB인 80:20 워크로드의 주요 볼륨당 수는 다음과 같습니다.

  • 2,400MiB/초의 읽기 처리량 및 600MiB/초의 쓰기 처리량이 동시에 실행(최대 총 3,000MiB/초).

자세한 내용은 Linux용 Azure NetApp Files 성능 벤치마크를 참조하세요.

참고

이제 Azure NetApp Files 대용량 기능을 사용할 수 있습니다. 이 기능은 일반 Azure NetApp Files 볼륨보다 더 높은 볼륨당 처리량을 제공합니다. SASDATA(또는 SASWORK) 볼륨에 더 많은 성능이 필요한 경우 이 기능을 고려할 수 있습니다. 자세한 내용은 이 설명서를 참조하세요.

용량 권장 사항

Azure NetApp Files 성능 계산기는 SASDATA 볼륨 크기를 안내합니다.

다음과 같은 이유로 적절한 서비스 수준을 선택하는 것이 중요합니다.

  • 볼륨 대역폭은 볼륨 용량에 기반합니다.
  • 용량 비용은 서비스 수준에 기반합니다.
  • 서비스 수준의 선택 항목은 용량과 대역폭 요구 사항에 기반합니다.

계산기에서 고급을 선택하고 지역을 선택한 후 다음 값을 입력합니다.

  • 볼륨 크기: 원하는 용량
  • 처리량: 코어당 100MiB/초를 고려하여 원하는 처리량
  • 읽기 비율: 80%
  • IOPS: 0
  • I/O 크기: 64KiB 순차

화면 하단에는 선택한 지역의 가격에 따라 각 서비스 수준에서 권장되는 용량 요구 사항과 월별 비용이 출력됩니다.

  • 처리량. 워크로드 조합을 기반으로 하는 볼륨의 대역폭입니다. 80%, 64KiB 순차 읽기 워크로드의 경우 예상되는 최대 처리량은 3,096MiB/초입니다.
  • IOPS 성능을 표현합니다. 지정된 처리량에서 볼륨이 제공하는 IOPS 수입니다.
  • 볼륨 크기. 필요한 처리량을 달성하기 위해 지정된 서비스 수준에서 볼륨에 필요한 용량입니다. 볼륨 용량(GiB로 보고됨)은 용량 풀 크기와 같거나 작을 수 있습니다. 이 권장 사항은 자동 QoS 용량 풀 유형을 사용한다는 가정을 기반으로 합니다. 용량 풀 내의 전체 볼륨에서 용량과 처리량 간의 분산을 더욱 최적화하려면 수동 QoS 용량 풀 유형을 고려합니다.
  • 용량 풀 크기. 풀 크기입니다. 볼륨 용량은 용량 풀에서 분할됩니다. 용량 풀의 크기는 1TiB 단위로 조정됩니다.
  • 용량 풀 비용(USD/월). 지정된 크기 및 서비스 수준에서 용량 풀의 월별 비용입니다.
  • 볼륨 쇼백(USD/월). 지정된 용량의 볼륨에 대한 월별 용량 비용입니다. 요금은 할당된 용량 풀 크기에 따라 달라집니다. 볼륨 쇼백은 볼륨 양을 나타냅니다.

참고

충분한 대역폭이 프로비전되는 한 사용자 환경은 서비스 수준에 관계없이 동일합니다.

Azure NetApp Files에서 볼륨 셰이핑을 사용하여 필요에 따라 비용을 제어합니다. 성능 및 비용에 영향을 주는 두 가지 동적 옵션을 사용할 수 있습니다.

Azure NetApp Files 비용 모델에 대해 자세히 알아봅니다.

데이터 보호

Azure NetApp Files는 스냅샷을 사용하여 데이터를 보호합니다. 스냅샷은 Azure NetApp Files 볼륨의 공간 효율적이고 크래시가 일치하며 거의 즉각적인 이미지를 제공합니다. 언제든지 수동으로 스냅샷을 만들거나 볼륨에 대한 스냅샷 정책을 사용하여 스냅샷을 예약할 수 있습니다.

스냅샷 정책을 사용하여 볼륨에 자동화된 데이터 보호를 추가합니다. 스냅샷 되돌리기 사용하여 스냅샷을 신속하게 복원할 수 있습니다. 또는 빠른 데이터 복구를 위해 스냅샷을 새 볼륨으로 복원할 수 있습니다. 새 볼륨 기능으로 복원을 사용하여 테스트/개발 환경에 현재 데이터를 제공할 수 있습니다.

데이터 보호 수준을 높이기 위해 Azure NetApp Files 백업 또는 파트너 백업 소프트웨어를 사용하는 데이터 보호 솔루션을 사용할 수 있습니다.

구성 요소

  • Azure Virtual Machines: SAS Grid에는 코어 수에 따라 적절한 비율로 높은 메모리, 스토리지 및 I/O 대역폭이 필요합니다. Azure는 메모리, 스토리지 및 I/O 대역폭의 양과 필요한 코어 수의 균형을 맞출 수 있도록 vCPU 수가 적은 미리 정의된 VM(가상 머신) 크기를 제공합니다.

    자세한 내용은 제한된 vCPU 지원 VM 크기를 참조하세요. 각 인스턴스에서 사용할 수 있는 컴퓨팅 리소스를 철저히 파악해야 합니다. Azure NetApp Files를 사용하여 SAS Grid on Azure를 실행하려면 다음 인스턴스 유형을 권장합니다.

    • Standard_E64-16ds_v4 또는 Standard_E64-16ds_v5
    • Standard_E64-32ds_v4 또는 Standard_E64-32ds_v5

    댓글의 업데이트를 포함하여 best practices for using SAS on Azure(Azure에서 SAS를 사용하는 모범 사례)를 확인해야 합니다.

  • Azure NetApp Files: 컴퓨팅 클러스터에서 공유되는 Azure NetApp Files 볼륨에 SASDATA를 저장할 수 있습니다.

    필요에 따라 SASWORK에 Azure NetApp Files NFS 볼륨을 사용할 수도 있습니다.

    Azure NetApp Files에는 세 가지의 성능 서비스 수준이 제공됩니다.

    • Standard
    • Premium
    • Ultra

    볼륨 성능은 대부분 서비스 수준으로 정의됩니다. 획득 가능한 처리량은 서비스 수준과 볼륨 크기에 따라 결정되므로 볼륨의 크기도 하나의 요인입니다.

SASDATA의 스토리지 옵션

Azure NetApp Files는 스토리지에 높은 처리량과 대기 시간이 낮은 액세스를 제공할 수 있으므로 프리미엄 디스크의 실행 가능하고 빠른 대안입니다. 네트워크 연결 스토리지는 관리 디스크와 마찬가지로 VM 수준에서 제한되지 않으므로 스토리지에 대한 처리량이 높아집니다.

Azure NetApp Files 성능 계산기로 SASDATA 용량에 필요한 계층을 예측할 수 있습니다. (고급을 선택해야 합니다.)

Azure NetApp Files NFS 볼륨은 공유되므로 이 문서의 뒷부분에서 설명하는 적절한 크기의 VM 인스턴스 유형 및 RHEL(Red Hat Enterprise Linux) 배포와 함께 사용할 경우 SASDATA를 호스트하기에 적합합니다.

SASWORK의 스토리지 옵션

다음 표는 Azure에서 SASWORK를 배포할 수 있는 가장 일반적인 스토리지 옵션을 보여 줍니다. 크기(용량) 및 속도(대역폭) 요구 사항에 따라 세 가지 옵션인 임시 스토리지, 관리 디스크 및 Azure NetApp Files 중 하나를 사용합니다.

임시 스토리지 Managed Disk Azure NetApp Files
크기 매우 큼
속도 매우 큼 중간

옵션을 선택할 때 다음 사항을 고려하세요.

  • 임시 스토리지(또는 단기 스토리지)는 대역폭이 가장 높지만 작은 크기로만 사용할 수 있습니다. (크기는 VM SKU에 따라 달라집니다.) 사용 가능한 용량과 필요한 용량에 따라 이 옵션이 가장 적합할 수 있습니다.
  • 필요한 SASWORK 용량이 선택한 VM SKU의 임시 스토리지 크기를 초과하는 경우 Azure 관리 디스크를 사용하여 SASWORK를 호스트하는 것이 좋습니다. 그러나 관리 디스크에 대한 처리량은 설정된 VM 아키텍처로 제한되며 VM SKU에 따라 달라집니다. 따라서 이 스토리지 옵션은 SASWORK 성능 요구 사항이 낮은 환경에서만 실행 가능합니다.
  • Azure 관리 디스크가 제공할 수 있는 수준보다 높은 최대 SASWORK 용량 요구 사항 및 평균 성능 요구 사항을 충족하려면 SASWORK용 Azure NetApp Files를 고려하세요. 처리량이 빠르고 크기도 큽니다.

중요

어떠한 경우에도 SASWORK를 VM 컴퓨팅 노드 간에 공유할 수 없으므로 각 컴퓨팅 노드에 대해 별도의 SASWORK 볼륨을 만들어야 합니다. 볼륨은 하나의 컴퓨팅 노드에만 NFS가 탑재되어야 합니다.

위의 표를 참조하여 요구 사항이 작거나, 크거나, 중간이거나, 매우 큰지 여부를 판별할 때 배포 규모, VM 및 코어 수, 관련 용량 및 성능 요구 사항을 고려합니다. 배포할 때마다 이러한 평가를 수행해야 합니다.

표의 옵션은 다음 아키텍처에 설명된 배포에 해당합니다. 모든 시나리오에서 SASDATA는 Azure NetApp Files NFS 볼륨에서 호스트되고 컴퓨팅 노드 간에 공유됩니다. 일부 RHEL 배포의 경우 NFS nconnect 옵션을 사용하여 볼륨에 여러 네트워크 흐름을 만드는 것이 좋습니다. 자세한 내용은 이 문서의 NFS 탑재 옵션 섹션을 참조하세요.

임시 스토리지 아키텍처

임시 스토리지 아키텍처를 보여 주는 다이어그램.

더 작은 SASWORK 용량이 필요한 경우 Azure VM 임시 스토리지는 빠르고 비용 효율적인 솔루션입니다. 이 아키텍처에서 컴퓨팅 계층의 각 VM에는 일부 임시 스토리지가 장착되어 있습니다. 사용하는 VM의 임시 스토리지 크기를 확인하려면 Azure VM 설명서를 참조하세요.

데이터 흐름

  • 컴퓨팅 노드는 SASDATA에서 입력 데이터를 읽고 SASDATA에 결과를 다시 씁니다.
  • 분석 작업의 후속 부분은 컴퓨팅 계층의 다른 노드에서 실행할 수 있습니다. 동일한 절차를 사용하여 처리해야 하는 정보를 가져와서 저장합니다.
  • 임시 작업 디렉터리 SASWORK는 공유되지 않습니다. 각 컴퓨팅 노드의 임시 스토리지에 저장됩니다.

관리 디스크 아키텍처

관리 디스크 아키텍처를 보여주는 다이어그램.

SASWORK의 용량 요구 사항이 임시 스토리지에서 사용할 수 있는 용량을 초과하는 경우 Azure 관리 디스크로 대체하는 것이 좋습니다. 관리 디스크는 다양한 크기와 성능 수준에서 사용할 수 있습니다. 자세한 내용은 VM 디스크의 확장성 및 성능 목표를 참조하세요.

데이터 흐름

  • 컴퓨팅 노드는 SASDATA에서 입력 데이터를 읽고 SASDATA에 결과를 다시 씁니다.
  • 분석 작업의 후속 부분은 컴퓨팅 계층의 다른 노드에서 실행할 수 있습니다. 동일한 절차를 사용하여 처리해야 하는 정보를 가져와서 저장합니다.
  • 임시 작업 디렉터리 SASWORK는 공유되지 않습니다. 각 컴퓨팅 노드에 연결된 관리 디스크에 저장됩니다.

Azure NetApp Files 아키텍처

Azure NetApp Files 아키텍처를 보여주는 다이어그램.

SASWORK 용량 및/또는 중간 성능 요구 사항을 높이려면 Azure NetApp Files를 사용하는 것이 좋습니다. Azure NetApp Files는 최대 100TiB의 볼륨 용량을 제공합니다. 컴퓨팅 계층의 각 노드에는 자체 SASWORK 볼륨이 있어야 합니다. 볼륨을 공유하면 안 됩니다.

데이터 흐름

  • 컴퓨팅 노드는 SASDATA에서 입력 데이터를 읽고 SASDATA에 결과를 다시 씁니다.
  • 분석 작업의 후속 부분은 컴퓨팅 계층의 다른 노드에서 실행할 수 있습니다. 동일한 절차를 사용하여 처리해야 하는 정보를 가져와서 저장합니다.
  • 임시 작업 디렉터리 SASWORK는 공유되지 않습니다. 각 컴퓨팅 노드에 연결된 개별 Azure NetApp Files 볼륨에 저장됩니다.

크기 조정 및 구성 권장 사항

  • SAS 클러스터의 인스턴스 간 데이터 트래픽의 대기 시간을 가장 적합하고 일관되게 유지하려면 모든 VM이 동일한 근접 배치 그룹에 생성되었는지 확인합니다.
  • Best Practices for Using SAS on Azure(Azure에서 SAS를 사용하는 모범 사례)의 General Tuning Guidance(일반 튜닝 지침) 섹션을 확인하세요.
  • 최적의 네트워크 대역폭을 위해 가속화된 네트워킹을 활성화합니다.

RHEL 배포 및 NFS 설정

RHEL 배포

RHEL은 Linux에서 SAS 9를 실행하는 데 권장되는 배포입니다. Red Hat에서 지원하는 각 커널에는 고유한 NFS 대역폭 제약 조건이 있습니다.

Azure에서 SAS를 실행하는 방법에 대한 구체적인 내용은 Best Practices for Using SAS on Azure(Azure에서 SAS를 사용하는 모범 사례)를 참조하세요.

SAS에는 AZURE Standard_E64-16ds_v4/와 Standard_E64 32ds_v4 또는 v5 VM이 권장됩니다. 이러한 권장 사항을 고려하여 이 섹션에서는 Azure NetApp Files로 SAS를 사용하는 몇 가지 지침을 제공합니다.

  • RHEL 7을 사용하는 경우 SASDATA의 물리적 코어 대상당 100MiB/초를 기준으로 STANDARD_E64-16ds_v4 또는 Standard_E64-16ds_v5가 가장 적합합니다.

    • Standard_E64-16ds_v4: 코어당 90~100MiB/초
    • Standard_E64-32ds_v4: 코어당 45~50MiB/초
  • RHEL 8.2를 사용하는 경우 Standard_E64-16ds_v4, Standard_E64-32ds_v4 또는 v5 VM 옵션을 사용할 수 있습니다. SASDATA의 코어 대상당 100MiB/초를 고려할 때 Standard_E64-16ds_v4가 더 적합합니다.

    • Standard_E64-16ds_v4: 코어당 150~160MiB/초
    • Standard_E64-32ds_v4: 코어당 75~80MiB/초
  • RHEL 8.3을 사용하는 경우 코어당 처리량 대상을 고려할 때 Standard_E64-16ds_v4와 Standard_E64 32ds_v4 또는 v5 VM이 모두 허용됩니다.

    • 유효성 검사는 3,200MiB/초의 읽기를 나타냅니다.
    • 이러한 결과는 NFS nconnect 탑재 옵션을 사용할 경우 나타납니다.

테스트 결과, 단일 RHEL 7 인스턴스는 단일 Azure NetApp Files 스토리지 엔드포인트(네트워크 소켓)에 대해 약 750~800MiB/초에 미치지 못하는 읽기 처리량을 기록했습니다. 64KiB의 rsizewsize NFS 탑재 옵션을 사용하는 경우 동일한 엔드포인트에 대해 1,500MiB/초의 쓰기가 가능합니다. 일부 증거에 따라 이전에 명시된 읽기 처리량 상한선은 3.10 커널의 아티팩트입니다. 자세한 내용은 RHEL CVE-2019-11477을 참조하세요.

테스트 결과, 4.18 커널이 있는 단일 RHEL 8.2 인스턴스에는 3.10 커널에 명시된 제한 사항이 없습니다. 따라서 64KiB의 rsizewsize NFS 탑재 옵션을 사용하는 경우 1,200~1,300MiB/초의 읽기 트래픽이 가능합니다. 대규모 순차 쓰기의 경우 RHEL 7과 동일하게 1500MiB/초의 처리량을 기대할 수 있습니다.

단일 RHEL 8.3 인스턴스에서 nconnect 탑재 옵션(RHEL 8.3 배포의 새로운 기능)을 사용하면 단일 Azure NetApp Files 볼륨에서 약 3,200MiB/초의 읽기 처리량을 달성할 수 있습니다. nconnect를 적용하여도 Azure NetApp Files 단일 볼륨에서는 최대 1,500MiB/초의 쓰기 처리량까지 가능합니다.

튜닝 가능한 커널 항목

슬롯 테이블 항목

NFSv3에는 클라이언트와 서버 간의 동시성을 협상하는 메커니즘이 없습니다. 클라이언트와 서버는 서로의 제한을 인식하지 못하고 각자 제한을 정의합니다. 최상의 성능을 위해 클라이언트 측 sunrpc 슬롯 테이블 항목의 최대 수를 서버의 푸시백 없이 지원되는 최대 수와 맞춰야 합니다. 클라이언트가 서버 네트워크 스택의 워크로드 처리 능력에 과부하를 일으키면 서버는 연결 윈도우 크기를 줄여 응답하며 이는 성능에 좋지 않습니다.

기본적으로 최신 Linux 커널은 연결당 sunrpc 슬롯 테이블 항목 sunrpc.max_tcp_slot_table_entries 크기를 정의하여 65,536개의 미해결 작업을 지원합니다. 이러한 슬롯 테이블 항목은 동시성의 제한을 정의합니다. Azure NetApp Files는 기본값으로 128개의 미해결 작업이 지정되므로 이렇게 높은 값은 필요하지 않습니다.

클라이언트를 동일한 수로 튜닝하는 것이 좋습니다.

  • /etc/sysctl.conf를 통해 튜닝 가능한 커널 항목
    • sunrpc.tcp_max_slot_table_entries=128

튜닝 가능한 파일 시스템 캐시 항목

튜닝 가능한 파일 시스템 캐시 항목에 대해 다음 요인도 이해해야 합니다.

  • 더티 버퍼를 플러시하면 메모리 압력이 제거될 때까지 데이터가 향후 읽기에 사용할 수 있는 깨끗한 상태로 유지됩니다.
  • 비동기 플러시 작업에는 세 가지 트리거가 있습니다.
    • 시간 기반: 버퍼가 튜닝 가능한 vm.dirty_expire_centisecs 또는 vm.dirty_writeback_centisecs 항목으로 정의된 수명에 도달하면 정리할 버퍼(플러시 또는 스토리지에 쓰기)로 표시되어야 합니다.
    • 메모리 압력: 자세한 내용은 vm.dirty_ratio | vm.dirty_bytes를 참조하세요.
    • 닫기: 파일 핸들이 닫히면 모든 더티 버퍼가 비동기적으로 스토리지에 플러시됩니다.

이러한 요인은 4개의 튜닝 가능 항목에 의해 제어됩니다. /etc/sysctl.conf 파일에서 tuned 또는 sysctl를 사용하여 튜닝 가능한 각 항목을 동적이고 영구적으로 튜닝할 수 있습니다. 이러한 변수를 튜닝하면 SAS Grid 성능이 향상됩니다.

  • 사용자 지정 튜닝된 프로필을 통해 튜닝 가능한 커널 항목
    • include = throughput-performance
    • vm.dirty_bytes = 31457280
    • vm.dirty_expire_centisecs = 100
    • vm.dirty_writeback_centisecs = 300

NFS 탑재 옵션

영구 SASDATA 파일에 사용되는 NFS 공유 파일 시스템에 다음 NFS 탑재 옵션을 사용하는 것이 좋습니다.

RHEL 7 및 8.2

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev

RHEL 8.3

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nconnect=8

SASWORK 볼륨에 다음 탑재 옵션을 사용하는 것이 좋습니다. 각 볼륨은 SASWORK에만 사용되며 노드 간에 공유되지 않습니다.

RHEL 7 및 8.2

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nocto

RHEL 8.3

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nocto,nconnect=8

nocto 탑재 옵션의 이점 및 비용에 대한 자세한 내용은 close-to-open 일관성 및 캐시 특성 타이머를 참조하세요.

또한 댓글의 모든 업데이트를 포함하여 Azure NetApp Files: A shared file system to use with SAS Grid on MS Azure(Azure NetApp Files: SAS Grid on MS Azure와 사용할 공유 파일 시스템)를 확인해야 합니다.

NFS 미리 읽기 설정

모든 RHEL 배포에 대해 튜닝 가능한 NFS 미리 읽기 항목을 15,360KiB로 설정하는 것이 좋습니다. 자세한 내용은 NFS 탑재의 미리 읽기를 영구적으로 설정하는 방법을 참조하세요.

대안

이전 아키텍처의 스토리지 솔루션은 Azure NetApp Files 서비스 수준 계약에 명시된 대로 가용성이 높습니다. 향상된 보호 및 가용성을 위해 Azure NetApp Files의 지역 간 복제를 사용하여 스토리지 볼륨을 다른 Azure 지역에 복제할 수 있습니다.

스토리지 솔루션을 통해 볼륨을 복제하면 두 가지 주요 이점이 있습니다.

  • 애플리케이션 VM에 추가 로드가 없습니다.
  • 이 솔루션을 사용하면 정상 작업 중에 대상 지역에서 VM을 실행할 필요가 없습니다.

스토리지 콘텐츠는 컴퓨팅 인프라 리소스를 사용하지 않고 복제되며 대상 지역은 SAS 소프트웨어를 실행할 필요가 없습니다. 이 시나리오에는 대상 VM을 실행할 필요가 없습니다.

다음 아키텍처는 Azure NetApp Files의 스토리지 콘텐츠가 프로덕션 데이터의 복제본으로 채워지는 스토리지의 두 번째 지역으로 복제되는 방법을 보여 줍니다. 장애 조치(failover)가 있는 경우 보조 지역이 온라인 상태가 되고 VM이 시작되어 두 번째 지역에서 프로덕션을 다시 시작할 수 있습니다. 다이어그램에 표시되지 않는 부하 분산 장치를 다시 구성하여 트래픽을 두 번째 지역으로 다시 라우팅해야 합니다.

지역 간 복제를 사용하는 아키텍처를 보여 주는 다이어그램.

이 솔루션의 일반적인 RPO는 지역 간 복제 업데이트 간격이 10분으로 설정된 경우 20분 미만입니다.

데이터 흐름

  • 컴퓨팅 노드는 SASDATA에서 입력 데이터를 읽고 SASDATA에 결과를 다시 씁니다.
  • 분석 작업의 후속 부분은 컴퓨팅 계층의 다른 노드에서 실행할 수 있습니다. 동일한 절차를 사용하여 처리해야 하는 정보를 가져와서 저장합니다.
  • 임시 작업 디렉터리 SASWORK는 공유되지 않습니다. 각 컴퓨팅 노드에 연결된 개별 Azure NetApp Files 볼륨에 저장됩니다.
  • Azure NetApp Files 지역 간 복제는 지역 재해가 발생한 경우 장애 조치(failover)를 지원하기 위해 모든 스냅샷을 포함한 SASDATA 볼륨을 DR 지역에 비동기적으로 복제합니다.

고려 사항

다음 고려 사항은 워크로드의 품질을 향상시키는 데 사용할 수 있는 지침 원칙 세트인 Azure Well-Architected Framework의 핵심 요소를 구현합니다. 자세한 내용은 Microsoft Azure Well-Architected Framework를 참조하세요.

안정성

안정성은 애플리케이션이 고객에 대한 약속을 충족할 수 있도록 합니다. 자세한 내용은 안정성 핵심 요소 개요를 참조하세요.

Azure NetApp Files는 모든 계층 및 지원되는 모든 지역에 표준 99.99% 가용성 SLA를 제공합니다. 또한 Azure NetApp Files는 선택한 가용성 영역의 볼륨 프로비전과 영역 간 HA 배포도 지원합니다.

향상된 RPO/RTO SLA를 위해 서비스에 스냅샷 및 백업을 통한 통합 데이터 보호가 함께 제공됩니다. 지역 간 복제는 전체 Azure 지역에서 동일한 이점이 있습니다.

보안

보안은 중요한 데이터 및 시스템을 고의적으로 공격하고 악용하지 못하도록 안전하게 보호합니다. 자세한 내용은 보안 요소의 개요를 참조하세요.

Azure NetApp Files는 가상 네트워크 내에서 볼륨이 프로비전되고 데이터 트래픽이 유지되므로 보안 수준이 있습니다. 공개적으로 주소를 지정할 수 있는 엔드포인트가 없습니다. 모든 미사용 데이터는 항상 암호화됩니다. 전송 중인 데이터를 선택적으로 암호화할 수 있습니다.

Azure Policy를 통해 조직 표준을 적용하고 규모에 맞게 규정 준수를 평가할 수 있습니다. Azure NetApp Files는 사용자 지정 및 기본 제공 정책을 정의하여 Azure Policy를 지원합니다.

성능 효율성

성능 효율성은 사용자가 배치된 요구 사항을 효율적인 방식으로 충족하기 위해 워크로드의 크기를 조정할 수 있는 기능입니다. 자세한 내용은 성능 효율성 핵심 요소 개요를 참조하세요.

성능

처리량 및 용량에 대한 요구 사항에 따라 다음 고려 사항에 유의하세요.

참고

이제 Azure NetApp Files 대용량 기능을 사용할 수 있습니다. 이 기능은 일반 Azure NetApp Files 볼륨보다 볼륨당 처리량이 더 높습니다. 이 기능은 SASDATA(또는 SASWORK) 볼륨에 더 많은 성능이 필요한 경우 고려할 수 있습니다. 자세한 내용은 이 설명서를 참조하세요.

확장성

SAS 솔루션의 3계층을 실행하는 확장 집합에 VM을 추가하여 컴퓨팅 성능을 쉽게 확장할 수 있습니다.

Azure NetApp Files 볼륨의 스토리지를 동적으로 조정할 수 있습니다. 자동 QoS를 사용하는 경우 성능이 동시에 조정됩니다. 각 볼륨을 보다 세부적으로 제어하려면 용량 풀에 수동 QoS를 사용하여 각 볼륨의 성능을 개별적으로 제어할 수도 있습니다.

Azure NetApp Files 볼륨은 세 가지 성능 계층인 Ultra, Premium 및 Standard가 제공됩니다. 사용 가능한 성능 대역폭이 볼륨 크기로 확장된다는 점을 고려하여 성능 요구 사항에 가장 적합한 계층을 선택합니다. 언제든지 볼륨의 서비스 수준을 변경할 수 있습니다. Azure NetApp Files 비용 모델에 대한 자세한 내용은 다음 가격 책정 예제를 참조하세요.

Azure NetApp Files 성능 계산기로 시작할 수 있습니다.

비용 최적화

비용 최적화는 불필요한 비용을 줄이고 운영 효율성을 높이는 것입니다. 자세한 내용은 비용 최적화 핵심 요소 개요를 참조하세요.

비용 모델

Azure NetApp Files 비용 모델을 이해하면 서비스 비용을 잘 관리할 수 있습니다.

Azure NetApp Files 청구는 용량 풀을 만들어 할당하는 프로비전된 스토리지 용량을 기반으로 합니다. 용량 풀은 시간당 할당된 GiB별 설정된 비용을 기준으로 매월 청구됩니다.

가변 용량 또는 성능 요구 사항 등으로 인해 용량 풀 크기 요구 사항이 변동하는 경우 볼륨 및 용량 풀의 크기를 동적으로 조정하여 비용과 용량 및 성능 요구 사항의 균형을 맞추는 것이 좋습니다.

용량 풀 크기 요구 사항이 동일하게 유지되지만 성능 요구 사항이 변동하는 경우 볼륨의 서비스 수준을 동적으로 변경하는 것이 좋습니다. 한 달 동안 다양한 유형의 용량 풀을 프로비전하거나 프로비전 해제하여 Just-In-Time 성능을 제공하고 고성능이 필요하지 않은 기간 동안에는 비용을 절감할 수 있습니다.

가격 책정

용량 및 성능 요구 사항에 따라 필요한 Azure NetApp Files 서비스 수준을 Standard, Premium 또는 Ultra 중에서 결정합니다. 그런 다음 Azure 가격 계산기를 사용하여 다음 구성 요소 비용을 계산합니다.

  • Azure의 SAS 구성 요소
  • Azure NetApp Files
  • 관리 디스크(선택 사항)
  • 가상 네트워크

운영 우수성

운영 우수성에서는 프로덕션에서 애플리케이션을 배포하고 계속 실행하는 운영 프로세스를 다룹니다. 자세한 내용은 운영 우수성 핵심 요소의 개요를 참조하세요.

SAS Grid on Azure는 유연하고 배포가 빠릅니다. 다음과 같은 몇 가지 이점이 있습니다.

  • 동적 워크로드 분산으로 변화하는 비즈니스 요구 사항 충족
  • 고가용성 SAS 컴퓨팅 환경 만들기
  • 기존 IT 인프라에서 더 빠른 결과 얻기
  • 컴퓨팅 리소스가 점진적이로 비용 효율적으로 증가
  • 모든 분석 워크로드 관리
  • 사일로 서버 또는 다중 PC 환경에서 SAS Grid 환경으로 쉽게 전환

시나리오 배포

IaC(Infrastructure as Code) 프로세스를 사용하여 워크로드를 배포하는 것이 가장 좋습니다. SAS 워크로드는 수동 배포에서 자주 발생하는 잘못된 구성에 민감할 수 있으며 생산성이 저하될 수 있습니다.

SAS Grid on Azure 솔루션을 설계하려면 SAS Grid on Azure 아키텍처GitHub Actions를 사용하여 Azure에서 SAS 배포 자동화를 확인하세요.

참가자

Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.

주요 작성자:

기타 기여자:

비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인합니다.

다음 단계