Azure Machine Learning을 사용하여 리소스 할당량 관리 및 증가

Azure는 사기로 인한 예산 초과를 방지하고, Azure 용량 제약 조건을 준수하기 위해 한도 및 할당량을 사용합니다. 프로덕션 워크로드의 크기를 조정할 때 이러한 한도를 고려하세요. 이 문서에서는 다음에 대해 알아봅니다.

  • Azure Machine Learning과 관련된 Azure 리소스에 대한 기본 한도
  • 작업 영역 수준 할당량 만들기
  • 할당량 및 한도 보기
  • 할당량 증가 다시 요청

할당량 관리와 함께 Azure Machine Learning에 대한 비용을 계획 및 관리하는 방법 또는 Azure Machine Learning의 서비스 한도에 대해 자세히 알아볼 수 있습니다.

특별 고려 사항

  • 할당량은 신용 한도액일 뿐이며 용량을 보장하는 것은 아닙니다. 대규모 용량이 필요한 경우 Azure 지원에 할당량 증가를 문의하세요.

  • 할당량은 Azure Machine Learning을 포함하여 구독의 모든 서비스에 공유됩니다. 용량을 평가할 때 모든 서비스의 사용량을 계산합니다.

    Azure Machine Learning 컴퓨팅은 예외입니다. 이것은 핵심 컴퓨팅 할당량과 별도의 할당량을 갖습니다.

  • 기본 한도는 평가판, 종량제, VM(가상 머신) 시리즈(예: Dv2, F 및 G)와 같은 범주 유형에 따라 다릅니다.

기본 리소스 할당량

이 섹션에서는 다음 리소스의 기본 및 최대 할당량 한도에 대해 알아봅니다.

  • Azure Machine Learning 자산
    • Azure Machine Learning 컴퓨팅
    • Azure Machine Learning 파이프라인
  • 가상 머신
  • Azure Container Instances
  • Azure Storage

중요

한도는 변경될 수 있습니다. 최신 정보는 Azure Machine Learning의 서비스 한도를 참조하세요.

Azure Machine Learning 자산

자산에 대한 다음 한도는 작업 영역별 기준으로 적용됩니다.

리소스 최대 한도
데이터 세트 1천만
실행 1천만
모델 1천만
Artifacts 1천만

또한 최대 런타임은 30일이고 실행별로 기록되는 메트릭의 최대 개수는 100만입니다.

Azure Machine Learning 컴퓨팅

Azure Machine Learning Compute는 구독에서 지역별로 허용되는 고유 컴퓨팅 리소스 수는 물론 각 VM 제품군 및 누적 합계 코어 수로 분할되는 코어 수에 대해 기본 할당량 한도를 갖습니다. 이 할당량은 Azure Machine Learning의 관리되는 컴퓨팅 리소스에만 적용되므로 이전 섹션에 나열된 VM 코어 할당량과 별개입니다.

여러 VM 제품군 코어 할당량, 이 섹션의 총 구독 코어 할당량, 클러스터 할당량 및 리소스에 대해 한도를 늘리기 위해 할당량 증가를 요청합니다.

사용 가능한 리소스:

  • 지역별 전용 코어는 구독 제안 유형에 따라 24~300의 기본 한도를 갖습니다. 각 VM 제품군에 대해 구독별 전용 코어 수를 늘릴 수 있습니다. NCv2, NCv3 또는 ND 시리즈와 같은 특별한 VM 제품군은 기본 코어 수 0으로 시작합니다. GPU는 또한 기본적으로 0코어로 설정됩니다.

  • 지역별 낮은 우선순위 코어는 구독 제안 유형에 따라 100~3,000의 기본 한도를 갖습니다. 구독당 우선 순위가 낮은 코어 수는 확장 가능하며 VM 제품군별로 값이 다릅니다.

  • 지역별 클러스터는 기본 한도가 200입니다. 학습 클러스터, 컴퓨팅 인스턴스 및 MIR 엔드포인트 배포 간에 공유됩니다. (컴퓨팅 인스턴스는 할당량 목적을 위해 단일 노드 클러스터로 간주됩니다.) 클러스터 할당량은 지정된 구독 내에서 지역당 최대 500개까지 늘릴 수 있습니다.

할당량 증가를 요청할 VM 제품군에 대해 자세히 알아보려면 Azure에서 가상 머신 크기를 확인합니다. 예를 들어 GPU VM 제품군은 해당 제품군 이름이 “N”으로 시작합니다(예: NCv3 시리즈)

다음 표에서는 플랫폼의 추가 한도를 보여줍니다. 예외를 요청하려면 기술 지원 티켓을 통해 AzureML 제품 팀에 연락하세요.

리소스 또는 작업 최대 한도
리소스 그룹당 작업 영역 800
통신을 사용하지 않는 풀(예: MPI 작업을 실행할 수 없음)로 설정된 단일 Azure Machine Learning 컴퓨팅(AmlCompute) 클러스터의 노드 100개 노드, 하지만 최대 65000개 노드까지 구성 가능
Azure Machine Learning Compute(AmlCompute) 클러스터에서 실행되는 단일 병렬 실행 단계의 노드 100개 노드, 하지만 클러스터가 위 내용에 따라 확장하도록 설정된 경우 최대 65000개 노드까지 구성 가능
통신을 사용하는 풀로 설정된 단일 Azure Machine Learning 컴퓨팅(AmlCompute) 클러스터의 노드 300개 노드, 하지만 최대 4000개 노드까지 구성 가능
RDMA 지원 VM 제품군에서 통신을 사용하는 풀로 설정된 단일 Azure Machine Learning 컴퓨팅(AmlCompute) 클러스터의 노드 100개 노드
Azure Machine Learning Compute(AmlCompute) 클러스터에서 실행되는 단일 MPI의 노드 100개 노드, 하지만 최대 300개 노드까지 증가 가능
작업 수명 21일1
우선 순위가 낮은 노드의 작업 수명 7일2
노드당 매개 변수 서버 1

1 최대 수명은 실행 시작 시간과 종료 시간 사이의 기간입니다. 완료된 실행은 무기한 유지됩니다. 최대 수명 내에 완료되지 않은 실행에 대한 데이터는 액세스할 수 없습니다.

2 용량 제약 조건이 있을 때마다 우선 순위가 낮은 노드의 작업이 선점될 수 있습니다. 작업에서 검사점을 구현하는 것이 좋습니다.

Azure Machine Learning 관리형 온라인 엔드포인트

Azure Machine Learning 관리형 온라인 엔드포인트에는 다음 표에 설명된 제한이 있습니다.

리소스 제한
엔드포인트 이름 엔드포인트 이름은 다음과 같아야 합니다.
  • 문자로 시작
  • 3~32자 길이
  • 문자 및 숫자로만 구성 1
  • 배포 이름 배포 이름은 다음과 같아야 합니다.
  • 문자로 시작
  • 3~32자 길이
  • 문자 및 숫자로만 구성 1
  • 구독당 엔드포인트 수 50
    구독당 배포 수 200
    엔드포인트당 배포 수 20
    배포당 인스턴스 수 20 2
    엔드포인트 수준에서 최대 요청 시간 초과 90초
    모든 배포에 대한 엔드포인트 수준에서 초당 총 요청 수 500 3
    모든 배포에 대한 엔드포인트 수준에서 초당 총 연결 수 500 3
    모든 배포에 대한 엔드포인트 수준에서 활성화되는 총 연결 수 500 3
    모든 배포에 대한 엔드포인트 수준의 총 대역폭 5MBPS 3

    1my-endpoint-name과 같은 단일 대시는 엔드포인트 및 배포 이름에 허용됩니다.

    2 업그레이드를 수행하기 위해 20% 추가 컴퓨팅 리소스를 예약합니다. 예를 들어 배포에서 10개의 인스턴스를 요청하는 경우 12에 대한 할당량이 있어야 합니다. 그렇지 않으면 오류 메시지를 받게 됩니다.

    3 제한 증가를 요청하는 경우 필요할 수 있는 관련 제한 증가를 계산해야 합니다. 예를 들어 초당 요청에 대한 제한 증가를 요청하는 경우 필요한 연결 및 대역폭 제한을 계산하고 이러한 제한 증가를 동일한 요청에 포함할 수 있습니다.

    엔드포인트에 대한 현재 사용량을 확인하려면 메트릭을 봅니다.

    Azure Machine Learning 제품 팀에 예외를 요청하려면 할당량 증가 요청 섹션의 단계를 사용하고 다음 정보를 제공합니다.

    1. 지원 요청을 열 때 서비스 및 구독 제한(할당량)을 선택하지 마세요. 대신 문제 유형으로 기술적을 선택합니다.
    2. 할당량을 늘리려는 Azure 구독지역을 제공합니다.
    3. 테넌트 ID고객 이름을 제공합니다.
    4. 할당량 유형새 한도를 제공합니다. 다음 표를 가이드로 따르세요.
    할당량 유형 새 제한
    MaxEndpointsPerSub(구독당 엔드포인트 수) ?
    MaxDeploymentsPerSub(구독당 배포 수) ?
    MaxDeploymentsPerEndpoint(엔드포인트당 배포 수) ?
    MaxInstancesPerDeployment(배포당 인스턴스 수) ?
    EndpointRequestRateLimitPerSec(모든 배포의 엔드포인트 수준에서 초당 총 요청 수) ?
    EndpointConnectionRateLimitPerSec(모든 배포의 엔드포인트 수준에서 초당 총 연결 수) ?
    EndpointConnectionLimit(모든 배포에 대해 엔드포인트 수준에서 활성화된 총 연결 수) ?
    EndpointBandwidthLimitKBps(모든 배포에 대한 엔드포인트 수준의 총 대역폭(MBPS)) ?

    Azure Machine Learning 파이프라인

    Azure Machine Learning 파이프라인은 다음 한도를 갖습니다.

    리소스 제한
    파이프라인의 단계 30,000
    리소스 그룹당 작업 영역 800

    가상 머신

    각 Azure 구독은 모든 서비스에서 가상 머신 수에 대한 한도를 갖습니다. 가상 머신 코어는 지역별 총 한도 및 크기 시리즈당 지역별 한도를 갖습니다. 두 한도는 개별적으로 적용됩니다.

    미국 동부 총 VM 코어 한도가 30이고, A 시리즈 코어 한도 30이며, D 시리즈 코어 한도는 30인 구독을 예로 들 수 있습니다. 이러한 구독은 30개의 A1 VM 또는 30개의 D1 VM을 배포하도록 허용됩니다. 또는 총 30개 코어를 초과하지 않는 두 구독의 조합도 허용됩니다.

    다음 표에 표시된 값을 넘도록 가상 머신의 한도를 늘릴 수 없습니다.

    리소스 제한
    Azure Active Directory 테넌트와 연결 구독 제한 없음
    구독당 공동 관리자 제한 없음
    구독당 리소스 그룹 980
    Azure Resource Manager API 요청 크기 4,194,304바이트
    구독당 태그 수1 50
    구독당 고유한 태그 계산2 80,000
    위치당 구독 수준 배포 8003
    구독 수준 배포 위치 10

    1최대 50개의 태그를 구독에 직접 적용할 수 있습니다. 그러나 구독에는 구독 내의 리소스 그룹 및 리소스에 적용되는 태그를 무제한으로 포함할 수 있습니다. 리소스당 또는 리소스 그룹당 태그 수는 50개로 제한됩니다.

    2Resource Manager는 고유한 태그 수가 80,000개 이하일 경우에만 구독에 태그 이름 및 값의 목록을 반환합니다. 고유 태그는 리소스 ID, 태그 이름 및 태그 값의 조합으로 정의됩니다. 예를 들어, 동일한 태그 이름과 값을 가진 두 개의 리소스는 두 개의 고유한 태그로 계산됩니다. 개수가 80,000개를 초과하더라도 태그로 리소스를 찾을 수 있습니다.

    3한도에 가까워지면 배포가 기록에서 자동으로 삭제됩니다. 자세한 내용은 배포 기록에서 자동 삭제를 참조하세요.

    Container Instances

    자세한 내용은 Container Instances 한도를 참조하세요.

    Storage

    Azure Storage는 구독당 지역별로 250개의 스토리지 계정으로 제한됩니다. 이러한 한도에는 표준 및 Premium 스토리지 계정이 모두 포함됩니다.

    한도를 늘리려면 Azure 지원을 통해 요청하세요. Azure Storage 팀이 해당 사례를 검토하고 지역별로 최대 250까지 스토리지 계정을 승인할 수 있습니다.

    작업 영역 수준 할당량

    작업 영역 수준 할당량을 사용하여 동일한 구독의 여러 작업 영역 간에 Azure Machine Learning 컴퓨팅 대상 할당을 관리할 수 있습니다.

    기본적으로 모든 작업 영역은 VM 제품군의 구독 수준 할당량과 동일한 할당량을 공유합니다. 하지만 구독의 작업 영역에 개별 VM 제품군에 대해 최대 할당량을 설정할 수 있습니다. 이렇게 하여 용량을 공유하고 리소스 경합 문제를 방지할 수 있습니다.

    1. 구독의 작업 영역으로 이동합니다.
    2. 왼쪽 창에서 사용량 + 할당량을 선택합니다.
    3. 할당량 구성 탭을 선택하여 할당량을 확인합니다.
    4. VM 제품군을 확장합니다.
    5. VM 제품군 아래에 나열된 작업 영역에 할당량 한도를 설정합니다.

    구독 수준 할당량보다 높은 값 또는 음수 값은 설정할 수 없습니다.

    Azure Machine Learning 작업 영역 수준 할당량을 보여주는 스크린샷입니다.

    참고

    작업 영역 수준에서 할당량을 설정하려면 구독 수준 권한이 필요합니다.

    스튜디오에서 할당량 보기

    1. 새 컴퓨팅 리소스를 만들면 기본적으로 이미 사용할 할당량이 있는 VM 크기만 표시됩니다. 보기를 모든 옵션에서 선택으로 전환합니다.

      더 많은 할당량이 필요한 컴퓨팅 리소스를 표시하는 모든 옵션을 선택하는 스크린샷

    2. 할당량이 없는 VM 크기 목록이 표시될 때까지 아래로 스크롤합니다.

      할당량 0의 목록을 보여주는 스크린샷

    3. 링크를 사용하여 추가 할당량에 대한 온라인 고객 지원 요청으로 직접 이동합니다.

    Azure Portal에서 사용량 및 할당량 보기

    가상 머신, 스토리지 또는 네트워크와 같은 여러 Azure 리소스에 대해 할당량을 보려면 Azure Portal을 사용합니다.

    1. 왼쪽 창에서 모든 서비스를 선택한 후 일반 범주 아래에서 구독을 선택합니다.

    2. 구독 목록에서 할당량을 찾으려는 구독을 선택합니다.

    3. 사용량 + 할당량을 선택하여 현재 할당량 한도 및 사용량을 확인합니다. 필터를 사용하여 공급자 및 위치를 선택합니다.

    다른 Azure 할당량과 별도로 구독에서 Azure Machine Learning 컴퓨팅 할당량을 관리합니다.

    1. Azure Portal에서 Azure Machine Learning 작업 영역으로 이동합니다.

    2. 왼쪽 창의 지원 + 문제 해결 섹션에서 사용량 + 할당량을 선택하여 현재 할당량 한도 및 사용량을 확인합니다.

    3. 구독을 선택하여 할당량 한도를 확인합니다. 원하는 지역으로 필터링합니다.

    4. 이제 구독 수준 보기 또는 작업 영역 수준 보기로 전환할 수 있습니다.

    할당량 증가 요청

    기본 한도 이상으로 한도 또는 할당량을 높이려면 비용 없이 온라인 고객 지원 요청을 개설합니다.

    위 표에 표시된 최댓값 이상으로 한도를 늘릴 수 없습니다. 최대 한도가 없으면 해당 리소스의 한도를 조정할 수 없습니다.

    할당량 증가를 요청하는 경우 원하는 서비스를 선택합니다. 예를 들어 Azure Machine Learning, Container Instances 또는 스토리지를 선택합니다. Azure Machine Learning 컴퓨팅의 경우 이전 단계에서 할당량을 확인할 때 할당량 요청 단추를 선택할 수 있습니다.

    참고

    평가판 구독은 한도 또는 할당량 증가 자격이 없습니다. 평가판 구독을 사용 중이면 종량제 구독으로 업그레이드할 수 있습니다. 자세한 내용은 Azure 평가판을 종량제로 업그레이드Azure 체험 계정 FAQ를 참조하세요.

    다음 단계