大規模な仮想マシン スケール セットの使用

適用対象: ✔️ Linux VM ✔️ Windows VM ✔️ ユニフォーム スケール セット

現在、最大 1,000 個の VM を容量とした Azure 仮想マシン スケール セットを作成できるようになりました。 このドキュメントの "大規模な仮想マシン スケール セット" は、100 個を超える VM にスケーリングできるスケール セットとして定義されています。 この機能はスケール セット プロパティで設定されています (singlePlacementGroup=False)。

大規模なスケール セットのある部分 (負荷分散や障害ドメインなど) の動作は、標準的なスケール セットとは異なります。 このドキュメントでは、大規模なスケール セットの特性を説明するほか、アプリケーションでこれらをうまく使用するために知っておくべきことについても説明します。

クラウド インフラストラクチャの大規模なデプロイでは、一般的な手法として一連の "スケール ユニット" を作成します。たとえば、複数の VNET やストレージ アカウントに複数の VM のスケール セットを作成します。 この手法では、単一の VM に比べて管理が容易になります。また、複数のスケール ユニットは、多くのアプリケーション、特に、他のスタック可能なコンポーネント (複数の仮想ネットワークやエンドポイントなど) を必要とするアプリケーションに役立ちます。 ただし、アプリケーションに 1 つの大規模クラスターが必要な場合は、最大 1,000 個の VM で構成される 1 つのスケール セットをデプロイすることがより簡単になります。 シナリオの例には、一元化されたビッグ データのデプロイや、ワーカー ノードの大規模なプールのシンプルな管理を必要とするコンピューティング グリッドが含まれます。 大規模なスケール セットは、仮想マシン スケール セットの接続されたデータ ディスクと組み合わせて使用すると、数千の vCPU とペタバイト規模のストレージで構成されているスケーラブルなインフラストラクチャを 1 回の操作でデプロイできます。

配置グループ

"大規模な" スケール セットを特別なものにするのは、VM の数ではなく、それに含まれる "配置グループ" の数です。 配置グループは、Azure 可用性セットに似た構造で、独自の障害ドメインとアップグレード ドメインが備わっています。 既定では、スケール セットは、最大サイズが 100 個の VM である 1 つの配置グループで構成されます。 singlePlacementGroup というスケール セット プロパティが false に設定されている場合、そのスケール セットは、複数の配置グループで構成することができ、0 ~ 1,000 個の VM が含まれます。 既定値の true に設定されている場合、スケール セットは 1 つの配置グループで構成され、0 ~ 100 個の VM が含まれます。

大規模なスケール セットを使用するためのチェックリスト

アプリケーションで大規模なスケール セットを効率的に使用できるかどうかを判断するには、次の要件を検討してください。

  • 多数の VM をデプロイする予定の場合は、コンピューティング vCPU のクォータ制限の引き上げが必要になることがあります。
  • Azure Marketplace イメージから作成されたスケール セットは、最大 1,000 個の VM にスケールアップできます。
  • カスタム イメージ (自身で作成してアップロードした VM イメージ) から作成されたスケール セットは、現在、最大 600 個の VM にスケールアップできます。
  • 大規模なスケール セットには、Azure Managed Disks が必要です。 Managed Disks を使用して作成されていないスケール セットには、複数のストレージ アカウントが必要です (VM 20 個につき 1 つ)。 大規模なスケール セットは、ストレージの管理オーバーヘッドを軽減し、サブスクリプションのストレージ アカウントの上限に達するリスクを回避するために、Managed Disks のみで動作するように設計されています。
  • 大規模なスケール (SPG=false) では InfiniBand ネットワークはサポートされていません
  • 複数の配置グループで構成されたスケール セットでのレイヤー 4 の負荷分散には、Azure Load Balancer Standard SKU が必要です。 Load Balancer Standard SKU には、複数のスケール セットの間で負荷分散を行えるなど、他にもメリットがあります。 また Standard SKU では、スケール セットにネットワーク セキュリティ グループが関連付けられていることも必要です。そうでない場合、NAT プールは正常に機能しません。 Azure Load Balancer Basic SKU を使用する必要がある場合は、スケール セットが 1 つの配置グループを使用するよう構成されていることを確認してください。これは既定の設定です。
  • Azure Application Gateway によるレイヤー 7 の負荷分散は、すべてのスケール セットでサポートされています。
  • 1 つのスケール セットは 1 つのサブネットで定義されます。サブネットには、必要なすべての VM にとって十分な規模のアドレス空間があることを確認してください。 既定では、スケール セットはオーバープロビジョニングされ (デプロイ時またはスケールアウト時に追加の VM が作成されますが、これについては課金されません)、デプロイの信頼性とパフォーマンスが向上します。 スケールする予定の VM の数よりもアドレス空間が 20% 大きくなることを考慮に入れておいてください。
  • 配置グループ内で一貫性があるのは、障害ドメインとアップグレード ドメインのみです。 VM が個別の物理ハードウェアで均等に分散されているため、このアーキテクチャでは、スケール セットの全体的な可用性が変更されることはありません。ただし、これは、2 つの VM が異なるハードウェア上にあることを保証する必要がある場合、これらの VM が同じ配置グループ内の別々の障害ドメインに配置されるようにすることを意味します。 可用性オプションに関するこちらのリンクを参照してください。
  • 障害ドメインと配置グループ ID は、スケール セット VM の "インスタンス ビュー" に表示されます。 スケール セット VM のインスタンス ビューは、Azure リソース エクスプローラーで表示できます。

大規模なスケール セットを作成する

Azure portal でスケール セットを作成する場合は、最大で 1,000 の "インスタンス数" の値を指定します。 インスタンスが 100 を超える場合は、 [インスタンス数が 100 を超えるスケールを有効にする][はい] に設定されます。その場合、複数の配置グループへのスケーリングが許可されます。

この図には Azure portal のインスタンス ブレードが示されています。 [インスタンス数] と [インスタンス サイズ] を選択するオプションを使用できます。

大規模な仮想マシン スケール セットは、Azure CLIaz vmss create コマンドを使用して作成できます。 このコマンドを実行すると、instance-count 引数に基づいて、サブネット サイズなど、インテリジェントな既定値が設定されます。

az group create -l southcentralus -n biginfra
az vmss create -g biginfra -n bigvmss --image ubuntults --instance-count 1000

vmss create コマンドでは、構成値を指定しない場合に既定で特定の構成値が使用されます。 オーバーライドできる使用可能なオプションを表示するには、次のように入力します。

az vmss create --help

Azure Resource Manager テンプレートを構成して大規模なスケール セットを作成している場合、このテンプレートによって Azure Managed Disks に基づいたスケール セットが作成されることを確認してください。 Microsoft.Compute/virtualMachineScaleSets リソースの properties セクションで、singlePlacementGroup プロパティを false に設定できます。 次の JSON フラグメントは、スケール セット テンプレートの先頭部分を示しています。これには、VM 容量が 1,000 であることと "singlePlacementGroup" : false 設定が含まれています。

{
  "type": "Microsoft.Compute/virtualMachineScaleSets",
  "location": "australiaeast",
  "name": "bigvmss",
  "sku": {
    "name": "Standard_DS1_v2",
    "tier": "Standard",
    "capacity": 1000
  },
  "properties": {
    "singlePlacementGroup": false,
    "upgradePolicy": {
      "mode": "Automatic"
    }

大規模なスケール セットのテンプレートの完全な例については、https://github.com/gbowerman/azure-myriad/blob/main/bigtest/bigbottle.json を参照してください。

複数の配置グループをまたぐように既存のスケール セットを変換する

既存の仮想マシン スケール セットで 100 個を超える VM にスケーリングできるようにするには、スケール セット モデルで singlePlacementGroup プロパティを false に変更する必要があります。 このプロパティの変更は、Azure リソース エクスプローラーを使用してテストできます。 既存のスケール セットを探し、 [編集] を選択して、singlePlacementGroup プロパティを変更します。 このプロパティが表示されていない場合は、スケール セットの表示に以前のバージョンの Microsoft.Compute API を使用している可能性があります。

注意

スケール セットは、1 つの配置グループのみのサポート (既定の動作) から複数の配置グループのサポートに変更できますが、その逆の変換を行うことはできません。 そのため、変換する前に、大規模なスケール セットのプロパティを理解しておく必要があります。