クラシックから Azure Resource Manager への IaaS リソースの移行計画

[アーティクル]
03/11/2023

適用対象: ✔️ Linux VM ✔️ Windows VM

重要

現在、IaaS VM の約 90% で Azure Resource Manager が使用されています。 2020 年 2 月 28 日の時点で、クラシック VM は非推奨とされており、2023 年 9 月 6 日に完全に廃止されます。この非推奨について詳細およびそれが与える影響について確認してください。

Azure Resource Manager には非常に多くの優れた機能が用意されていますが、移行をスムーズに進めるには工程をしっかりと計画することが重要です。時間をかけて計画すると、移行アクティビティの実行中に問題が発生することはありません。

Note

以下のガイダンスは、Azure Customer Advisory チームとクラウドソリューションアーキテクトが大規模な環境を移行する際にお客様と協力して作成したものです。このドキュメントは、新しい成功のパターンが明らかになった時点で更新される予定です。そのため、新しい推奨事項が追加されていないかどうかをときどき確認してください。

移行の工程には 4 つの一般的なフェーズがあります。

移行フェーズ

プラン

技術的な考慮事項とトレードオフ

技術要件の規模、地理的な場所、および運用方法に応じて、次のことを検討する必要があります。

Azure Resource Manager が組織にとって適切な理由は何ですか。移行を行うビジネス上の理由は何ですか。
Azure Resource Manager を使用する技術的な理由は何ですか。他に利用したい Azure サービスは何ですか (ある場合)。
どのアプリケーション (または仮想マシンのセット) を移行に含めますか。
移行 API でどのシナリオがサポートされていますか。「サポートされていない機能と構成」をご確認ください。
運用チームはクラシックと Azure Resource Manager の両方でアプリケーション/VM をサポートしますか。
Azure Resource Manager は VM のデプロイ、管理、監視、およびレポートのプロセスをどのように変更しますか。デプロイスクリプトを更新する必要がありますか。
関係者 (エンドユーザー、アプリケーション所有者、インフラストラクチャ所有者) に通知するためにどのようなコミュニケーション案を用意していますか。
環境の複雑さに応じたメンテナンス期間 (エンドユーザーおよびアプリケーション所有者がアプリケーションを使用できない期間) を設けていますか。その場合、どのくらいの期間を予定していますか。
関係者が Azure Resource Manager の使い方を習得するためにどのようなトレーニングプランを用意していますか。
移行のためにどのようなプログラム管理またはプロジェクト管理のプランを用意していますか。
Azure Resource Manager への移行のタイムラインおよびその他の関連テクノロジのロードマップはどのようなものですか。それらは最適に調整されていますか。

成功のパターン

成功を収めたお客様は詳細なプランを作成しており、そこでは前述の質問についてよく話し合い、その内容を文書化して管理しています。移行プランがスポンサーや関係者に広く伝わるようにしてください。また、移行オプションに関する知識を身に付けてください。以下に示す移行ドキュメントをお読みになることを強くお勧めします。

回避すべき問題

計画を行わないこと。この移行のテクノロジ面の手順は実証済みであり、結果は予測可能なものです。
プラットフォームでサポートされる移行 API がすべてのシナリオに対応していると想定すること。サポート対象のシナリオについて確認するには、「サポートされていない機能と構成」をご覧ください。
エンドユーザーに関連するアプリケーションの停止の可能性について計画しないこと。アプリケーションを使用できない可能性のある時間についてエンドユーザーに適切に警告するための十分なバッファーを計画してください。

ラボテスト

環境を複製してテスト移行を行う

Note

既存の環境の正確な複製は、コミュニティに提供されたツール (Microsoft サポートが正式にサポートするものではありません) を使用して実行します。そのため、これは省略可能な手順ですが、運用環境を使用せずに問題を検出するには最善の方法です。コミュニティに提供されたツールを使用しない場合は、以下の検証/準備/ドライランの中止に関する推奨事項をご覧ください。

スムーズな移行を行うための最善の方法は、正確なシナリオ (コンピューティング、ネットワーク、およびストレージ) のラボテストを実施することです。これにより、次のメリットが得られます。

完全に独立したラボまたは既存の非運用環境をテストに使用できます。繰り返し移行可能であり、破壊的な変更が可能な、完全に独立したラボの使用をお勧めします。実際のサブスクリプションからメタデータを収集およびハイドレートするスクリプトについては後述します。
別のサブスクリプションでラボを作成することをお勧めします。これは、ラボが繰り返し解体されるためであり、個別の独立したサブスクリプションを用意することで、実際に使用する項目が誤って削除される可能性を削減できます。

これは、AsmMetadataParser ツールを使用して実施できます。このツールについては、こちらをご覧ください。

成功のパターン

大規模な移行の多くで検出された問題を以下に示します。これは包括的なリストではないため、詳細については「サポートされていない機能と構成」を参照してください。これらの技術的な問題が発生するかどうかはわかりませんが、問題が発生した場合は、移行の前に解決しておくと、移行をスムーズに行うことができます。

検証/準備/ドライランの中止の実施 - これはおそらく、クラシックから Azure Resource Manager への移行を成功させるための最も重要な手順です。移行 API には、次の 3 つの主要ステップがあります:検証、準備、コミット。検証では、クラシック環境の状態を把握して、すべての問題の結果を返します。ただし、一部の問題は Azure Resource Manager スタックに存在する可能性があるため、すべてを検証で見つけられるわけではありません。移行プロセスの次の手順である準備では、これらの問題を公開します。準備では、クラシックから Azure Resource Manager にメタデータを移動しますが、移動をコミットしせず、クラシック側で何かを削除または変更することもありません。ドライランでは移行の準備を行ってから、移行の準備を中止します (コミットしません)。検証/準備/ドライランの中止の目的は、Azure Resource Manager スタック内のすべてのメタデータを確認し、(プログラムを使用して、またはポータルで) 調査し、すべてが正しく移行されたかどうかを検証して、技術的な問題に対処することです。また、移行期間の感覚をつかむことができるため、それに応じたダウンタイムを計画できます。検証/準備/中止ではユーザーダウンタイムが発生しないため、アプリケーションの使用が中断されることはありません。
- ドライランの前に以下の項目を解決する必要がありますが、ドライランテストは、準備の手順が失敗しても安全に進められます。エンタープライズでの移行中に、ドライランが移行の準備のための安全かつ貴重な方法であることがわかりました。
- 準備の実施中は、コントロールプレーン (Azure の管理操作) が仮想ネットワーク全体に対してロックされるため、検証/準備/中止の際に VM のメタデータを変更することはできません。ただし、それ以外のアプリケーション機能 (RD、VM の使用など) が影響を受けることはありません。ドライランが実行されていることは VM のユーザーにはわかりません。
ExpressRoute 回線と VPN - 現在、承認リンクを使用する ExpressRoute ゲートウェイをダウンタイムなしで移行することはできません。回避策については、クラシックデプロイモデルから Resource Manager デプロイモデルへの ExpressRoute 回線および関連する仮想ネットワークの移行に関する記事をご覧ください。
VM 拡張機能 - 仮想マシン拡張機能は、実行中の VM を移行する際の最も大きな障害の 1 つとなる可能性があります。 VM 拡張機能の修復には 1 ～ 2 日かかる可能性があるため、それに応じた計画を行ってください。動作中の VM の VM 拡張機能の状態を報告するには、Azure エージェントを稼働させておく必要があります。実行中の VM について不適切な状態が返された場合は、移行が停止します。移行を可能にするためにエージェント自体が正常に動作している必要はありませんが、VM に拡張機能が存在する場合は、移行を進めるために、動作中のエージェントと送信インターネット接続 (DNS を使用) の両方が必要になります。
- 移行中に DNS サーバーへの接続が失われた場合は、移行準備前のすべての VM から BGInfo v1.* を除くすべての VM 拡張機能を削除し、Azure Resource Managerの移行後に VM に追加し直す必要があります。 これは実行中の VM の場合のみです。 VM が割り当てを解除した状態で停止している場合、VM 拡張機能を削除する必要はありません。注: Azure Diagnostics や Defender for Cloud の監視などの多くの拡張機能は、移行後に再インストールされるため、削除しても問題ありません。
- また、ネットワークセキュリティグループが送信インターネットアクセスを制限していないことを確認してください。これは、一部のネットワークセキュリティグループ構成で発生することがあります。 VM 拡張機能を Azure Resource Manager に移行するには、送信インターネットアクセス (および DNS) が必要です。
- BGInfo 拡張機能には 2 つのバージョン (v1 と v2) があります。 VM が Azure Portal または PowerShell を使って作成された場合は、VM に v1 拡張機能が搭載される可能性があります。この拡張機能を削除する必要はありません。この拡張機能は、移行 API によってスキップされます (移行されません)。ただし、クラシック VM が新しい Azure Portal で作成された場合は、JSON ベースの v2 バージョンの BGInfo が搭載される可能性があります。エージェントが動作しており、送信インターネットアクセス (および DNS) を使用している場合は、この拡張機能を Azure Resource Manager に移行できます。
- 修復オプション 1。送信インターネットアクセス、動作中の DNS サービス、VM で動作中の Azure エージェントが VM にないことがわかっている場合は、準備の前に、移行の一環としてすべての VM 拡張機能をアンインストールしてから、移行後に VM 拡張機能を再インストールしてください。
- 修復オプション 2。 VM 拡張機能が大きな障害になる場合は、別のオプションとして、移行前にすべての VM をシャットダウン/割り当て解除します。割り当てを解除した VM を移行し、Azure Resource Manager 側でそれらを再起動します。このオプションのメリットは、VM 拡張機能を移行できる点です。デメリットは、すべての公開仮想 IP が失われ (これにより移行が失敗に終わる可能性があります)、VM がシャットダウンされて動作中のアプリケーションに大きく影響する点です。
  
  Note
  
  移行対象である実行中の VM に対して Microsoft Defender for Cloud ポリシーが構成されている場合、拡張機能を削除する前にセキュリティポリシーを停止する必要があります。停止しない場合、セキュリティ監視拡張機能は削除後、VM に自動的に再インストールされます。
可用性セット - Azure Resource Manager に移行する仮想ネットワーク (vNet) では、クラシックデプロイメント (クラウドサービス) に含まれている VM がすべて 1 つの可用性セットに属しているか、または VM がどの可用性セットにも属していません。クラウドサービスに複数の可用性セットがある場合は、Azure Resource Manager との互換性がなく、移行が停止します。また、1 つの可用性セットに複数の VM を含めることはできず、1 つの可用性セットに複数の VM が含まれることもありません。この問題を解決するには、クラウドサービスを修復または再シャッフルする必要があります。この処理には時間がかかる可能性があるため、状況に応じた計画を行ってください。
Web/ワーカーロールデプロイメント - Web およびワーカーロールを含む Cloud Services を Azure Resource Manager に移行することはできません。移行を開始するには、最初に Web/worker ロールを仮想ネットワークから削除する必要があります。一般的な解決策として、ExpressRoute 回線にもリンクされている別のクラシック仮想ネットワークに Web/worker ロールインスタンスを移動するか、コードを新しい PaaS App Services (このドキュメントでは説明しません) に移行します。前者の再デプロイの場合は、新しいクラシック仮想ネットワークを作成し、Web/worker ロールをその新しい仮想ネットワークに移動/再デプロイして、移動元の仮想ネットワークからデプロイメントを削除します。コードの変更が不要な方法。新しい仮想ネットワークピアリング機能を使用すると、Web/worker ロールを含むクラシック仮想ネットワークと、Azure リージョン内の他の仮想ネットワーク (移行対象の仮想ネットワークなど) をピアリングできます (ピアリングした仮想ネットワークは移行できないため、仮想ネットワークの移行の完了後)。そのため、同じ機能を提供しても、パフォーマンスが失われたり、待ち時間や帯域幅のペナルティが発生したりすることはありません。仮想ネットワークピアリングの追加により、Web/worker ロールのデプロイメントを簡単に移行できるようになりました。また、Azure Resource Manager への移行がブロックされることもありません。
Azure Resource Manager のクォータ - Azure リージョンには、クラシックと Azure Resource Manager の両方に個別のクォータ/制限があります。移行シナリオにおいて新しいハードウェアを使用していない " (クラシックの既存の VM を Azure Resource Manager に交換した) " としても、移行の開始前には、十分な容量を持つ Azure Resource Manager のクォータが必要です。問題となる主要な制限を以下に示します。制限を引き上げるためのサポートチケットを開いてください。

Note

移行対象の現在の環境と同じリージョンでは、これらの制限を引き上げる必要があります。
- ネットワークインターフェイス
- ロードバランサー
- パブリック IP
- 静的パブリック IP
- コア
- ネットワークセキュリティグループ
- ルートテーブル
  
  最新バージョンの Azure CLI で次のコマンドを使用すると、現在の Azure Resource Manager のクォータを確認できます。
  
  コンピューティング(コア、可用性セット)
```
az vm list-usage -l <azure-region> -o jsonc
```
  ネットワーク(仮想ネットワーク、静的パブリック IP、パブリック IP、ネットワークセキュリティグループ、ネットワークインターフェイス、ロードバランサー、ルートテーブル)
```
az network list-usages -l <azure-region> -o jsonc
```
  ストレージ(ストレージアカウント)
```
az storage account show-usage
```
Azure Resource Manager API のスロットリング制限 - 十分な環境 (> VNET 内の 400 VM など) がある場合は、Azure Resource Manager での書き込み (現時点では 1200 書き込み/時間) の既定の API スロットリング制限に達している可能性があります。移行を開始する前に、サブスクリプション用にこの制限を引き上げるためのサポートチケットを作成する必要があります。
プロビジョニングタイムアウト VM 状態 - いずれかの VM の状態がプロビジョニングタイムアウトの場合、移行前に解決する必要があります。そのためには、VM をプロビジョニング解除/再プロビジョニングしてダウンタイムを発生させます (ディスクを保持した状態で VM を削除して再作成します)。
RoleStateUnknown VM 状態 - ロール状態不明エラーメッセージのために、移行が停止した場合は、ポータルを使用して VM を調べ、VM が実行中であることを確認してください。通常、このエラーは数分後に自然に表示されなくなります (修復は不要です)。多くの場合、仮想マシンの起動、停止、再起動の各操作の際に表示される一時的なものです。 推奨: 数分後に移行を再試行します。
ファブリッククラスターが存在しない - さまざまな理由で、特定の VM を移行できない場合があります。これらの既知のケースの 1 つとして、VM が最近 (たとえば先週) 作成されて、Azure Resource Manager ワークロード用の設定がまだ行われていない Azure クラスターに追加された場合などがあります。この場合は、ファブリッククラスターが存在しませんというエラーが表示され、VM を移行できません。クラスターで Azure Resource Manager がすぐに有効になるため、通常、この問題は数日経つと解決します。ただし、即時の解決策の 1 つとして、VM の stop-deallocate を実行して移行を続行し、移行の完了後に Azure Resource Manager で VM を起動する方法があります。

回避すべき問題

検証/準備/ドライランの中止の移行を省略しないでください。
ほとんど (すべてではありません) の潜在的な問題は、検証/準備/中止の手順で発生します。

移行

技術的な考慮事項とトレードオフ

環境に関する既知の問題に対処したので、これで準備が整いました。

実際の移行では、以下の点を考慮する必要があります。

優先度が高くなると共に、仮想ネットワーク (移行の最小単位) について計画し、スケジュールを設定します。最初はシンプルな仮想ネットワークを使用し、より複雑な仮想ネットワークに進みます。
ほとんどのお客様は非運用環境と運用環境を用意します。運用環境のスケジュールは最後に設定します。
(省略可能) 予期しない問題の発生に備えて、十分なバッファーを用意したメンテナンスのためのダウンタイムのスケジュールを設定します。
問題が発生した場合に備えて、サポートチームと連携します。

成功のパターン

実際の移行を行う前に、前述の「ラボテスト」に記載されている技術的なガイダンスを考慮し、問題を軽減する必要があります。十分なテストを実施しておけば、移行はそれほど難しくはありません。運用環境については、信頼できる Microsoft パートナーや Microsoft プレミアサービスなどの追加のサポートを準備しておくとよいでしょう。

回避すべき問題

完全なテストを実施しておかないと、問題が発生し、移行に遅れが出る可能性があります。

移行後の注意事項

技術的な考慮事項とトレードオフ

これで、Azure Resource Manager への移行が完了し、プラットフォームを最大限に活用できます。その他のメリットについては、「Azure Resource Manager の概要」をご覧ください。

また、以下の点を考慮してください。

移行とその他のアクティビティについてまとめて検討します。ほとんどのお客様は、アプリケーションのメンテナンス期間を選択します。その場合は、このダウンタイムを使用して、暗号化や Managed Disks への移行など、Azure Resource Manager のその他の機能を有効にすることができます。
Azure Resource Manager を使用する技術的およびビジネス上の理由について再検討します。お使いの環境に当てはまる Azure Resource Manager でのみ使用できる追加のサービスを有効にします。
PaaS サービスを使用して環境をモダナイズします。

成功のパターン

Azure Resource Manager で有効にするサービスを、目的を持って選択してください。多くのお客様は、Azure 環境について、以下のような魅力的な機能を活用しています。

回避すべき問題

このクラシックから Azure Resource Manager への移行を開始した理由を思い出してください。そもそものビジネス上の理由は何でしたか。また、ビジネス上の目的を達成しましたか。

クラシックから Azure Resource Manager への IaaS リソースの移行計画

プラン

技術的な考慮事項とトレードオフ

成功のパターン

回避すべき問題

ラボテスト

成功のパターン

回避すべき問題

移行

技術的な考慮事項とトレードオフ

成功のパターン

回避すべき問題

移行後の注意事項

技術的な考慮事項とトレードオフ

成功のパターン

回避すべき問題

次のステップ

その他のリソース

クラシックから Azure Resource Manager への IaaS リソースの移行計画

プラン

技術的な考慮事項とトレードオフ

成功のパターン

回避すべき問題

ラボ テスト

成功のパターン

回避すべき問題

移行

技術的な考慮事項とトレードオフ

成功のパターン

回避すべき問題

移行後の注意事項

技術的な考慮事項とトレードオフ

成功のパターン

回避すべき問題

次のステップ

その他のリソース

ラボテスト