Cloud-init 対応 VM の起動に時間がかかる

この記事では、クラウド init 機能を使用する Azure Virtual Machine (VM) で予期しない起動遅延をトラブルシューティングする方法について説明します。 この遅延により、クラウド init が有効な Azure VM 展開では、起動に 2 分 (120 秒) 以上の時間が必要になります。

現象

Azure VM の起動には、次の製品など、ローカルの一時的なディスクを提供しない VM 製品で完了するのに 2 分以上かかります。

/var/log/cloud-init.log/var/log/waagent.log (init ステージ) などのログ ファイルを確認すると、次の例のような出力が表示されます。

# grep "did not appear after 120 seconds"  *

cloud-init.log:2021-12-01 19:35:50,455 - DataSourceAzure.py[WARNING]: ephemeral device '/dev/disk/cloud/azure_resource' did not appear after 120 seconds.
cloud-init.log:2021-12-01 21:19:58,531 - DataSourceAzure.py[WARNING]: ephemeral device '/dev/disk/cloud/azure_resource' did not appear after 120 seconds.
cloud-init-output.log:2021-12-01 19:35:50,455 - DataSourceAzure.py[WARNING]: ephemeral device '/dev/disk/cloud/azure_resource' did not appear after 120 seconds.
cloud-init-output.log:2021-12-01 21:19:58,531 - DataSourceAzure.py[WARNING]: ephemeral device '/dev/disk/cloud/azure_resource' did not appear after 120 seconds.
messages:Dec  1 19:35:50 redhat84noephstor01 cloud-init[1065]: 2021-12-01 19:35:50,455 - DataSourceAzure.py[WARNING]: ephemeral device '/dev/disk/cloud/azure_resource' did not appear after 120 seconds.
messages:Dec  1 21:19:58 redhat84noephstor01 cloud-init[931]: 2021-12-01 21:19:58,531 - DataSourceAzure.py[WARNING]: ephemeral device '/dev/disk/cloud/azure_resource' did not appear after 120 seconds.
# /var/log/cloud-init.log

2021-12-01 19:35:50,481 - util.py[WARNING]: Failed partitioning operation
Device /dev/disk/cloud/azure_resource did not exist and was not created with a udevadm settle.
2021-12-01 19:35:50,481 - util.py[DEBUG]: Failed partitioning operation
Device /dev/disk/cloud/azure_resource did not exist and was not created with a udevadm settle.
Traceback (most recent call last):
  File "/usr/lib/python3.6/site-packages/cloudinit/config/cc_disk_setup.py", line 141, in handle
    func=mkpart, args=(disk, definition))
  File "/usr/lib/python3.6/site-packages/cloudinit/util.py", line 2292, in log_time
    ret = func(*args, **kwargs)
  File "/usr/lib/python3.6/site-packages/cloudinit/config/cc_disk_setup.py", line 780, in mkpart
    assert_and_settle_device(device)
  File "/usr/lib/python3.6/site-packages/cloudinit/config/cc_disk_setup.py", line 

原因

VM の起動時に 、cloud-init は Python で DataSourceAzure.py ファイルを実行し、ローカルの一時ディスク (/mnt/azure_resource) が使用可能になるのを待ちます。 ローカルの一時的なディスクを持つ Azure VM を使用している場合、cloud-init はプロセスが終了するまで待機する必要があります。エフェメラル ディスクのタイムアウト間隔は、起動プロセスが続行される 120 秒前です。

ソリューション

cloud-init のコピーをバージョン 21.2 以降にアップグレードします。

回避策

cloud-init をバージョン 21.2 以降のバージョンにアップグレードできない場合は、DataSourceAzure.py ファイルを編集してタイムアウト を短くできます。 次の例では、タイムアウト値を 120 秒から 2 秒に変更します。

sudo sed -i 's/maxwait=120/maxwait=2/g' $(locate DataSourceAzure.py)