استكشاف أخطاء نشر VM وإصلاحها في Azure Stack Edge Pro GPU

ينطبق على:Yes for Pro GPU SKU Azure Stack Edge Pro - GPUAzureYes for Pro 2 SKU Stack Edge Pro 2AzureYes for Pro R SKU Stack Edge Pro RAzureYes for Mini R SKU Stack Edge Mini R

توضح هذه المقالة كيفية استكشاف الأخطاء الشائعة وإصلاحها عند نشر الأجهزة الظاهرية على جهاز وحدة معالجة الرسومات Azure Stack Edge Pro. توفر المقالة إرشادات للتحقيق في المشكلات الأكثر شيوعا التي تسبب انتهاء مهلة توفير الأجهزة الظاهرية والمشكلات أثناء واجهة الشبكة وإنشاء الأجهزة الظاهرية.

لتشخيص أي فشل في إدارة حسابات الأجهزة الظاهرية، ستراجع سجلات الضيوف للجهاز الظاهري الفاشل. للحصول على خطوات لجمع سجلات ضيوف الأجهزة الظاهرية وتضمينها في حزمة دعم، راجع جمع سجلات الضيف للأجهزة الظاهرية على Azure Stack Edge Pro.

للحصول على إرشادات حول المشكلات التي تمنع التحميل الناجح لصورة جهاز ظاهري قبل نشر الجهاز الظاهري، راجع استكشاف أخطاء عمليات تحميل صور الجهاز الظاهري وإصلاحها في Azure Stack Edge Pro GPU.

مهلة توفير الأجهزة الظاهرية

يوفر هذا القسم استكشاف الأخطاء وإصلاحها لمعظم الأسباب الشائعة لانتهاء مهلة توفير الأجهزة الظاهرية.

عند انتهاء مهلة إدارة الأجهزة الظاهرية، يظهر الخطأ التالي:

Screenshot of the error displayed in the Azure portal when VM provisioning times out in Azure Stack Edge.

المشكلات التالية هي أهم أسباب انتهاء مهلة توفير الأجهزة الظاهرية:

  • عنوان IP الذي قمت بتعيينه إلى الجهاز الظاهري قيد الاستخدام بالفعل. معرفة المزيد
  • لم يتم إعداد صورة الجهاز الظاهري التي استخدمتها لنشر الجهاز الظاهري بشكل صحيح. معرفة المزيد
  • تعذر الوصول إلى البوابة الافتراضية وخادم DNS من الجهاز الظاهري للضيف. معرفة المزيد
  • أثناء التثبيت cloud init ، cloud init إما أنه لم يتم تشغيله أو كانت هناك مشكلات أثناء تشغيله. (أجهزة لينكس الظاهرية فقط) التعرف على المزيد
  • بالنسبة إلى جهاز ظاهري Linux تم نشره باستخدام صورة VM مخصصة، فإن علامات إدارة الحسابات في الملف /etc/waagent.conf غير صحيحة. (أجهزة لينكس الظاهرية فقط) التعرف على المزيد

عنوان IP المعين إلى الجهاز الظاهري قيد الاستخدام بالفعل

وصف الخطأ: تم تعيين عنوان IP ثابت للجهاز الظاهري قيد الاستخدام بالفعل، وفشل توفير الجهاز الظاهري. يحدث هذا الخطأ عندما يكون عنوان IP قيد الاستخدام في الشبكة الفرعية التي يتم نشر الجهاز الظاهري عليها. عند نشر جهاز ظاهري عبر مدخل Azure، تتحقق العملية من وجود عنوان IP موجود داخل جهازك ولكن لا يمكنها التحقق من عناوين IP للخدمات الأخرى أو الأجهزة الظاهرية التي قد تكون موجودة أيضا على شبكتك الفرعية.

الحل المقترح: استخدم عنوان IP ثابتا غير مستخدم أو استخدم عنوان IP ديناميكيا يوفره خادم DHCP.

للتحقق من وجود عنوان IP مكرر:

  • قم بتشغيل الأمرين التاليين ping Test-NetConnection (tnc) من أي جهاز على نفس الشبكة:

    ping <IP address>
    tnc <IP address>
    tnc <IP address> -CommonTCPPort “RDP”
    

إذا تلقيت ردا، فهذا يعني أن عنوان IP الذي قمت بتعيينه إلى الجهاز الظاهري الجديد قيد الاستخدام بالفعل.

لم يتم إعداد صورة VM بشكل صحيح

وصف الخطأ: لإعداد صورة VM لاستخدامها على جهاز وحدة معالجة الرسومات Azure Stack Edge Pro، يجب عليك اتباع سير عمل معين. يجب إنشاء جهاز ظاهري gen1 في Azure وتخصيص الجهاز الظاهري وتعميم VHD ثم تنزيل OS VHD لهذا الجهاز الظاهري. يجب أن تكون الصورة المعدة عبارة عن gen1 VHD مع امتداد اسم الملف "vhd" والنوع الثابت.

للحصول على نظرة عامة حول المتطلبات، راجع إنشاء صور VM مخصصة لجهاز وحدة معالجة الرسومات Azure Stack Edge Pro. للحصول على إرشادات حول حل مشكلات صور الجهاز الظاهري، راجع استكشاف أخطاء عمليات تحميل صور الجهاز الظاهري وإصلاحها في Azure Stack Edge Pro GPU.

الحل المقترح: أكمل سير العمل لإعداد صورة الجهاز الظاهري. للحصول على إرشادات، راجع إحدى المقالات التالية:

البوابة، تعذر الوصول إلى خادم DNS من الجهاز الظاهري الضيف

وصف الخطأ: إذا تعذر الوصول إلى البوابة الافتراضية وخادم DNS أثناء نشر الجهاز الظاهري، فستنتهي مهلة توفير الأجهزة الظاهرية، وسيفشل نشر الجهاز الظاهري.

الحل المقترح: تحقق من إمكانية الوصول إلى البوابة الافتراضية وخادم DNS من الجهاز الظاهري. ثم كرر نشر الجهاز الظاهري.

للتحقق من إمكانية الوصول إلى البوابة الافتراضية وخادم DNS من الجهاز الظاهري، قم بالخطوات التالية:

  1. الاتصال إلى الجهاز الظاهري.

  2. شغّل الأوامر التالية:

    ping <default gateway IP address>
    ping <DNS server IP address>
    

    لمعرفة عناوين IP للبوابة الافتراضية وخوادم DNS، انتقل إلى واجهة المستخدم المحلية لجهازك. حدد المنفذ الذي تهتم به، واعرض إعدادات الشبكة.

    Screenshot of the Network page for an Azure Stack Edge device with Network settings for Port 2 displayed.

cloud init المشكلات (الأجهزة الظاهرية لنظام التشغيل Linux)

وصف الخطأ:cloud init لم يتم تشغيله ، أو كانت هناك مشكلات أثناء cloud init التشغيل. cloud-init يستخدم لتخصيص جهاز لينكس الظاهري عند تمهيد الجهاز الظاهري لأول مرة. لمزيد من المعلومات، راجع دعم السحابة الداخلية للأجهزة الظاهرية في Azure.

الحلول المقترحة: للبحث عن المشكلات التي حدثت عند cloud init تشغيلها:

  1. الاتصال إلى الجهاز الظاهري.

  2. تحقق من وجود cloud init أخطاء في ملفات السجل التالية:

    • /var/log/cloud-init-output.log
    • /var/log/cloud-init.log
    • /var/log/waagent/log

للتحقق من وجود بعض المشكلات الأكثر شيوعا التي تمنع cloud init التشغيل بنجاح، قم بالخطوات التالية:

  1. تأكد من أن صورة الجهاز الظاهري تستند إلى cloud init. شغِّل الأمر التالي:

    cloud-init --version

    يجب أن يقوم الأمر بإرجاع رقم إصدار init السحابي. إذا لم تكن cloud initالصورة مستندة إلى -، فلن يعرض الأمر معلومات الإصدار.

    للحصول على تعليمات حول cloud init الخيارات، قم بتشغيل الأمر التالي:

    cloud-init --help

  2. تأكد من إمكانية تشغيل المثيل cloud init بنجاح مع تعيين مصدر البيانات إلى Azure.

    عند تعيين مصدر البيانات إلى Azure، يبدو الإدخال في سجلات init السحابية مشابها للإدخال التالي.

    Illustration of a cloud-init log entry for a VM image with the Data Source set to Azure. The identifying text is highlighted.

    إذا لم يتم تعيين مصدر البيانات إلى Azure، فقد تحتاج إلى مراجعة البرنامج النصي cloud init . لمزيد من المعلومات، راجع الغوص بشكل أعمق في السحابة.

تعيين علامات إدارة الحسابات بشكل غير صحيح (الأجهزة الظاهرية لنظام التشغيل Linux)

وصف الخطأ: لنشر جهاز ظاهري Linux بنجاح في Azure، يجب تعطيل إدارة الحسابات على الصورة، ويجب تمكين إدارة الحسابات باستخدام cloud init . يتم تكوين علامات إدارة الحسابات التي تقوم بتعيين هذه القيم بشكل صحيح لصور الأجهزة الظاهرية القياسية. إذا كنت تستخدم صورة VM مخصصة، فأنت بحاجة إلى التأكد من صحتها.

الحل المقترح: تأكد من أن علامات إدارة الحسابات في الملف / etc/waagent.conf تحتوي على القيم التالية:

الإمكانية القيمة المطلوبة
تمكين إدارة الحسابات Provisioning.Enabled=n
الاعتماد على السحابة في التوفير Provisioning.UseCloudInit=y

مشكلات إنشاء واجهة الشبكة

يوفر هذا القسم إرشادات للمشكلات التي تتسبب في فشل إنشاء واجهة الشبكة أثناء نشر جهاز ظاهري.

مهلة إنشاء NIC

وصف الخطأ: لم يكتمل إنشاء واجهة الشبكة على الجهاز الظاهري خلال فترة المهلة المسموح بها. يمكن أن يحدث هذا الفشل بسبب مشكلات خادم DHCP في البيئة الخاصة بك.

للتحقق مما إذا كان قد تم إنشاء واجهة الشبكة بنجاح، قم بالخطوات التالية:

  1. في مدخل Azure، انتقل إلى مورد Azure Stack Edge لجهازك (انتقل إلى Edge ServicesVirtual>Machines). ثم حدد عمليات النشر، وانتقل إلى نشر الجهاز الظاهري.

  2. إذا لم يتم إنشاء واجهة شبكة بنجاح، فسترى الخطأ التالي.

    Screenshot of the error displayed in the Azure portal when network interface creation fails during VM deployment on an Azure Stack Edge device.

الحل المقترح: قم بإنشاء الجهاز الظاهري مرة أخرى ، وقم بتعيينه عنوان IP ثابت.

مشكلات إنشاء الأجهزة الظاهرية

يغطي هذا القسم المشكلات الشائعة التي تحدث أثناء إنشاء الجهاز الظاهري.

ذاكرة غير كافية لإنشاء الجهاز الظاهري

وصف الخطأ: عند فشل إنشاء الجهاز الظاهري بسبب عدم كفاية الذاكرة، سترى الخطأ التالي.

Screenshot of the error displayed in the Azure portal when VM creation fails on an Azure Stack Edge device.

الحل المقترح: تحقق من الذاكرة المتوفرة على الجهاز ، واختر حجم VM وفقا لذلك. لمزيد من المعلومات، راجع أحجام الأجهزة الظاهرية المدعومة على Azure Stack Edge.

الذاكرة المتاحة لنشر جهاز ظاهري مقيدة بعدة عوامل:

الحلول المقترحة:

  • استخدم حجم VM يتطلب ذاكرة أقل.
  • أوقف أي أجهزة ظاهرية غير مستخدمة من البوابة الإلكترونية قبل نشر الجهاز الظاهري الجديد.
  • احذف أي أجهزة ظاهرية لم تعد قيد الاستخدام.

عدد غير كاف من وحدات معالجة الرسومات لإنشاء GPU VM

إذا حاولت نشر جهاز ظاهري على جهاز GPU تم تمكين Kubernetes عليه بالفعل، فلن تتوفر وحدات معالجة رسومات، وسيفشل توفير الجهاز الظاهري بسبب الخطأ التالي:

Screenshot of the error displayed in the Azure portal when creation of a GPU VM fails because of no available GPUs on an Azure Stack Edge device.

الأسباب المحتملة: إذا تم تمكين Kubernetes قبل إنشاء الجهاز الظاهري ، فستستخدم Kubernetes جميع وحدات معالجة الرسومات المتاحة ، ولن تتمكن من إنشاء أي أجهزة ظاهرية بحجم GPU. يمكنك إنشاء العديد من الأجهزة الظاهرية بحجم وحدة معالجة الرسومات مثل عدد وحدات معالجة الرسومات المتاحة. يمكن تجهيز جهاز Azure Stack Edge ب 1 أو 2 وحدة معالجة رسومات.

الحل المقترح: للحصول على خيارات نشر الأجهزة الظاهرية على جهاز 1-GPU أو 2-GPU مع تكوين Kubernetes، راجع الأجهزة الظاهرية لوحدة معالجة الرسومات وKubernetes.

الخطوات التالية