استكشاف مشكلات Azure Chaos Studio وإصلاحها

أثناء استخدام Azure Chaos Studio، قد تواجه أحيانا بعض المشاكل. تشرح هذه المقالة المشاكل الشائعة وخطوات استكشاف الأخطاء وإصلاحها.

تلميحات عامة حول استكشاف الأخطاء وإصلاحها

تكون المصادر التالية مفيدة عند استكشاف مشكلات Chaos Studio وإصلاحها:

  • سجل النشاط: يحتوي سجل نشاط Azure على سجل لكافة عمليات الإنشاء والتحديث والحذف في الاشتراك. تتضمن هذه السجلات عمليات Chaos Studio مثل تمكين هدف أو قدرات، وتثبيت العامل، وإنشاء تجربة أو تشغيلها. تشير حالات الفشل في سجل النشاط إلى أن إجراء المستخدم الأساسي لاستخدام Chaos Studio قد فشل في إكماله. تقوم معظم الأخطاء المباشرة للخدمة أيضا بحقن الأخطاء عن طريق تنفيذ عملية Azure Resource Manager، لذلك يحتوي سجل النشاط أيضا على سجل الأخطاء التي تم إدخالها أثناء تجربة لبعض الأخطاء المباشرة للخدمة.
  • تفاصيل التجربة: توضح تفاصيل تنفيذ التجربة حالة وأخطاء تشغيل تجربة فردية. يظهر فتح خطأ معين في تفاصيل التجربة الموارد التي فشلت ورسائل الخطأ للفشل. تعرف على المزيد حول كيفية الوصول إلى تفاصيل التجربة.
  • سجلات العامل: إذا كنت تستخدم خطأ يستند إلى عامل، فقد تحتاج إلى RDP أو SSH في الجهاز الظاهري (VM) لفهم سبب فشل العامل في تشغيل خطأ. تعتمد إرشادات الوصول إلى سجلات العامل على نظام التشغيل:
    • عامل Chaos Windows: سجلات العامل في سجل أحداث Windows في فئة التطبيق مع المصدر AzureChaosAgent. يضيف العامل نشاط الخطأ والتحقق من الصحة المنتظم (القدرة على المصادقة على أحداث خدمة عامل Chaos Studio والتواصل معها) إلى هذا السجل.
    • عامل Chaos Linux: يستخدم عامل Linux النظام لإدارة عملية العامل كخدمة Linux. لعرض دفتر اليومية النظامي للعامل (الأحداث التي تم تسجيلها بواسطة خدمة العامل)، قم بتشغيل الأمر journalctl -u azure-chaos-agent.
  • حالة ملحق الجهاز الظاهري: إذا كنت تستخدم خطأ يستند إلى عامل، فتحقق من تثبيت ملحق الجهاز الظاهري وصحته. في مدخل Microsoft Azure، انتقل إلى الجهاز الظاهري وانتقل إلى Extensions أو Extensions + applications. حدد الملحق ChaosAgent وابحث عن الحقول التالية:
    • يجب أن تظهر الحالة نجاح التزويد. تشير أي حالة أخرى إلى فشل العامل في التثبيت. تحقق من تلبية جميع متطلبات النظام. حاول إعادة تثبيت العامل.
    • يجب أن تظهر حالة المعالج جاهزة. تشير أي حالة أخرى إلى أن العامل مثبت ولكن لا يمكنه الاتصال ب Chaos Studio. تحقق من تلبية جميع متطلبات الشبكة ومن إضافة الهوية المدارة المعينة من قبل المستخدم إلى الجهاز الظاهري. حاول إعادة التشغيل.

المشاكل عند إضافة مورد

قد تواجه المشاكل التالية عند إضافة مورد.

لا تظهر الموارد في قائمة الأهداف في مدخل Microsoft Azure

إذا كنت لا ترى الموارد التي تريد تمكينها في قائمة أهداف Chaos Studio، فقد يكون ذلك بسبب أي من المشكلات التالية:

  • الموارد ليست في منطقة مدعومة ل Chaos Studio.
  • الموارد ليست من نوع مورد مدعوم في Chaos Studio.
  • الموارد موجودة في اشتراك أو مجموعة موارد تمت تصفيتها في عوامل التصفية للقائمة الهدف. قم بتغيير عوامل تصفية الاشتراك ومجموعة الموارد لمشاهدة مواردك.

فشل تمكين الهدف أو القدرة أو عدم إظهارهما بشكل صحيح في القائمة الهدف

إذا رأيت خطأ عند تمكين الأهداف أو القدرات، فجرب الخطوات التالية:

  1. تحقق من أن لديك الأذونات المناسبة للموارد التي تضيفها. يتطلب تمكين هدف أو قدرات إذن Microsoft.Chaos/* في نطاق المورد. الأدوار المضمنة مثل المساهم لها إذن قراءة وكتابة حرف بدل، والذي يتضمن الإذن لجميع عمليات Microsoft.Chaos.
  2. انتظر بضع دقائق حتى يتم تحديث قائمة الهدف والقدرة. يستخدم مدخل Azure Azure Resource Graph لجمع معلومات حول إضافة الأهداف والقدرات. قد يستغرق نشر التحديث ما يصل إلى خمس دقائق.
  3. إذا كان المورد لا يزال يظهر غير ممكن، فجرب الخطوات التالية:
    1. حاول تمكين المورد مرة أخرى.
    2. إذا كان تمكين المورد لا يزال يفشل، فانتقل إلى سجل النشاط وابحث عن عملية إنشاء الهدف الفاشلة لمشاهدة معلومات الخطأ التفصيلية.
  4. إذا أظهر المورد تمكين ولكن فشلت إضافة القدرات، فجرب الخطوات التالية:
    1. حدد إدارة الإجراءات على المورد في قائمة الأهداف. تحقق من أي قدرات لم يتم تحديدها وحدد حفظ.
    2. إذا كان تمكين القدرة لا يزال يفشل، فانتقل إلى سجل النشاط وابحث عن عملية إنشاء الهدف الفاشلة لمشاهدة معلومات الخطأ التفصيلية.

مشاكل المتطلبات الأساسية

تحدث بعض المشاكل بسبب المتطلبات الأساسية المفقودة.

تفشل الأخطاء المستندة إلى العامل على جهاز ظاهري

قد تفشل الأخطاء المستندة إلى العامل لأسباب مختلفة تتعلق بالمتطلبات الأساسية المفقودة:

  • على أجهزة Linux الظاهرية، يتطلب ضغط وحدة المعالجة المركزية وضغط الذاكرة المادية وضغط إدخال/إخراج القرص وأخطاء الإجهاد العشوائية-ng أن يتم تثبيت الأداة المساعدة stress-ng على الجهاز الظاهري الخاص بك. لمزيد من المعلومات حول كيفية تثبيت stress-ng، راجع أقسام المتطلبات الأساسية للخطأ.
  • على أجهزة Linux أو Windows الظاهرية، يجب أيضا إضافة الهوية المدارة المعينة من قبل المستخدم المقدمة أثناء تمكين الهدف المستند إلى العامل إلى الجهاز الظاهري.
  • على أجهزة Linux أو Windows الظاهرية، يجب منح الهوية المدارة المعينة من قبل النظام للتجربة دور القارئ على الجهاز الظاهري. (لا تتضمن الأدوار المرتفعة على ما يبدو مثل مساهم الجهاز الظاهري عملية */Read الضرورية لعامل Chaos Studio لقراءة مورد الوكيل الهدف microsoft-agent على الجهاز الظاهري.)

لن يتم تثبيت عامل الفوضى على مجموعات مقياس الجهاز الظاهري

قد يفشل تثبيت عامل Chaos على مجموعات مقياس الجهاز الظاهري دون إظهار خطأ إذا تم تعيين نهج ترقية مجموعة مقياس الجهاز الظاهري إلى يدوي. للتحقق من نهج ترقية مجموعة مقياس الجهاز الظاهري:

  1. قم بتسجيل الدخول إلى بوابة Azure.
  2. حدد Virtual Machine Scale Set.
  3. في الجزء الأيمن، حدد Upgrade policy.
  4. تحقق من وضع الترقية لمعرفة ما إذا تم تعيينه إلى يدوي - يجب ترقية المثيلات الموجودة يدويا.

إذا تم تعيين نهج الترقية إلى يدوي، يجب ترقية مثيلات Azure Virtual Machine Scale Sets بحيث يمكن إنهاء تثبيت عامل Chaos.

ترقية المثيلات من مدخل Microsoft Azure

يمكنك ترقية مثيلات مجموعات مقياس الجهاز الظاهري من مدخل Microsoft Azure:

  1. قم بتسجيل الدخول إلى بوابة Azure.
  2. حدد Virtual Machine Scale Set.
  3. في الجزء الأيمن، حدد Instances.
  4. حدد كافة المثيلات وحدد ترقية.

ترقية المثيلات باستخدام Azure CLI

يمكنك ترقية مثيلات مجموعات مقياس الجهاز الظاهري باستخدام Azure CLI:

  • من Azure CLI، استخدم az vmss update-instances لترقية مثيلاتك يدويا:

    az vmss update-instances --resource-group myResourceGroup --name myScaleSet --instance-ids {instanceIds}
    

لمزيد من المعلومات، راجع تحديث الأجهزة الظاهرية بأحدث نموذج لمجموعة التحجيم.

فشل أخطاء AKS Chaos Mesh

قد تفشل أخطاء Azure Kubernetes Service (AKS) Chaos Mesh لأسباب مختلفة تتعلق بالمتطلبات الأساسية المفقودة:

  • يجب أولا تثبيت Chaos Mesh على مجموعة AKS قبل استخدام أخطاء AKS Chaos Mesh. للحصول على إرشادات، راجع أخطاء Chaos Mesh على البرنامج التعليمي AKS.
  • Chaos Mesh يجب أن يكون الإصدار 2.0.4 أو أحدث. يمكنك الحصول على إصدار Chaos Mesh عن طريق الاتصال بمجموعة AKS وتشغيل helm version chaos-mesh.
  • يجب تثبيت Chaos Mesh مع مساحة chaos-testingالاسم . أسماء مساحات الأسماء الأخرى ل Chaos Mesh غير مدعومة.
  • يجب تعيين دور مسؤول نظام مجموعة AKS إلى الهوية المدارة المعينة من قبل النظام لتجربة الفوضى.

المشاكل عند إنشاء تجربة أو تصميمها

قد تواجه مشكلات عند إنشاء تجربة أو تصميمها.

عند إضافة خطأ، لا يظهر موردي في قائمة الموارد الهدف

عند إضافة خطأ، إذا كنت لا ترى المورد الذي تريد استهدافه بخطأ في قائمة الموارد الهدف، فقد يكون ذلك بسبب أي من المشكلات التالية:

  • تم تعيين عامل تصفية الاشتراك لاستبعاد الاشتراك الذي يتم نشر هدفك فيه. حدد عامل تصفية الاشتراك وقم بتعديل الاشتراكات المحددة.
  • لم تتم إضافة المورد بعد. انتقل إلى طريقة عرض Targets وقم بتمكين الهدف. ثم أغلق جزء إضافة خطأ وأعد فتحه لمشاهدة قائمة أهداف محدثة.
  • لم يتم تمكين المورد لنوع الهدف من هذا الخطأ حتى الآن. راجع مكتبة الخطأ لمعرفة نوع الهدف المستخدم للخطأ. ثم انتقل إلى طريقة العرض Targets وقم بتمكين نوع الهدف هذا. النوع إما يستند إلى عامل لأخطاء microsoft-agent أو خدمة مباشرة لجميع الأنواع المستهدفة الأخرى. ثم أغلق جزء إضافة خطأ وأعد فتحه لمشاهدة قائمة أهداف محدثة.
  • لا يملك المورد القدرة على تمكين هذا الخطأ حتى الآن. راجع مكتبة الخطأ لمشاهدة اسم القدرة للخطأ. ثم انتقل إلى طريقة العرض Targets وحدد Manage actions على المورد الهدف. حدد خانة الاختيار للقدرة التي تتوافق مع الخطأ الذي تحاول تشغيله وحدد حفظ. ثم أغلق جزء إضافة خطأ وأعد فتحه لمشاهدة قائمة أهداف محدثة.
  • تمت إضافة المورد مؤخرا ولم يظهر في Resource Graph حتى الآن. يتم الاستعلام عن قائمة الموارد الهدف من Resource Graph. بعد تمكين هدف جديد، قد يستغرق نشر التحديث إلى Resource Graph ما يصل إلى خمس دقائق. انتظر بضع دقائق، ثم أعد فتح جزء إضافة خطأ .

عند إنشاء تجربة، أحصل على الخطأ "موفر microsoft:agent يتطلب هوية مدارة"

يحدث هذا الخطأ عندما لا يتم نشر العامل على الجهاز الظاهري الخاص بك. للحصول على إرشادات التثبيت، راجع إنشاء تجربة تستخدم أخطاء تستند إلى عامل وتشغيلها.

عند إنشاء تجربة، أحصل على الخطأ "نوع وسائط المحتوى 'null' غير مدعوم. يتم دعم "التطبيق/json" فقط"

قد تواجه هذا الخطأ إذا كنت تقوم بإنشاء تجربتك باستخدام قالب Azure Resource Manager أو واجهة برمجة تطبيقات Chaos Studio REST. يشير الخطأ إلى وجود JSON مشوه في تعريف تجربتك. تحقق لمعرفة ما إذا كان لديك أي أخطاء في بناء الجملة، مثل الأقواس أو الأقواس غير المتطابقة ({} و []). للتحقق، استخدم JSON linter مثل Visual Studio Code.

المشاكل عند تشغيل تجربة

قد تواجه مشكلات عند تشغيل تجربة.

حالة تنفيذ تجربتي بعد البدء هي "فشل"

من قائمة التجارب في مدخل Microsoft Azure، حدد اسم التجربة لمشاهدة نظرة عامة على التجربة. في قسم History، حدد Details بجوار تشغيل التجربة الفاشلة لمشاهدة معلومات الخطأ التفصيلية.

لقطة شاشة تعرض محفوظات التجربة.

فشل الخطأ المستند إلى العامل الخاص بي مع ظهور الخطأ "تحقق من إضافة الهدف بشكل صحيح وتم توفير أذونات القراءة المناسبة إلى تجربة msi"

قد يحدث هذا الخطأ إذا قمت بإضافة العامل باستخدام مدخل Microsoft Azure، الذي يحتوي على مشكلة معروفة. لا يؤدي تمكين هدف يستند إلى عامل إلى تعيين الهوية المدارة المعينة من قبل المستخدم إلى الجهاز الظاهري أو مجموعة مقياس الجهاز الظاهري.

لحل هذه المشكلة، انتقل إلى الجهاز الظاهري أو مقياس الجهاز الظاهري الذي تم تعيينه في مدخل Microsoft Azure وانتقل إلى Identity. افتح علامة التبويب تعيين المستخدم وأضف الهوية المعينة من قبل المستخدم إلى الجهاز الظاهري. بعد الانتهاء، قد تحتاج إلى إعادة تشغيل الجهاز الظاهري للعامل للاتصال.

فشل الخطأ المستند إلى العامل الخاص بي مع ظهور الخطأ "العامل يقوم بالفعل بتنفيذ مهمة أخرى"

سيحدث هذا الخطأ إذا حاولت تشغيل أخطاء عامل متعددة في نفس الوقت. اليوم يدعم العامل تشغيل خطأ عامل واحد فقط في كل مرة، وسيفشل إذا قمت بتعريف تجربة تقوم بتشغيل أخطاء عامل متعددة في نفس الوقت.

مشاكل عند إعداد هوية مدارة

عندما أحاول إضافة هوية مدارة معينة من قبل النظام/معينة من قبل المستخدم إلى تجربتي الحالية، فإنها تفشل في الحفظ.

إذا كنت تحاول إضافة هوية مدارة معينة من قبل المستخدم أو معينة من قبل النظام إلى تجربة تم تعيين هوية مدارة لها بالفعل ، تفشل التجربة في النشر. تحتاج إلى حذف الهوية المدارة الحالية المعينة من قبل المستخدم أو المعينة من قبل النظام على التجربة المطلوبة أولا قبل إضافة الهوية المدارة المطلوبة.

عند تشغيل تجربة تم تكوينها لإنشاء دور مخصص وتعيينه تلقائيا، أحصل على الخطأ "تعذر حل المورد (الموارد) الهدف. ErrorCode: AccessDenied. المورد (الموارد) الهدف:"

عند تحديد خانة الاختيار "أذونات الدور المخصص" لتجربة ما، يقوم Chaos Studio بإنشاء دور مخصص وتعيينه بالأذونات الضرورية لهوية التجربة. ومع ذلك، يخضع هذا إلى تعيين الدور وحدود تعريف الدور التالية:

  • يحتوي كل اشتراك Azure على حد 4000 تعيين دور.
  • يحتوي كل مستأجر Microsoft Entra على حد 5000 تعريف دور (أو 2000 تعريف دور ل Azure في الصين).

عند الوصول إلى أحد هذه الحدود، سيحدث هذا الخطأ. لحل هذه المشكلة، امنح أذونات لهوية التجربة يدويا بدلا من ذلك.