أخطاء إنشاء نظام المجموعة على Azure HDInsight على AKS

توضح هذه المقالة كيفية استكشاف الأخطاء التي قد تحدث عند إنشاء Azure HDInsight على مجموعات AKS وحلها.

رقم الرئيس رسالة الخطأ السبب الحل
1 InternalServerError UnrecognizableError قد يشير هذا الخطأ إلى قالب غير صحيح مستخدم. حاليا، يسمح بموصلات قاعدة البيانات فقط من خلال قالب ARM. ومن ثم لا يمكن التحقق من صحة التكوين على القالب.
2 InvalidClusterSpec - ServiceDependencyFailure - تكوين غير صالح الحد الأقصى للذاكرة لكل خطأ عقدة. راجع الحد الأقصى من أنواع قيم خصائص تكوينات الذاكرة.
3 WaitingClusterResourcesReadyTimeOut - Metastoreservice غير مقروء قد يكون هذا الخطأ بسبب اسم الحاوية قد يحتوي فقط على أحرف صغيرة وأرقام وواصلات. يجب أن يبدأ اسم الحاوية بحرف أو رقم. يجب أن يسبق كل واصلة حرفا غير ظاهر ويتبعه. يجب أن يتراوح طول الاسم أيضاً بين 3 و63 حرفاً.
4 InvalidClusterSpec -تكوين غير صالح - ClusterUpsertActivity خطأ: خاصية hive.metastore.uri: may not be nullتكوين غير صالحة . راجع وثائق موصل Hive.
5 InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call. أعد محاولة العملية أو افتح تذكرة دعم لفريق Azure HDInsight.
6 InternalServerError - ObjectDisposedException يحدث في التعليمات البرمجية ل RP. أعد محاولة العملية أو افتح تذكرة دعم لفريق Azure HDInsight.
7 PreconditionFailed - فشل العملية بسبب حدود الحصة النسبية على اشتراك المستخدم. هناك التحقق من صحة الحصة النسبية قبل إنشاء نظام المجموعة. ولكن عند إنشاء عدة مجموعات ضمن نفس الاشتراك في نفس الوقت، من الممكن أن تحتل المجموعة الأولى الحصة النسبية وفشل المجموعة الأخرى بسبب نقص الحصة النسبية. تأكد من وجود حصة نسبية كافية وأعد محاولة إنشاء مجموعة نظام المجموعة/المجموعة.
8 ReconcileApplicationSecurityGroupError - خطأ AKS داخلي أعد محاولة العملية أو افتح تذكرة دعم لفريق Azure HDInsight.
9 ResourceGroupBeingDeleted أثناء HDI على إنشاء مورد AKS أو تحديثه، يقوم المستخدم أيضا بحذف بعض الموارد في مجموعات الموارد ذات الصلة. لا تحذف الموارد في مجموعات الموارد ذات الصلة ب HDI عند إنشاء HDI على موارد AKS أو تحديثها.
10 UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out. مشكلة AKS - قد يكون بسبب ارتفاع نسبة استخدام الشبكة في منطقة معينة في وقت العملية. أعد محاولة العملية لاحقاً. إذا كان ذلك ممكنا، استخدم منطقة أخرى.
11 Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} لا يتم تعيين مبدأ خدمة 1-p إلى المستأجر. تنفيذ الأمر لتوفير مبدأ خدمة 1-p على المستأجر الجديد للإلحاق.
12 NotFound - ARM/AKS sdk error يحاول المستخدم تحديث HDI على نظام مجموعة AKS ولكن تم حذف تجمع العامل المقابل. تم حذف تجمع العامل المقابل. لا يوصى بتشغيل تجمع وكلاء AKS مباشرة.
13 AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi عدم وجود إذن لتنفيذ العملية. تحقق مما إذا كان معرف تطبيق مبدأ الخدمة المذكور في رسالة الخطأ التي تملكها. إذا كانت الإجابة بنعم، فامنح الإذن وفقا لرسالة الخطأ. إذا كان لا، فافتح تذكرة دعم لفريق Azure HDInsight.
14 DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespcae failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} تم تبديل RP إلى مثيل دور جديد بشكل غير متوقع. أعد محاولة العملية أو افتح تذكرة دعم لفريق Azure HDInsight.
15 EntityStoreOperationError - ARM/AKS sdk error فشلت عملية قاعدة بيانات على جانب AKS أثناء تحديث نظام المجموعة. أعد محاولة العملية لاحقاً. إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
16 InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} تسبب هذا الخطأ بسبب مشكلات مختلفة. أعد محاولة العملية أو افتح تذكرة دعم لفريق Azure HDInsight.
17 InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} تسبب هذا الخطأ بسبب مشكلات مختلفة. أعد محاولة العملية بعد بعض الوقت. إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
18 InternalServerError - Null reference exception occurs in RP code. تسبب هذا الخطأ بسبب مشكلات مختلفة. أعد محاولة العملية أو افتح تذكرة دعم لفريق Azure HDInsight.
19 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} تسبب هذا الخطأ بسبب مشكلات مختلفة. أعد محاولة العملية أو افتح تذكرة دعم لفريق Azure HDInsight.
20 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} تسبب هذا الخطأ بسبب مشكلات مختلفة. أعد محاولة العملية أو افتح تذكرة دعم لفريق Azure HDInsight.
21 OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. عملية تجمع عامل أخرى (تغيير الحجم) قيد التقدم. تسبب هذا الخطأ بسبب إعادة تشغيل RP Service Fabric. انتظر حتى تنتهي العملية السابقة قبل بدء عملية جديدة. إذا استمرت المشكلة بعد إعادة المحاولة، فافتح تذكرة دعم لفريق Azure HDInsight.
22 ReconcileVMSSAgentPoolFailed هناك التحقق من صحة الحصة النسبية قبل إنشاء نظام المجموعة. ولكن عند إنشاء عدة مجموعات ضمن نفس الاشتراك في نفس الوقت، من الممكن أن تحتل المجموعة الأولى الحصة النسبية وتفشل المجموعات الأخرى بسبب نقص الحصة النسبية. تأكد من وجود حصة نسبية كافية وأعد محاولة إنشاء مجموعة نظام المجموعة/المجموعة.
23 ReconcileVMSSAgentPoolFailed - غير قادر على إنشاء اتصال صادر من العوامل AKS/VMSS المشكلة الجانبية: أبلغ الجهاز الظاهري عن فشل. أعد محاولة العملية بعد بعض الوقت. إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
24 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} حدث هذا الخطأ بسبب مشكلة عابرة في اتصال SQL. أعد محاولة العملية بعد بعض الوقت. إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
25 NotLatestOperation - ARM/AKS SDK error لا يمكن متابعة العملية. إما أن العملية قد تم استباقها من قبل عملية أخرى، أو فشل حفظ المعلومات التي تحتاجها العملية (أو لم يتم حفظها بعد). أعد محاولة العملية بعد بعض الوقت. إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
26 ReconcileVMSSAgentPoolFailed - Agent pool drain failed كانت هناك مشكلة في عملية تقليص الحجم. افتح تذكرة دعم لفريق Azure HDInsight.
27 ResourceNotFound - ARM/AKS SDK error تحدث مشكلة الخطأ هذه عند إزالة/حذف مورد مطلوب من قبل المستخدم. تأكد من وجود المورد المذكور في رسالة الخطأ، ثم أعد محاولة العملية. إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
28 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.]. قد تنتهي مهلة تهيئة HMS بسبب خادم SQL أو المشكلات المتعلقة بالتخزين. افتح تذكرة دعم لفريق Azure HDInsight.
29 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.]. يمكن أن يحدث هذا الخطأ بسبب keyvault تعذر الوصول إليه أو عدم توفر المفتاح السري. في بعض الحالات النادرة، قد يكون هذا الخطأ بسبب تهيئة أبطأ لهوية الجراب في عقد نظام المجموعة. إذا كان لديك Log Analytics ممكن، فتحقق من سجلات secretprovider-validate job لتحديد reason.retry العملية بعد بعض الوقت، إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
30 FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} يمكن أن يحدث هذا الخطأ لأسباب مختلفة مثل مشكلة سحب الصورة أو وحدات التحكم غير جاهزة أو مشكلة في MSI. أعد محاولة العملية بعد بعض الوقت، إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
31 FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} يمكن أن يحدث هذا الخطأ لأسباب مختلفة مثل مشكلة سحب الصورة أو وحدات التحكم غير جاهزة أو مشكلة في MSI. أعد محاولة العملية بعد بعض الوقت، إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
32 InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}'. يمكن أن يحدث هذا الخطأ إذا كان تكوين الخدمة يتكون من مكونات غير مسموح بها. تحقق من صحة مكونات تكوين الخدمة وأعد المحاولة. إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
33 InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies. يمكن أن يحدث هذا الخطأ بسبب عدم تشغيل خدمات HMS وSPARK وYARN، وقد يكون هذا الخطأ مرتبطا بالتخزين. افتح تذكرة دعم لفريق Azure HDInsight.
34 WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. افتح تذكرة دعم لفريق Azure HDInsight.
35 WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} يمكن أن يحدث هذا الخطأ بسبب عدم تشغيل خدمات HMS وSPARK وYARN، وقد يكون هذا الخطأ مرتبطا بالتخزين. افتح تذكرة دعم لفريق Azure HDInsight.
36 InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value]. يمكن أن يحدث هذا الخطأ عند تمرير الملفات غير المدعومة في تكوين الخدمات. تحقق من صحة مكونات تكوين الخدمة وأعد المحاولة. إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
37 InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." معلمات المصادقة غير صالحة - موقع التخزين غير قابل للوصول. تصحيح معلمات المصادقة وإعادة المحاولة. إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.
38 InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.]. يمكن أن يحدث هذا الخطأ عندما تستغرق موارد هوية الجراب وقتا طويلا للبدء على العقدة عند جدولة جراب HMS. أعد محاولة العملية، إذا استمرت المشكلة، افتح تذكرة دعم لفريق Azure HDInsight.

الخطوات التالية