AKS üzerinde Azure HDInsight'ta küme oluşturma hataları
Bu makalede AKS kümelerinde Azure HDInsight oluşturduğunuzda oluşabilecek hataların nasıl giderilebileceği ve çözülebileceği açıklanır.
Sr. Hayır | Hata iletisi | Neden | Çözünürlük |
---|---|---|---|
Kategori 1 | InternalServerError UnrecognizableError | Bu hata, yanlış bir şablonun kullanıldığını gösterebilir. Şu anda veritabanı bağlayıcılarına yalnızca ARM şablonu aracılığıyla izin verilir. Bu nedenle şablonda yapılandırma doğrulaması mümkün değildir. | |
2 | InvalidClusterSpec - ServiceDependencyFailure - Geçersiz yapılandırma | Düğüm başına en fazla bellek hatası. | En yüksek bellek yapılandırmaları özellik değer türlerine bakın. |
3 | WaitingClusterResourcesReadyTimeOut - Meta veri deposu hizmeti okunmadı | Bu hatanın nedeni kapsayıcı adının yalnızca küçük harf, sayı ve kısa çizgi içermesi olabilir. Kapsayıcı adı bir harf veya sayı ile başlamalıdır. | Her kısa çizginin önüne ve ardından bir tire olmayan karakter gelmelidir. Ad da 3 ile 63 karakter uzunluğunda olmalıdır. |
4 | InvalidClusterSpec -Geçersiz yapılandırma - ClusterUpsertActivity | Hata: Geçersiz yapılandırma özelliği hive.metastore.uri: may not be null . |
Hive bağlayıcısı belgelerine bakın. |
5 | InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call . |
İşlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. | |
6 | InternalServerError - ObjectDisposedException RP kodunda gerçekleşir. |
İşlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. | |
7 | PreconditionFailed - Kullanıcı aboneliğindeki kota sınırları nedeniyle işlem başarısız oldu. |
Küme oluşturmadan önce kota doğrulaması vardır. Ancak aynı abonelik altında aynı anda birkaç küme oluşturulduğunda, ilk küme kotayı kaplar ve diğeri kota yetersizliklerinden dolayı başarısız olabilir. | Yeterli kota olduğunu onaylayın ve küme/küme havuzu oluşturmayı yeniden deneyin. |
8 | ReconcileApplicationSecurityGroupError - İç AKS hatası |
İşlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. | |
9 | ResourceGroupBeingDeleted |
AKS kaynak oluşturma veya güncelleştirmesinde HDI sırasında, kullanıcı ilgili kaynak gruplarındaki bazı kaynakları da siliyor. | AKS kaynakları üzerinde HDI oluşturulurken veya güncelleştirilirken HDI ile ilgili kaynak gruplarındaki kaynakları silmeyin. |
10 | UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out . |
AKS sorunu – işlem sırasında belirli bir bölgedeki yüksek trafik nedeniyle olabilir. | Bir süre sonra işlemi yeniden deneyin. Mümkünse başka bir bölge kullanın. |
11 | Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} |
1-p hizmet ilkesi kiracıya bağlı değildir. | Yeni kiracıda 1-p hizmet ilkesini sağlamak için komutunu yürüterek ekleme. |
12 | NotFound - ARM/AKS sdk error |
Kullanıcı AKS kümesinde HDI'yi güncelleştirmeyi dener ancak ilgili aracı havuzu silindi. | İlgili aracı havuzu silindi. AKS aracı havuzunun doğrudan çalıştırılması önerilmez. |
13 | AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi |
İşlemi gerçekleştirmek için izin eksikliği. | Size ait hata iletisinde belirtilen hizmet ilkesi uygulama kimliğini denetleyin. Evet ise, hata iletisine göre izni verin. Hayır ise Azure HDInsight ekibine bir destek bileti açın. |
14 | DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespcae failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} |
RP beklenmedik şekilde yeni bir rol örneğine geçti. | işlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
15 | EntityStoreOperationError - ARM/AKS sdk error |
Küme güncelleştirmesi sırasında AKS tarafında veritabanı işlemi başarısız oldu. | Bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
16 | InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} |
Bu hata çeşitli sorunlara neden oldu. | işlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
17 | InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} |
Bu hata çeşitli sorunlara neden oldu. | bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
18 | InternalServerError - Null reference exception occurs in RP code . |
Bu hata çeşitli sorunlara neden oldu. | İşlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
19 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} |
Bu hata çeşitli sorunlara neden oldu. | işlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
20 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} |
Bu hata çeşitli sorunlara neden oldu. | işlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
21 | OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. |
Başka bir aracı havuzu işlemi (Ölçeklendirme) devam ediyor. Bu hata, RP Service Fabric'in yeniden başlatılması nedeniyle oluştu. | Yeni bir işlem başlatmadan önce önceki işlemin tamamlanmasını bekleyin. Yeniden denemeden sonra sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
22 | ReconcileVMSSAgentPoolFailed |
Küme oluşturmadan önce kota doğrulaması vardır. Ancak aynı abonelik altında aynı anda birkaç küme oluşturulduğunda, ilk küme kotayı kaplar ve diğerleri kota yetersizliklerinden dolayı başarısız olabilir. | Yeterli kota olduğunu onaylayın ve küme/küme havuzu oluşturmayı yeniden deneyin. |
23 | ReconcileVMSSAgentPoolFailed - Aracılardan giden bağlantı kurulamıyor |
AKS/VMSS yan sorun: VM bir hata bildirdi. |
bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
24 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} |
Bu hata geçici bir SQL bağlantısı sorunundan kaynaklanır. | bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
25 | NotLatestOperation - ARM/AKS SDK error |
İşlem devam edilemiyor. İşlem başka bir işlem tarafından önceden yüklenmiş veya işlemin gerektirdiği bilgiler kaydedilemedi (veya henüz kaydedilmedi). | bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
26 | ReconcileVMSSAgentPoolFailed - Agent pool drain failed |
Ölçeği azaltma işlemiyle ilgili bir sorun oluştu. | Azure HDInsight ekibine bir destek bileti açın. |
27 | ResourceNotFound - ARM/AKS SDK error |
Bu hata sorunu, gerekli bir kaynak kullanıcı tarafından kaldırıldığında/silindiğinde oluşur. | Hata iletisinde belirtilen kaynağın mevcut olduğundan emin olun ve işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
28 | InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.] . |
SQL server veya depolamayla ilgili sorunlar nedeniyle HMS başlatma zaman aşımına uğradı. | Azure HDInsight ekibine bir destek bileti açın. |
29 | InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.] . |
Bu hatanın nedeni keyvault erişilemez olması veya gizli anahtarın kullanılamaması olabilir. Bazı nadir durumlarda bu hata, küme düğümlerinde pod kimliğinin daha yavaş başlatılmasından kaynaklanıyor olabilir. |
Log Analytics'i etkinleştirdiyseniz nedenini belirlemek için günlüklerine secretprovider-validate job bakın.sorun devam ederse bir süre sonra işlemi yeniden deneyin, Azure HDInsight ekibine bir destek bileti açın. |
30 | FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} |
Bu hata, görüntü çekme sorunu veya denetleyici podlarının hazır olmaması veya MSI ile ilgili bir sorun gibi çeşitli nedenlerden kaynaklanabilir. | Bir süre sonra işlemi yeniden deneyin; sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
31 | FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} |
Bu hata, görüntü çekme sorunu veya denetleyici podlarının hazır olmaması veya MSI ile ilgili bir sorun gibi çeşitli nedenlerden kaynaklanabilir. | Bir süre sonra işlemi yeniden deneyin; sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
32 | InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}' . |
Hizmet yapılandırması izin verilmeyen bileşenlerden oluşuyorsa bu hata oluşabilir. | Hizmet yapılandırma bileşenlerini doğrulayın ve yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
33 | InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies . |
Bu hata HMS, SPARK, YARN hizmetlerinin çalışmaması nedeniyle oluşabilir, bu hata depolamayla ilgili olabilir. | Azure HDInsight ekibine bir destek bileti açın. |
34 | WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. |
Azure HDInsight ekibine bir destek bileti açın. | |
35 | WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} |
Bu hata HMS, SPARK, YARN hizmetlerinin çalışmaması nedeniyle oluşabilir, bu hata depolamayla ilgili olabilir. | Azure HDInsight ekibine bir destek bileti açın. |
36 | InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value] . |
Desteklenmeyen dosyalar hizmet yapılandırmasında geçirildiğinde bu hata oluşabilir. | Hizmet yapılandırma bileşenlerini doğrulayın ve yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
37 | InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." |
Geçersiz kimlik doğrulama parametreleri – depolama konumuna erişilemiyor. | Kimlik doğrulama parametrelerini düzeltin ve yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
38 | InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.] . |
Bu hata, HMS pod zamanlandığında pod kimlik kaynaklarının düğümde başlatılması çok uzun sürerse oluşabilir. | sorun devam ederse işlemi yeniden deneyin, Azure HDInsight ekibine bir destek bileti açın. |
Sonraki adımlar
- Küme yapılandırması sorunlarını giderme.
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin