Устранение проблем и ошибок во время установки AKS Arc

Область применения: AKS в Azure Stack HCI, AKS в Windows Server В этой статье описаны известные проблемы и ошибки, которые могут возникнуть при установке AKS Arc. Вы также можете ознакомиться с известными проблемами при обновлении AKS Arc и при использовании Windows Admin Center.

Ошибка "Не удалось дождаться подключения надстройки arc-onboarding"

Это сообщение об ошибке появляется после запуска Install-AksHci.

Примечание

Ошибка может быть вызвана включением Приватный канал при установке. В настоящее время для этого сценария не существует обходного решения. AKS в HCI не работает с Приватный канал.

Если вы не используете Приватный канал, чтобы устранить эту проблему, выполните следующие действия.

  1. Откройте PowerShell и запустите Uninstall-AksHci.
  2. Откройте портал Azure и перейдите к группе ресурсов, используемой при запуске Install-AksHci.
  3. Проверьте наличие подключенных ресурсов кластера, которые отображаются в отключенном состоянии, и включите имя, отображаемое в виде случайно созданного GUID.
  4. Удалите эти ресурсы кластера.
  5. Закройте сеанс PowerShell и откройте новый сеанс перед повторным запуском Install-AksHci .

Ошибка: 'Install-AksHci Failed, Service вернул ошибку. Status=403 Code="RequestDisallowedByPolicy"' error when installing AKS-HCI

Эта ошибка может быть вызвана попыткой установки нарушить политику Azure, заданную в подписке Azure или группе ресурсов, предоставленной во время процесса подключения Azure Arc. Эта ошибка может возникнуть у пользователей, которые определили Политики Azure на уровне подписки или группы ресурсов, а затем попытаются установить AKS в Azure Stack HCI, что нарушает Политика Azure.

Чтобы устранить эту проблему, прочтите сообщение об ошибке, чтобы понять, какие Политика Azure, заданные администратором Azure, были нарушены, а затем измените политику Azure, сделав исключение из политики Azure. Дополнительные сведения об исключениях политики см. в статье Политика Azure структуре исключений.

Ошибка: Install-AksHci с ошибкой — [Объект уже существует] Произошла ошибка при создании ресурса "IPv4-адрес xxx.xx.xx.xx" для кластеризованной роли "xx-xxxxxxxx-xxxx-xxxx-xxxx"

Ранее установленный компонент остается в состоянии сбоя и не очищен. Вы можете получать следующую ошибку:

Exception [An error occurred while creating resource 'MOC Cloud Agent Service' for the clustered role 'ca-3f72bdeb-xxxx-4ae9-a721-3aa902a998f0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2987
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[The object already exists]

Или вы можете увидеть:

Install-Moc failed.
Exception [Unable to save property changes for 'IPv4 Address xxx.168.18.0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2971
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[A matching cluster network for the specified IP address could not be found]

Чтобы устранить эту проблему, вручную очистите роль кластера. Вы можете удалить ресурс из диспетчера отказоустойчивости кластеров, выполнив следующий командлет PowerShell: Remove-ClusterResource -name <resource name>.

Ошибка: "GetRelease error returned by API call: File download error: Hash mismatch"

Командлет Install-AksHci завершается ошибкой GetRelease, возвращенной вызовом API: ошибка скачивания файла: несоответствие хэша.

  1. Откройте PowerShell и выполните команду Uninstall-AksHci.
  2. Повторите установку.
  3. Если проблема не исчезнет, используйте -concurrentDownloads параметр с Командой Set-AksHciConfig и задайте для него значение, меньшее, чем значение по умолчанию 10, прежде чем повторить установку. Сокращение числа одновременных скачиваний может помочь конфиденциальным сетям успешно завершить скачивание больших файлов. Этот параметр является функцией предварительной версии.

После развертывания AKS в Azure Stack HCI 21H2 перезагрузка узлов показала состояние сбоя для выставления счетов.

После развертывания при перезагрузке узлов Azure Stack HCI отчет AKS показал состояние сбоя для выставления счетов.

Чтобы устранить эту проблему, следуйте инструкциям по смене маркера вручную и перезапустите подключаемый модуль KMS.

Install-AksHci истекло время ожидания с ошибкой ""

После запуска Install-AksHci установка остановлена и отображается следующее сообщение об ошибке:

\kubectl.exe --kubeconfig=C:\AksHci\0.9.7.3\kubeconfig-clustergroup-management 
get akshciclusters -o json returned a non zero exit code 1 
[Unable to connect to the server: dial tcp 192.168.0.150:6443: 
connectex: A connection attempt failed because the connected party 
did not properly respond after a period of time, or established connection 
failed because connected host has failed to respond.]

Существует несколько причин, по которым установка может завершиться ошибкой waiting for API server .

В следующем разделе описываются возможные причины и решения этой ошибки.

Причина 1. Неправильная конфигурация IP-шлюза Если вы используете статические IP-адреса и получили следующее сообщение об ошибке, убедитесь, что конфигурация ip-адреса и шлюза правильная.

Install-AksHci 
C:\AksHci\kvactl.exe create --configfile C:\AksHci\yaml\appliance.yaml  --outfile C:\AksHci\kubeconfig-clustergroup-management returned a non-zero exit code 1 [ ]

Чтобы проверка, есть ли у вас правильная конфигурация для IP-адреса и шлюза, выполните следующую команду:

ipconfig /all

В отображаемых параметрах конфигурации подтвердите конфигурацию. Можно также попытаться выполнить связь с IP-шлюзом и DNS-сервером.

ping <DNS server>

Если эти методы не работают, используйте команде New-AksHciNetworkSetting , чтобы изменить конфигурацию.

Причина 2. Неправильный DNS-сервер Если вы используете статические IP-адреса, убедитесь, что DNS-сервер настроен правильно. Чтобы проверить адрес DNS-сервера узла, воспользуйтесь следующей командой: .

Get-NetIPConfiguration.DNSServer | ?{ $_.AddressFamily -ne 23} ).ServerAddresses

Убедитесь, что адрес DNS-сервера совпадает с адресом, используемым при выполнении, New-AksHciNetworkSetting выполнив следующую команду:

Get-MocConfig

Если DNS-сервер был неправильно настроен, переустановите AKS в Azure Stack HCI с правильным DNS-сервером. Дополнительные сведения см. в статье Перезапуск, удаление или переустановка Служба Azure Kubernetes в Azure Stack HCI.

Проблема была устранена после удаления конфигурации и перезапуска виртуальной машины с новой конфигурацией.

Ошибка "Процесс не может получить доступ к файлу "mocstack.cab", так как он используется другим процессом"

Install-AksHci Произошел сбой с этой ошибкой, так как другой процесс обращается к mocstack.cab.

Чтобы устранить эту проблему, закройте все открытые окна PowerShell, а затем откройте новое окно PowerShell снова.

Ошибка: Install-AksHci сбоем с сообщением Install-MOC failed with the error - the process cannot access the file \ because is is used by another process." (Сбой install-MOC с ошибкой — процесс не может получить доступ к файлу \<path> , так как он используется другим процессом).

Не удается получить доступ к файлу, так как он используется другим процессом.

Эту проблему можно устранить, перезапустив сеанс PowerShell. Закройте окно PowerShell и повторите попытку Install-AksHci.

Ошибка "Удаленный хост принудительно разорвал существующее подключение"

Install-AksHci Произошел сбой с этой ошибкой, так как диапазоны пулов IP-адресов, предоставленные в конфигурации AKS в Azure Stack HCI, были отключены на 1 в CIDR и могут привести к сбою CloudAgent. Например, если у вас есть подсеть 10.0.0.0/21 с диапазоном адресов 10.0.0.0–10.0.7.255, а вы используете начальный адрес 10.0.0.1 или конечный адрес 10.0.7.254, это приведет к аварийному завершению CloudAgent.

Чтобы обойти эту проблему, запустите Командлет New-AksHciNetworkSetting и используйте любой другой допустимый диапазон IP-адресов для пула ВИРТУАЛЬНЫх IP-адресов и пула узлов Kubernetes. Убедитесь, что используемые значения не отключены на 1 в начале или конце диапазона адресов.

Install-AksHci произошел сбой при установке с несколькими узлами с ошибкой "Узлы не достигли активного состояния"

При запуске Install-AksHci в программе установки с одним узлом установка сработала, но при настройке отказоустойчивого кластера установка завершается сбоем с сообщением об ошибке. Однако связь с облачным агентом показала, что CloudAgent доступен.

Чтобы убедиться, что все узлы могут разрешать DNS CloudAgent, выполните следующую команду на каждом узле:

Resolve-DnsName <FQDN of cloudagent>

После успешного выполнения описанных выше шагов на узлах убедитесь, что узлы могут связаться с портом CloudAgent, чтобы убедиться, что прокси-сервер не пытается заблокировать это подключение и порт открыт. Для этого запустите выполнение следующей команды на каждом узле: .

Test-NetConnection  <FQDN of cloudagent> -Port <Cloudagent port - default 65000>

Сбой скачивания пакета AKS в Azure Stack HCI с ошибкой msft.sme.aks не удалось загрузить.

Ошибка возникает из-за ошибки при скачивании.

Если возникает эта ошибка, используйте последнюю версию Microsoft Edge или Google Chrome и повторите попытку.

При запуске Set-AksHciRegistration отображается сообщение об ошибке "Не удалось проверка зарегистрированных поставщиков ресурсов".

Эта ошибка возникает после выполнения Set-AksHciRegistration в установке AKS в Azure Stack HCI. Ошибка указывает, что поставщики ресурсов Kubernetes не зарегистрированы для клиента, который в данный момент вошел в систему.

Чтобы устранить эту проблему, выполните azure CLI или PowerShell, описанные ниже.

az provider register --namespace Microsoft.Kubernetes
az provider register --namespace Microsoft.KubernetesConfiguration
Register-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Register-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration

Регистрация занимает около 10 минут. Чтобы отслеживать процесс регистрации, используйте следующие команды.

az provider show -n Microsoft.Kubernetes -o table
az provider show -n Microsoft.KubernetesConfiguration -o table
Get-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Get-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration

Install-AksHci зависает на этапе "Ожидание azure-arc-onboarding to complete" перед истечением времени ожидания

Примечание

Эта проблема устранена в выпуске за май 2022 г. и более поздних версий.

Install-AksHci зависает Waiting for azure-arc-onboarding to complete до истечения времени ожидания, когда:

  • Субъект-служба используется в AKS при регистрации Azure Stack HCI (Set-AksHciRegistration).
  • Установленные модули PowerShell Az.Accounts (2.7.x).

Az.Accounts 2.7.x Версии удаляют ServicePrincipalSecret и CertificatePassword в PSAzureRmAccount, которые используются AKS в Azure Stack HCI для подключения Azure Arc.

Для воспроизведения:

  1. Установите Az.Accounts версию модулей PowerShell (>= 2.7.0).
  2. Set-AksHciRegistration с помощью субъекта-службы.
  3. Install-AksHci.

Ожидаемое поведение:

  1. Установка AKS в Azure Stack HCI зависает на Waiting for azure-arc-onboarding to complete.
  2. Azure-arc-onboarding модули pod переходит в цикл аварийного завершения.
  3. Ошибка Azure-arc-onboarding pods со следующей ошибкой:
    Starting onboarding process ERROR: variable CLIENT_SECRET is required

Чтобы устранить эту проблему, выполните следующие действия.

Удалите модули Az.Accounts версии 2.7.x. Выполните следующий командлет:

Uninstall-Module -Name Az.Accounts -RequiredVersion 2.7.0 -Force

Во время установки отображается эта ошибка: "Не удалось создать виртуальную машину (модуль): не удается создать виртуальную машину: ошибка rpc = unknown desc = Произошло исключение. (Общий сбой)]'

Эта ошибка происходит, когда Azure Stack HCI не соответствует политике. Состояние подключения в кластере может показать, что он подключен, но в журнале событий отображается предупреждающее сообщение о том, что Azure Stack HCI's subscription is expired, run Sync-AzureStackHCI to renew the subscription.

Чтобы устранить эту ошибку, убедитесь, что кластер зарегистрирован в Azure с помощью Get-AzureStackHCI командлета PowerShell, доступного на вашем компьютере. На панели Windows Admin Center также отображаются сведения о состоянии регистрации Azure в кластере.

Если кластер уже зарегистрирован, то следует просмотреть поле LastConnected в выходных данных Get-AzureStackHCI. Если в поле указано более 30 дней, следует попытаться разрешить ситуацию с помощью командлета Sync-AzureStackHCI.

Проверить, есть ли у каждого узла кластера требуемая лицензия, можно с помощью следующего командлета: .

Get-ClusterNode | % { Get-AzureStackHCISubscriptionStatus -ComputerName $_ }
Computer Name Subscription Name           Status   Valid To
------------- -----------------           ------   --------
MS-HCIv2-01   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-01   Windows Server Subscription Inactive

MS-HCIv2-02   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-02   Windows Server Subscription Inactive

MS-HCIv2-03   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-03   Windows Server Subscription Inactive

Если проблема не устранена после выполнения командлета, обратитесь в Sync-AzureStackHCI службу поддержки Майкрософт.

После неудачной установки запуск Install-AksHci не работает

Эта проблема возникает из-за того, что сбой установки может привести к утечке ресурсов, которые необходимо очистить перед повторной установкой.

Если установка завершается сбоем с помощью командлета Install-AksHci, перед повторным запуском Install-AksHci запустите Uninstall-AksHci.

Ошибка: "Не удается выверить виртуальную сеть" или "Ошибка: Install-Moc сбой с ошибкой — исключение [[Moc] Этот компьютер не настроен для развертывания]

Эти ошибки можно активировать при запуске Install-AksHci без запуска Set-AksHciConfig .

Чтобы устранить эту ошибку, запустите uninstall-akshci и закройте все окна PowerShell. Откройте новый сеанс PowerShell и перезапустите процесс установки AKS-HCI, установив AKS-HCI с помощью PowerShell.

Set-AksHciConfig сбоем с ошибкой "Ошибка GetCatalog, возвращенная вызовом API: ... proxyconnect tcp: tls: первая запись не выглядит как подтверждение TLS"

Командлет Set-AksHciConfig PowerShell завершается ошибкой:

GetCatalog error returned by API call: ... proxyconnect tcp: tls: first record does not look like a TLS Handshake

Если вы используете AKS с прокси-сервером, возможно, вы использовали неправильный URL-адрес при задании необходимого ЗНАЧЕНИЯ URL-адреса прокси-сервера HTTPS. Значения URL-адреса прокси-сервера HTTP и URL-адреса прокси-сервера HTTPS необходимы при настройке AKS с прокси-сервером, но обычно оба значения должны совместно использовать один и тот же URL-адрес с префиксом HTTP.

Если это может быть в вашей среде, попробуйте выполнить следующие действия по устранению рисков:

  1. Закройте окно PowerShell и откройте новое.
  2. New-AksHciNetworkSetting Снова запустите командлеты и New-AksHciProxySetting . При запуске New-AksHciProxySettingзадайте -https параметр с тем же значением URL-адреса с префиксом HTTP, которое вы задали для -http.
  3. Запустите Set-AksHciConfig и продолжайте.

При развертывании AKS в Azure Stack HCI с неправильно настроенной сетью время ожидания развертывания истекает в различных точках.

При развертывании AKS в Azure Stack HCI время ожидания развертывания может быть истекает в разных точках процесса в зависимости от того, где произошла ошибка настройки. Просмотрите сообщение об ошибке, чтобы определить причину и место ее возникновения.

Например, в следующей ошибке точка, в которой произошла ошибка настройки, находится в Get-DownloadSdkRelease -Name "mocstack-stable":

$vnet = New-AksHciNetworkSettingSet-AksHciConfig -vnet $vnetInstall-AksHciVERBOSE: 
Initializing environmentVERBOSE: [AksHci] Importing ConfigurationVERBOSE: 
[AksHci] Importing Configuration Completedpowershell : 
GetRelease - error returned by API call: 
Post "https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/mocstack-stable/versions/0.9.7.0/files?action=generateDownloadInfo&ForegroundPriority=True": 
dial tcp 52.184.220.11:443: connectex: 
A connection attempt failed because the connected party did not properly
respond after a period of time, or established connection failed because
connected host has failed to respond.At line:1 char:1+ powershell -command
{ Get-DownloadSdkRelease -Name "mocstack-stable"}

Это означает, что физический узел Azure Stack HCI может разрешать имя URL-адреса загрузки , msk8s.api.cdp.microsoft.comно узел не может подключиться к целевому серверу.

Чтобы устранить эту проблему, необходимо определить, где произошла разбивка в потоке подключения. Ниже приведены некоторые действия по устранению проблемы с физическим узлом кластера.

  1. Ping конечного DNS-имени: ping msk8s.api.cdp.microsoft.com.
  2. Если вы получите ответ и время ожидания не истекло, базовый сетевой путь работает.
  3. Если время ожидания подключения истекает, может произойти прерывание пути к данным. Дополнительные сведения см. в разделе параметры проверка прокси-сервера. Кроме того, в пути возврата может возникнуть разрыв, поэтому следует проверка правила брандмауэра.

Set-AksHciConfig завершается сбоем с ошибками WinRM, но показывает, что WinRM настроен правильно

При запуске Set-AksHciConfig может возникнуть следующая ошибка:

WinRM service is already running on this machine.
WinRM is already set up for remote management on this computer.
Powershell remoting to TK5-3WP08R0733 was not successful.
At C:\Program Files\WindowsPowerShell\Modules\Moc\0.2.23\Moc.psm1:2957 char:17
+ ...             throw "Powershell remoting to "+$env:computername+" was n ...
+                 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    + CategoryInfo          : OperationStopped: (Powershell remo...not successful.:String) [], RuntimeException
    + FullyQualifiedErrorId : Powershell remoting to TK5-3WP08R0733 was not successful.

Эта ошибка обычно происходит в результате изменения маркера безопасности пользователя (из-за изменения членства в группе), изменения пароля или использования пароля с истекшим сроком действия. В большинстве случаев проблему можно устранить, если выполнить выход из системы компьютера, а затем войти в нее снова. Если проблема по-прежнему завершается сбоем, вы можете подать сообщение о проблеме на сайте GitHub AKS HCI.

Сбой смены журнала агента Moc

Ожидается, что агенты Moc будут хранить только последние 100 журналов агента. Они должны удалить старые журналы. Однако смена журналов не происходит, и журналы продолжают накапливаться, потребляя дисковое пространство.

Для воспроизведения: Install AksHci и кластер должен работать до тех пор, пока количество журналов агента не превысит 100. Во время создания n-го журнала агенты должны удалить n-100-й журнал, если они существуют.

Чтобы решить эту проблему, выполните указанные ниже действия.

  1. Измените файлы logconf агента облака и агента узла. Конфигурация журнала облачного агента находится по адресу:
    (Get-MocConfig).cloudConfigLocation+"\log\logconf".
    Конфигурация журнала агента узла находится по адресу:
    (Get-MocConfig).cloudConfigLocation+"\log\logconf".

  2. Измените значение параметра Ограничение на 100 и Слоты на 100 и сохраните файлы конфигурации.

  3. Перезапустите облачный агент и агент узла, чтобы зарегистрировать эти изменения.

Эти действия запускают смену журналов только после создания 100 новых журналов после перезапуска агента. Если на момент перезапуска уже существует n журналов агента, смена журналов начнется только после создания n+100 журналов.

Облачный агент может не запуститься при использовании имен путей с пробелами

При использовании Set-AksHciConfig для указания -imageDirпараметров , -workingDir, -cloudConfigLocationили -nodeConfigLocation с именем пути, содержащим пробел, например D:\Cloud Share\AKS HCI, служба кластера облачного агента не запустится со следующим (или аналогичным) сообщением об ошибке:

Failed to start the cloud agent generic cluster service in failover cluster. The cluster resource group os in the 'failed' state. Resources in 'failed' or 'pending' states: 'MOC Cloud Agent Service'

Чтобы обойти эту проблему, используйте путь, который не содержит пробелов, например C:\CloudShare\AKS-HCI.

Ошибка: 'Install-Moc failed with error - Exception [CloudAgent is unreachable. MOC CloudAgent может быть недоступным по следующим причинам]'

Эта ошибка может возникать при неправильной настройке инфраструктуры.

Для устранения ошибки сделайте следующее.

  1. Проверьте конфигурацию DNS-сервера узла и параметры шлюза:

    1. Убедитесь, что DNS-сервер настроен правильно. Чтобы проверить адрес DNS-сервера узла, выполните следующую команду:
      ((Get-NetIPConfiguration).DNSServer | ?{ $_.AddressFamily -ne 23}).ServerAddresses
      
    2. Чтобы проверка правильность IP-адреса и конфигурации шлюза, выполните команду ipconfig/all.
    3. Попробуйте проверить связь с IP-шлюзом и DNS-сервером.
  2. Проверьте службу CloudAgent, чтобы убедиться, что она запущена:

    1. Проверьте связь со службой CloudAgent, чтобы убедиться, что она доступна.
    2. Убедитесь, что все узлы могут разрешить DNS CloudAgent, выполнив следующую команду на каждом узле:
      Resolve-DnsName <FQDN of cloudagent>
      
    3. После успешного выполнения предыдущего шага на узлах убедитесь, что узлы могут установить связь через порт CloudAgent, чтобы проверить, не пытается ли прокси-сервер заблокировать это подключение и открыт ли порт. Для этого запустите выполнение следующей команды на каждом узле: .
      Test-NetConnection <FQDN of cloudagent> -Port <Cloudagent port - default 65000>
      
    4. Чтобы проверить, работает ли служба кластеров для отказоустойчивого кластера, можно также воспользоваться следующей командой:.
      Get-ClusterGroup -Name (Get-AksHciConfig).Moc['clusterRoleName']
      

Ошибка: "Сбой install-Moc. Исключение [Обычно это указывает на проблему при регистрации имени ресурса в качестве объекта компьютера на контроллере домена и (или) DNS-сервере. Проверка, есть ли у объекта-компьютера кластера разрешения на создание объекта-компьютера в контроллере домена. Проверка контроллера домена и журналы DNS для получения связанных сообщений об ошибках.

Обычно это означает, что объект имени кластера (CNO), представляющий базовый отказоустойчивый кластер в доменные службы Active Directory (AD DS), не имеет разрешений на создание объекта виртуального компьютера (VCO) в подразделении (OU) или в контейнере, где находится кластер.

Если вы не являетесь администратором домена, вы можете попросить его предоставить разрешения CNO подразделению или предварительно подготовить VCO для универсальной службы кластера облачного агента.

Если вы являетесь администратором домена, возможно, что подразделение или контейнер не имеют необходимых разрешений. Например, режим принудительного применения, представленный в KB5008383, можно включить в Active Directory. Перед попыткой переустановки выполните указанные ниже действия.

  1. Перейдите к Пользователи и компьютеры Active Directory.
  2. Щелкните правой кнопкой мыши подразделение или контейнер, в котором находится кластер.
  3. Выберите Делегировать управление... , чтобы открыть мастер делегирования управления.
  4. Нажмите кнопку Далее> Нажмите кнопку Добавить... , чтобы открыть окно Выбор пользователей, компьютеров или групп .
  5. Выберите группу или пользователей, которым вы хотите делегировать управление > , нажмите кнопку ОК.
  6. Выберите Создать настраиваемую задачу для делегирования> Нажмите кнопку Далее , чтобы перейти на страницу Тип объекта Active Directory .
  7. Выберите Только следующие объекты в папке> Select Computer objects> Select Create selected objects in this folder and Delete selected objects in this folder> Нажмите кнопку Далее , чтобы перейти на страницу Разрешения .
  8. Выберите Создать все дочерние объекты и Удалить все дочерние объекты в списке разрешений Нажмите > кнопку Далее>готово.

Если повторная установка завершается сбоем, повторите приведенные выше действия, выполнив следующие изменения в шагах 7 и 8.

  • Шаг 7. Выберите Эту папку, существующие объекты в этой папке и создание новых объектов в этой папке> Нажмите кнопку Далее.
  • Шаг 8. Выберите Чтение, Запись, Создать все дочерние объекты и Удалить все дочерние объекты в списке разрешений Нажмите > кнопку Далее> нажмите кнопку Готово.

Ошибка: Install-AksHci завершается сбоем с ошибкой Install-Moc. Доступны журналы C:\Users\xxx\AppData\Local\Temp\v0eoltcc.a10'

Эта ошибка может возникнуть при запуске Install-AksHci.

Дополнительные сведения можно получить, выполнив команду $error = Install-AksHci , а затем $error[0].Exception.InnerException.

Развертывание PowerShell не проверка доступной памяти перед созданием нового кластера рабочей нагрузки

Команды PowerShell Aks-Hci не проверяют доступную память на сервере узла перед созданием узлов Kubernetes. Эта проблема может привести к нехватке памяти и не запускаемым виртуальным машинам. Этот сбой в настоящее время не обрабатывается корректно, и развертывание перестанет отвечать без четкого сообщения об ошибке.

Если развертывание перестает отвечать, откройте Просмотр событий и проверка сообщение об ошибке, связанное с Hyper-V, указывающее, что для запуска виртуальной машины недостаточно памяти.

При выполнении Set-AksHciRegistration появляется ошибка "Не удалось получить маркер"

Эта ошибка может возникать при наличии нескольких клиентов в учетной записи Azure.

Используйте $tenantId = (Get-AzContext).Tenant.Id , чтобы задать правильный клиент. Затем включите этот клиент в качестве параметра при выполнении Set-AksHciRegistration.

Ошибка: "Ожидание готовности модуля pod "Оператор облака"

При попытке развернуть кластер AKS на виртуальной машине Azure установка зависла на Waiting for pod 'Cloud Operator' to be ready..., а затем завершилась сбоем и истекло время ожидания через два часа. Попытки устранить неполадки, проверив шлюз и DNS-сервер, показали, что они работают надлежащим образом. Проверка на наличие конфликтов IP- или MAC-адресов не найдена. В журналах не отображается пул ВИРТУАЛЬНЫх IP-адресов. Существовало ограничение на извлечение образа контейнера с помощью sudo docker pull ecpacr.azurecr.io/kube-vip:0.3.4 , которое возвращало время ожидания TLS, а не несанкционированное.

Чтобы устранить эту проблему, выполните следующие действия.

  1. Начните развертывание кластера.
  2. После развертывания кластера подключитесь к виртуальной машине кластера управления по протоколу SSH, как показано ниже.
ssh -i (Get-MocConfig)['sshPrivateKey'] clouduser@<IP Address>
  1. Измените параметр максимальной единицы передачи (MTU). Не стесняйтесь вносить изменения; Если вы внесете изменения слишком поздно, развертывание завершается ошибкой. Изменение параметра MTU помогает разблокировать извлечение образа контейнера.
sudo ifconfig eth0 mtu 1300
  1. Чтобы просмотреть состояние контейнеров, выполните следующую команду:
sudo docker ps -a

После выполнения этих действий извлечение образа контейнера должно быть разблокировано.

Ошибка: "Сбой Install-Moc с ошибкой — исключение [Не удалось создать универсальную роль отказоустойчивого кластера.]

Эта ошибка указывает, что IP-адрес облачной службы не является частью сети кластера и не соответствует ни одной из сетей кластера с включенной ролью client and cluster communication .

Чтобы устранить эту проблему, выполните командлет Get-ClusterNetwork , где Role равно ClusterAndClient. Затем на одном из узлов кластера выберите имя, адрес и маску адреса, чтобы убедиться, что IP-адрес, указанный для -cloudServiceIP параметра New-AksHciNetworkSetting , соответствует одной из отображаемых сетей.

Дальнейшие действия

Если при использовании AKS Arc по-прежнему возникают проблемы, вы можете отправлять сообщения об ошибках через GitHub.