Řešení potíží s nasazením OpenShift Container Platform 3.11 v Azure

Platí pro: ✔️ Virtuální počítače s Linuxem ✔️ Flexibilní škálovací sady

Pokud se cluster OpenShift nenasadí úspěšně, Azure Portal chyba. Výstup může být obtížně čitelný, což ztěžuje identifikaci problému. V tomto výstupu rychle naskenujte ukončovací kód 3, 4 nebo 5. Následující seznam obsahuje informace o těchto třech ukončovacích kódech:

  • Ukončovací kód 3: Vaše uživatelské jméno/ heslo nebo ID organizace nebo aktivační klíč předplatného Red Hat je nesprávné
  • Ukončovací kód 4: VAŠE ID fondu Red Hat je nesprávné nebo nejsou k dispozici žádná oprávnění
  • Ukončovací kód 5: Svazek s tenkým fondem Dockeru se nepodařilo zřídit

Všechny ostatní ukončovací kódy zobrazíte tak, že se připojíte k hostiteli přes SSH.

OpenShift Container Platform 3.11

SSH k hostiteli playbooku ansible. Pro šablonu nebo nabídku Marketplace použijte hostitele bastionu. Z bastionu můžete SSH použít ke všem ostatním uzlům v clusteru (hlavní uzel, infra, CNS, výpočetní prostředky). K zobrazení souborů protokolu budete muset být root. Kořenový adresář je ve výchozím nastavení pro přístup SSH zakázaný, proto nepoužívejte root pro SSH k jiným uzlům.

OKD

SSH k hostiteli playbooku ansible. Pro šablonu OKD (verze 3.9 a starší) použijte hostitele master-0. Pro šablonu OKD (verze 3.10 a novější) použijte hostitele bastionu. Z hostitele playbooku ansible můžete SSH použít ke všem ostatním uzlům v clusteru (hlavní uzel, infra, CNS, compute). K zobrazení souborů protokolu budete potřebovat root (sudo su -). Kořenový adresář je ve výchozím nastavení pro přístup SSH zakázaný, proto nepoužívejte root pro SSH k jiným uzlům.

Soubory protokolu

Soubory protokolu (stderr a stdout) pro přípravné skripty hostitele jsou umístěny ve všech /var/lib/waagent/custom-script/download/0 hostitelích. Pokud během přípravy hostitele došlo k chybě, podívejte se na tyto soubory protokolu a zjistěte chybu.

Pokud se přípravné skripty úspěšně spustili, bude potřeba prozkoumat soubory protokolu v adresáři /var/lib/waagent/custom-script/download/1 hostitele playbooku ansible. Pokud k chybě došlo během vlastní instalace OpenShiftu, v souboru stdout se zobrazí chyba. Tyto informace použijte, pokud chcete získat další pomoc, obraťte se na podporu.

Příklad výstupu

TASK [openshift_storage_glusterfs : Load heketi topology] **********************
fatal: [mycluster-master-0]: FAILED! => {"changed": true, "cmd": ["oc", "--config=/tmp/openshift-glusterfs-ansible-IbhnUM/admin.kubeconfig", "rsh", "--namespace=glusterfs", "deploy-heketi-storage-1-d9xl5", "heketi-cli", "-s", "http://localhost:8080", "--user", "admin", "--secret", "VuoJURT0/96E42Vv8+XHfsFpSS8R20rH1OiMs3OqARQ=", "topology", "load", "--json=/tmp/openshift-glusterfs-ansible-IbhnUM/topology.json", "2>&1"], "delta": "0:00:21.477831", "end": "2018-05-20 02:49:11.912899", "failed": true, "failed_when_result": true, "rc": 0, "start": "2018-05-20 02:48:50.435068", "stderr": "", "stderr_lines": [], "stdout": "Creating cluster ... ID: 794b285745b1c5d7089e1c5729ec7cd2\n\tAllowing file volumes on cluster.\n\tAllowing block volumes on cluster.\n\tCreating node mycluster-cns-0 ... ID: 45f1a3bfc20a4196e59ebb567e0e02b4\n\t\tAdding device /dev/sdd ... OK\n\t\tAdding device /dev/sde ... OK\n\t\tAdding device /dev/sdf ... OK\n\tCreating node mycluster-cns-1 ... ID: 596f80d7bbd78a1ea548930f23135131\n\t\tAdding device /dev/sdc ... Unable to add device: Unable to execute command on glusterfs-storage-4zc42:   Device /dev/sdc excluded by a filter.\n\t\tAdding device /dev/sde ... OK\n\t\tAdding device /dev/sdd ... OK\n\tCreating node mycluster-cns-2 ... ID: 42c0170aa2799559747622acceba2e3f\n\t\tAdding device /dev/sde ... OK\n\t\tAdding device /dev/sdf ... OK\n\t\tAdding device /dev/sdd ... OK", "stdout_lines": ["Creating cluster ... ID: 794b285745b1c5d7089e1c5729ec7cd2", "\tAllowing file volumes on cluster.", "\tAllowing block volumes on cluster.", "\tCreating node mycluster-cns-0 ... ID: 45f1a3bfc20a4196e59ebb567e0e02b4", "\t\tAdding device /dev/sdd ... OK", "\t\tAdding device /dev/sde ... OK", "\t\tAdding device /dev/sdf ... OK", "\tCreating node mycluster-cns-1 ... ID: 596f80d7bbd78a1ea548930f23135131", "\t\tAdding device /dev/sdc ... Unable to add device: Unable to execute command on glusterfs-storage-4zc42:   Device /dev/sdc excluded by a filter.", "\t\tAdding device /dev/sde ... OK", "\t\tAdding device /dev/sdd ... OK", "\tCreating node mycluster-cns-2 ... ID: 42c0170aa2799559747622acceba2e3f", "\t\tAdding device /dev/sde ... OK", "\t\tAdding device /dev/sdf ... OK", "\t\tAdding device /dev/sdd ... OK"]}

PLAY RECAP *********************************************************************
mycluster-cns-0       : ok=146  changed=57   unreachable=0    failed=0   
mycluster-cns-1       : ok=146  changed=57   unreachable=0    failed=0   
mycluster-cns-2       : ok=146  changed=57   unreachable=0    failed=0   
mycluster-infra-0     : ok=143  changed=55   unreachable=0    failed=0   
mycluster-infra-1     : ok=143  changed=55   unreachable=0    failed=0   
mycluster-infra-2     : ok=143  changed=55   unreachable=0    failed=0   
mycluster-master-0    : ok=502  changed=198  unreachable=0    failed=1   
mycluster-master-1    : ok=348  changed=140  unreachable=0    failed=0   
mycluster-master-2    : ok=348  changed=140  unreachable=0    failed=0   
mycluster-node-0      : ok=143  changed=55   unreachable=0    failed=0   
mycluster-node-1      : ok=143  changed=55   unreachable=0    failed=0   
localhost                  : ok=13   changed=0    unreachable=0    failed=0   

INSTALLER STATUS ***************************************************************
Initialization             : Complete (0:00:39)
Health Check               : Complete (0:00:24)
etcd Install               : Complete (0:01:24)
Master Install             : Complete (0:14:59)
Master Additional Install  : Complete (0:01:10)
Node Install               : Complete (0:10:58)
GlusterFS Install          : In Progress (0:03:33)
    This phase can be restarted by running: playbooks/openshift-glusterfs/config.yml

Failure summary:

  1. Hosts:    mycluster-master-0
     Play:     Configure GlusterFS
     Task:     Load heketi topology
     Message:  Failed without returning a message.

Nejběžnější chyby během instalace jsou:

  1. Privátní klíč má přístupové heslo
  2. Tajný klíč trezoru klíčů s privátním klíčem se nevytyl správně
  3. Přihlašovací údaje objektu služby byly nesprávně zadány.
  4. Objekt služby nemá přístup přispěvatele ke skupině prostředků.

Privátní klíč má přístupové heslo.

Zobrazí se chyba s odepřením oprávnění pro SSH. SSH k hostiteli playbooku ansible a zkontrolujte, zda privátní klíč obsahuje přístupové heslo.

Tajný klíč trezoru klíčů s privátním klíčem se nevytyl správně

Privátní klíč se zkopíruje do hostitele playbooku ansible – ~/.ssh/id_rsa. Ověřte správnost tohoto souboru. Otestujte to tak, že otevřete relaci SSH na jednom z uzlů clusteru z hostitele playbooku ansible.

Přihlašovací údaje objektu služby byly nesprávně zadány.

Při zadávání vstupu do šablony nebo nabídky Marketplace byly zadány nesprávné informace. Ujistěte se, že pro objekt služby používáte správné ID aplikace (clientId) a heslo (clientSecret). Ověřte to pomocí následujícího příkazu Azure CLI.

az login --service-principal -u <client id> -p <client secret> -t <tenant id>

Objekt služby nemá přístup přispěvatele ke skupině prostředků.

Pokud je povolený poskytovatel cloudu Azure, použitý objekt služby musí mít přístup přispěvatele ke skupině prostředků. Ověřte to pomocí následujícího příkazu Azure CLI.

az group update -g <openshift resource group> --set tags.sptest=test

Další nástroje

V případě některých chyb můžete k získání dalších informací použít také následující příkazy:

  1. systemctl status <service>
  2. journalctl -xe