Felsöka Distribution av OpenShift Container Platform 3.11 i Azure

Gäller för: ✔️ Virtuella Linux-datorer ✔️ Flexibla skalningsuppsättningar

Om OpenShift-klustret inte distribueras korrekt kommer Azure Portal att tillhandahålla felutdata. Utdata kan vara svåra att läsa, vilket gör det svårt att identifiera problemet. Sök snabbt igenom dessa utdata efter slutkod 3, 4 eller 5. Följande innehåller information om dessa tre slutkoder:

  • Slutkod 3: Red Hat-prenumerationens användarnamn/lösenord eller organisations-ID/aktiveringsnyckel är felaktig
  • Slutkod 4: Ditt Red Hat-pool-ID är felaktigt eller så finns det inga tillgängliga rättigheter
  • Slutkod 5: Det går inte att etablera docker tunn poolvolym

För alla andra slutkoder ansluter du till värdarna via ssh för att visa loggfilerna.

OpenShift Container Platform 3.11

SSH till ansible-spelboksvärden. Använd skyddsvärden för mallen eller Marketplace-erbjudandet. Från skyddsresurserna kan du SSH till alla andra noder i klustret (master, infra, CNS, compute). Du måste vara rot för att kunna visa loggfilerna. Roten är inaktiverad för SSH-åtkomst som standard, så använd inte rot till SSH till andra noder.

OKD

SSH till ansible-spelboksvärden. För OKD-mallen (version 3.9 och tidigare) använder du master-0-värden. För OKD-mallen (version 3.10 och senare) använder du skyddsvärden. Från ansible-spelboksvärden kan du SSH till alla andra noder i klustret (master, infra, CNS, compute). Du måste vara rot (sudo su -) för att visa loggfilerna. Roten är inaktiverad för SSH-åtkomst som standard, så använd inte rot till SSH till andra noder.

Loggfiler

Loggfilerna (stderr och stdout) för värdförberedelseskripten finns på /var/lib/waagent/custom-script/download/0 alla värdar. Om ett fel uppstod under förberedelsen av värden kan du visa loggfilerna för att fastställa felet.

Om förberedelseskripten har körts korrekt måste loggfilerna i katalogen för ansible-spelboksvärden /var/lib/waagent/custom-script/download/1 undersökas. Om felet uppstod under den faktiska installationen av OpenShift visas felet i stdout-filen. Använd den här informationen för att kontakta supporten för ytterligare hjälp.

Exempel på utdata

TASK [openshift_storage_glusterfs : Load heketi topology] **********************
fatal: [mycluster-master-0]: FAILED! => {"changed": true, "cmd": ["oc", "--config=/tmp/openshift-glusterfs-ansible-IbhnUM/admin.kubeconfig", "rsh", "--namespace=glusterfs", "deploy-heketi-storage-1-d9xl5", "heketi-cli", "-s", "http://localhost:8080", "--user", "admin", "--secret", "VuoJURT0/96E42Vv8+XHfsFpSS8R20rH1OiMs3OqARQ=", "topology", "load", "--json=/tmp/openshift-glusterfs-ansible-IbhnUM/topology.json", "2>&1"], "delta": "0:00:21.477831", "end": "2018-05-20 02:49:11.912899", "failed": true, "failed_when_result": true, "rc": 0, "start": "2018-05-20 02:48:50.435068", "stderr": "", "stderr_lines": [], "stdout": "Creating cluster ... ID: 794b285745b1c5d7089e1c5729ec7cd2\n\tAllowing file volumes on cluster.\n\tAllowing block volumes on cluster.\n\tCreating node mycluster-cns-0 ... ID: 45f1a3bfc20a4196e59ebb567e0e02b4\n\t\tAdding device /dev/sdd ... OK\n\t\tAdding device /dev/sde ... OK\n\t\tAdding device /dev/sdf ... OK\n\tCreating node mycluster-cns-1 ... ID: 596f80d7bbd78a1ea548930f23135131\n\t\tAdding device /dev/sdc ... Unable to add device: Unable to execute command on glusterfs-storage-4zc42:   Device /dev/sdc excluded by a filter.\n\t\tAdding device /dev/sde ... OK\n\t\tAdding device /dev/sdd ... OK\n\tCreating node mycluster-cns-2 ... ID: 42c0170aa2799559747622acceba2e3f\n\t\tAdding device /dev/sde ... OK\n\t\tAdding device /dev/sdf ... OK\n\t\tAdding device /dev/sdd ... OK", "stdout_lines": ["Creating cluster ... ID: 794b285745b1c5d7089e1c5729ec7cd2", "\tAllowing file volumes on cluster.", "\tAllowing block volumes on cluster.", "\tCreating node mycluster-cns-0 ... ID: 45f1a3bfc20a4196e59ebb567e0e02b4", "\t\tAdding device /dev/sdd ... OK", "\t\tAdding device /dev/sde ... OK", "\t\tAdding device /dev/sdf ... OK", "\tCreating node mycluster-cns-1 ... ID: 596f80d7bbd78a1ea548930f23135131", "\t\tAdding device /dev/sdc ... Unable to add device: Unable to execute command on glusterfs-storage-4zc42:   Device /dev/sdc excluded by a filter.", "\t\tAdding device /dev/sde ... OK", "\t\tAdding device /dev/sdd ... OK", "\tCreating node mycluster-cns-2 ... ID: 42c0170aa2799559747622acceba2e3f", "\t\tAdding device /dev/sde ... OK", "\t\tAdding device /dev/sdf ... OK", "\t\tAdding device /dev/sdd ... OK"]}

PLAY RECAP *********************************************************************
mycluster-cns-0       : ok=146  changed=57   unreachable=0    failed=0   
mycluster-cns-1       : ok=146  changed=57   unreachable=0    failed=0   
mycluster-cns-2       : ok=146  changed=57   unreachable=0    failed=0   
mycluster-infra-0     : ok=143  changed=55   unreachable=0    failed=0   
mycluster-infra-1     : ok=143  changed=55   unreachable=0    failed=0   
mycluster-infra-2     : ok=143  changed=55   unreachable=0    failed=0   
mycluster-master-0    : ok=502  changed=198  unreachable=0    failed=1   
mycluster-master-1    : ok=348  changed=140  unreachable=0    failed=0   
mycluster-master-2    : ok=348  changed=140  unreachable=0    failed=0   
mycluster-node-0      : ok=143  changed=55   unreachable=0    failed=0   
mycluster-node-1      : ok=143  changed=55   unreachable=0    failed=0   
localhost                  : ok=13   changed=0    unreachable=0    failed=0   

INSTALLER STATUS ***************************************************************
Initialization             : Complete (0:00:39)
Health Check               : Complete (0:00:24)
etcd Install               : Complete (0:01:24)
Master Install             : Complete (0:14:59)
Master Additional Install  : Complete (0:01:10)
Node Install               : Complete (0:10:58)
GlusterFS Install          : In Progress (0:03:33)
    This phase can be restarted by running: playbooks/openshift-glusterfs/config.yml

Failure summary:

  1. Hosts:    mycluster-master-0
     Play:     Configure GlusterFS
     Task:     Load heketi topology
     Message:  Failed without returning a message.

De vanligaste felen under installationen är:

  1. Den privata nyckeln har lösenfras
  2. Key Vault-hemligheten med privat nyckel skapades inte korrekt
  3. Autentiseringsuppgifter för tjänstens huvudnamn har angetts felaktigt
  4. Tjänstens huvudnamn har inte deltagaråtkomst till resursgruppen

Privat nyckel har en lösenfras

Du ser ett fel om att behörigheten nekades för ssh. SSH till ansible-spelboksvärden för att söka efter en lösenfras på den privata nyckeln.

Key Vault-hemligheten med privat nyckel skapades inte korrekt

Den privata nyckeln kopieras till ansible-spelboksvärden – ~/.ssh/id_rsa. Bekräfta att filen är korrekt. Testa genom att öppna en SSH-session till en av klusternoderna från ansible-spelboksvärden.

Autentiseringsuppgifter för tjänstens huvudnamn har angetts felaktigt

När du angav indata för mallen eller Marketplace-erbjudandet angavs felaktig information. Kontrollera att du använder rätt appId (clientId) och lösenord (clientSecret) för tjänstens huvudnamn. Verifiera genom att utfärda följande azure cli-kommando.

az login --service-principal -u <client id> -p <client secret> -t <tenant id>

Tjänstens huvudnamn har inte deltagaråtkomst till resursgruppen

Om Azure-molnleverantören är aktiverad måste tjänstens huvudnamn som används ha deltagaråtkomst till resursgruppen. Verifiera genom att utfärda följande azure cli-kommando.

az group update -g <openshift resource group> --set tags.sptest=test

Fler verktyg

För vissa fel kan du också använda följande kommandon för att få mer information:

  1. systemctl status <service>
  2. journalctl -xe