Řešení potíží s monitorováním počítačů se systémy UNIX a Linux

Důležité

Tato verze Operations Manageru dosáhla konce podpory. Doporučujeme upgradovat na Operations Manager 2022.

System Center – Operations Manager poskytuje monitorování počítačů se systémy UNIX a Linux podobně jako monitorování počítačů s Windows. Můžete monitorovat stav, výkon, získávat sestavy, spouštět úlohy a implementovat vlastní instrumentaci monitorování.

Můžete monitorovat následující součásti počítačů se systémem UNIX a Linux:

  • Služby a aplikace

  • Systém souborů, místo na disku, odkládací prostor, systémová paměť

  • Síťová rozhraní

  • Klíčové procesy a atributy

  • Klíčové konfigurace

Před monitorováním počítačů se systémy UNIX a Linux je nutné provést následující kroky:

  1. Sady Management Pack můžete importovat stažením nejnovějších verzí z webu Microsoft Download Center.
  2. Vytvořte vyhrazený fond zdrojů pro monitorování počítačů se systémy UNIX a Linux.
  3. Nakonfigurujte certifikáty pro každý server pro správu ve fondu.
  4. Vytvořte a nakonfigurujte účty Spustit jako.
  5. Nainstalujte agenta v systémech UNIX a Linux pomocí Průvodce zjišťováním.
  1. Sady Management Pack můžete importovat stažením nejnovějších verzí z webu Microsoft Download Center.
  2. Vytvořte vyhrazený fond zdrojů pro monitorování počítačů se systémy UNIX a Linux.
  3. Nakonfigurujte certifikáty pro každý server pro správu ve fondu.
  4. Vytvořte a nakonfigurujte účty Spustit jako.
  5. Nainstalujte agenta v systémech UNIX a Linux pomocí Průvodce zjišťováním.
  1. Sady Management Pack můžete importovat stažením nejnovějších verzí z webu Microsoft Download Center.
  2. Vytvořte vyhrazený fond zdrojů pro monitorování počítačů se systémy UNIX a Linux.
  3. Nakonfigurujte certifikáty pro každý server pro správu ve fondu.
  4. Vytvořte a nakonfigurujte účty Spustit jako.
  5. Nainstalujte agenta v systémech UNIX a Linux pomocí Průvodce zjišťováním.

Po dokončení výše uvedených kroků a úspěšném zjištění a nasazení agenta do jednoho nebo více počítačů se systémy UNIX a Linux byste měli ověřit, že se monitoruje správně. Po nasazení agenta se účty Spustit jako používají k provádění zjišťování spuštěných pomocí příslušných pravidel zjišťování a následnému spuštění monitorování. Po několika minutách v pracovním prostoru Správa přejděte na Správa zařízení/POČÍTAČE se systémem UNIX/Linux a ověřte, že počítače nejsou uvedené jako Neznámé. Měly by se zjistit a zobrazit konkrétní verzi operačního systému a distribuce.

Operations Manager ve výchozím nastavení monitoruje následující objekty operačního systému:

  • Operační systém
  • Logický disk
  • Síťové adaptéry

Pomocí šablon sady pro monitorování systémů UNIX a Linux lze rozšířit možnosti monitorování a interakce pro spravované počítače se systémy UNIX a Linux. Další informace najdete v tématech Soubor protokolu systémů UNIX nebo Linux a Proces systému UNIX nebo Linux v průvodci vytvářením obsahu.

Řešení potíží s monitorováním systémů UNIX a Linux

Následující část obsahuje informace o problémech, ke kterým může docházet při monitorování počítačů se systémy UNIX a Linux v nástroji Operations Manager.

Chybová zpráva podepsání certifikátu

Při instalaci agentů systému UNIX/Linux se může zobrazit následující chyba.

Event Type: Error  
Event Source: Cross Platform Modules  
Event Category: None  
Event ID: 256  
Date: 4/1/2009  
Time: 4:02:27 PM  
User: N/A  
Computer: COMPUTER1  
Description: Unexpected ScxCertLibException: Can't decode from base64  
; input data is:  

Tato chyba se zobrazí, pokud je volán modul podepsání certifikátu, ale certifikát je prázdný. Uvedená chyba může být způsobena selháním připojení příkazu SSH ke vzdálenému systému.

Pokud se daná chyba zobrazí, proveďte následující akce:

  1. Ujistěte se, že je na vzdáleném hostiteli spuštěný proces démon SSH.

  2. Ujistěte se, že můžete otevřít relaci SSH se vzdáleným hostitelem pomocí přihlašovacích údajů zadaných v Průvodci zjišťováním.

  3. Ujistěte se, že přihlašovací údaje zadané v průvodci zjišťováním mají požadovaná oprávnění ke zjišťování. Další informace najdete v tématu Přihlašovací údaje, které potřebujete pro přístup k počítačům se systémy UNIX a Linux.

Neshodný název certifikátu a název hostitele

Běžný název (CN), který se používá v certifikátu, se musí shodovat s plně kvalifikovaným názvem domény (FQDN), který překládá Operations Manager. Pokud se CN neshoduje, zobrazí se při spuštění Průvodce zjišťováním následující chyba:

The SSL certificate contains a common name (CN) that doesn't match the hostname  

Základní podrobnosti certifikátu v počítači se systémem UNIX nebo Linux můžete zobrazit zadáním následujícího příkazu:

openssl x509 -noout -in /etc/opt/microsoft/scx/ssl/scx.pem -subject -issuer -dates  

Když to uděláte, zobrazí se výstup podobný tomuto:

subject= /DC=name/DC=newdomain/CN=newhostname/CN=newhostname.newdomain.name  
issuer= /DC=name/DC=newdomain/CN=newhostname/CN=newhostname.newdomain.name  
notBefore=Mar 25 05:21:18 2008 GMT  
notAfter=Mar 20 05:21:18 2029 GMT  

Ověřte názvy hostitele a data, které musí odpovídat názvům přeloženým serverem pro správu nástroje Operations Manager.

Pokud se názvy hostitelů neshodují, vyřešte problém pomocí jedné z následujících akcí:

  • Je-li název hostitele systému UNIX nebo Linux správný, ale server pro správu nástroje Operations Manager ho nemůže správně přeložit, upravte záznam DNS, aby se shodoval se správným plně kvalifikovaným názvem domény, nebo přidejte záznam do souboru hostitelů na serveru nástroje Operations Manager.

  • Jestliže je název hostitele systému UNIX nebo Linux nesprávný, proveďte jednu z následujících akcí:

    • Opravte název hostitele v hostiteli systému UNIX nebo Linux a vytvořte nový certifikát.

    • Vytvořte nový certifikát s požadovaným názvem hostitele.

Změna názvu certifikátu:

Pokud byl certifikát vytvořen s nesprávným názvem, můžete změnit název hostitele a poté znovu vytvořit certifikát a soukromý klíč. V počítači se systémem UNIX nebo Linux spusťte následující příkaz:

/opt/microsoft/scx/bin/tools/scxsslconfig -f -v  

Možnost -f vynutí přepsání souborů v souboru /etc/opt/microsoft/scx/ssl.

Název hostitele a název domény v certifikátu můžete změnit také pomocí přepínačů -h a -d , jako v následujícím příkladu:

/opt/microsoft/scx/bin/tools/scxsslconfig -f -h <hostname> -d <domain.name>  

Restartujte agenta spuštěním následujícího příkazu:

/opt/microsoft/scx/bin/tools/scxadmin -restart  

Přidání položky do souboru hostitelů:

Pokud plně kvalifikovaný název domény není v reverzním DNS, můžete do souboru hostitelů umístěného na serveru pro správu přidat záznam, který poskytne překlad názvů. Soubor hosts se nachází ve složce Windows\System32\Drivers\etc. Položka v souboru hostitelů je kombinací IP adresy a plně kvalifikovaného názvu domény.

Pokud chcete například přidat položku pro hostitele s názvem newhostname.newdomain.name s IP adresou 192.168.1.1, přidejte na konec souboru hostitelů následující kód:

192.168.1.1      newhostname.newdomain.name  

Problémy se sadou Management Pack

Parametr ExecuteCommand nepodporuje operátory kanálů nebo aliasy

Pokud použijete alias nebo operátor kanálu s parametrem ExecuteCommand , příkaz selže. Parametr ExecuteCommand nepodporuje operátor kanálu, aliasy a syntaxi specifickou pro prostředí.

V sadách Management Pack nástroje System Center Operations Manager, které jsou určené ke správě počítačů se systémy UNIX a Linux, parametr ExecuteCommand nespustí proces prostředí, což způsobí selhání vlastní akce.

Pro každý z následujících vlastních typů akcí určíte způsob vyvolání argumentů příkazu pomocí parametru ExecuteCommand nebo ExecuteShellCommand :

  • Microsoft.Unix.WSMan.Invoke.ProbeAction

  • Microsoft.Unix.WSMan.Invoke.WriteAction

  • Microsoft.Unix.WSMan.Invoke.Privileged.ProbeAction

  • Microsoft.Unix.WSMan.Invoke.Privileged.WriteAction

Parametr ExecuteCommand předá argumenty příkazového řádku do konzoly bez spuštění procesu prostředí.

ExecuteShellCommand Parametr předává argumenty příkazu do procesu prostředí pomocí výchozího prostředí uživatele; toto prostředí podporuje kanály, aliasy a syntaxi specifickou pro prostředí.

Poznámka

Parametr ExecuteShellCommand používá výchozí prostředí uživatele, který spouští příkaz . Pokud potřebujete konkrétní prostředí, použijte parametr ExecuteCommand a před argumenty příkazu zadejte předponu požadované prostředí.

Následující příklady ukazují, jak používat parametry ExecuteCommand a ExecuteShellCommand :

  • Předání argumentů příkazového řádku konzoli bez spuštění procesu prostředí:

    <p:ExecuteCommand_INPUT xmlns:p="https://schemas.microsoft.com/wbem/wscim/1/cim-schema/2/SCX_OperatingSystem"> <p:Command> service syslog status </p:Command> <p:timeout>10</p:timeout> </p:ExecuteCommand_INPUT>

  • Předání argumentů příkazového řádku do procesu prostředí, který odkazuje na konkrétní prostředí:

    <p:ExecuteCommand_INPUT xmlns:p="https://schemas.microsoft.com/wbem/wscim/1/cim-schema/2/SCX_OperatingSystem"> <p:Command> /bin/sh ps -ef syslog | grep -v grep </p:Command> <p:timeout>10</p:timeout> </p:ExecuteCommand_INPUT>

  • Předání argumentů příkazu do procesu prostředí, který používá výchozí prostředí uživatele:

    <p:ExecuteShellCommand_INPUT xmlns:p="https://schemas.microsoft.com/wbem/wscim/1/cim-schema/2/SCX_OperatingSystem"> <p:Command> uptime |&nbsp; awk '{print $10}' |awk -F"," '{print $1}' </p:Command> <p:timeout>10</p:timeout> </p:ExecuteShellCommand_INPUT>

Protokolování a ladění

Tato část popisuje, jak povolit nástroje protokolování a ladění pro řešení potíží s monitorováním počítačů se systémy UNIX a Linux.

Poznámka

V Operations Manageru 2019 UR3 je možné změnit nastavení na úrovni protokolu bez restartování agenta. Další informace.

Poznámka

Nastavení na úrovni protokolu můžete změnit bez restartování agenta. Další informace.

Povolení protokolování modulu nástroje Operations Manager

Agenti nástroje Operations Manager pro systémy UNIX a Linux uchovávají několik souborů protokolu, které můžou být užitečné při řešení potíží s klienty. Tyto soubory protokolu jsou umístěny ve spravovaném počítači se systémem UNIX nebo Linux. Úroveň protokolování pro soubory protokolu agenta je možné nakonfigurovat podle potřeby. Podrobnější protokolování může být užitečné při diagnostikování problému. Pro normální provoz by úrovně protokolu neměly být nastaveny na hodnotu podrobnější než výchozí konfigurace (intermediate), aby se zabránilo nadměrnému růstu souborů protokolu.

Poznámka

Volání mimo vzdálenou správu systému Windows (WinRM) jsou prováděna pomocí protokolu SSH/SFTP. Tyto součásti závisí na samostatném mechanismu protokolování, a nikoli na nástroji Operations Manager.

Poznámka

Úroveň protokolování pro soubor protokolu omiserver.log nelze změnit oproti výchozímu nastavení v této verzi agentů nástroje Operations Manager pro UNIX a Linux.

  1. V adresáři Temp pro uživatelský účet, který volá tyto moduly, vytvořte prázdný soubor s názvem EnableOpsmgrModuleLogging zadáním na příkazovém řádku nebo na příkazovém řádku PowerShellu:

    COPY /Y NUL %windir%\TEMP\EnableOpsMgrModuleLogging
    
    New-Item "$env:windir\TEMP\EnableOpsMgrModuleLogging"
    

    Poznámka

    Obecně platí, že volání provádí účet SYSTEM a výchozí dočasná složka SYSTEM je C:\Windows\Temp.

  2. Po vytvoření prázdného souboru nástroj Operations Manager okamžitě začne protokolovat aktivitu SSH a certifikátu do dočasného adresáře. Skripty, které volají moduly SSH, protokolujíScriptname.vbs>< .log. Ostatní moduly mají vlastní protokoly.

V některých případech může být nutné restartovat službu HealthService, aby se protokolování EnableOpsmgrModuleLogging projevilo.

Povolení protokolování agenta systému UNIX

Tyto protokoly budou hlásit akce agenta systému UNIX. Pokud dojde k potížím s daty vrácenými do Operations Manageru, podívejte se do tohoto protokolu. Můžete nastavit, jaké množství informací se bude protokolovat pomocí příkazu scxadmin. Tento příkaz má tuto syntaxi:

scxadmin -log-set [all|cimom|provider] {verbose|intermediate|errors}

Následující tabulka uvádí možné hodnoty parametru:

Level Description
Chyby Protokoluje jenom varovné nebo chybové zprávy.
Středně pokročilý Protokolování informací, upozornění a chybových zpráv
Verbose Protokoluje informační, varovnéa chybové zprávy s protokolováním ladění. Upozorňujeme, že tato úroveň protokolování může způsobit rychlý nárůst velikosti souboru protokolu. K diagnostice konkrétního problému se doporučuje používat tuto možnost pouze na krátkou dobu.

Použití nástroje DebugView k řešení potíží se zjišťováním

Nástroj DebugView představuje alternativní metodu řešení potíží se zjišťováním k protokolování EnableOpsmgrModuleLogging.

  1. Stáhnout DebugView z: https://go.microsoft.comfwlink/?Linkid=129486.

  2. Spusťte nástroj DebugView na serveru pro správu, který provádí zjišťování.

  3. Spusťte zjišťování agentů systému UNIX. V oknech nástroje DebugView se začnou zobrazovat příslušné údaje.

  4. Nástroj DebugView vás provede krok za krokem průvodcem procesu zjišťování. Často se jedná o nejrychlejší metodu, jak vyřešit potíže se zjišťováním.

Povolení protokolování Operations Manageru pro vzdálenou správu Windows

Tato metoda podrobného trasování je využívána k zobrazení dotazů služby vzdálené správy systému Windows (WinRM) používané nástrojem Operations Manager k získávání dat z agenta. Pokud máte podezření, že došlo k potížím s připojením WinRM, tento protokol obsahuje podrobné informace, které vám můžou pomoct s řešením potíží.

  1. Otevřete příkazový řádek na serveru pro správu, který monitoruje agenta systému UNIX nebo Linux.

  2. Na příkazovém řádku zadejte následující příkazy:

    1. cd C:\Program Files\Microsoft System Center\Operations Manager\Tools

    2. StopTracing.cmd

    3. StartTracing.cmd VER

  3. Zopakujte problém způsobující selhání v nástroji Operations Manager.

  4. Na příkazovém řádku zadejte následující příkazy:

    1. StopTracing.cmd

    2. FormatTracing.cmd

  5. V souboru TracingGuidsNative.log vyhledejte WS-Man.

Poznámka

Služba WinRM je také známá jako služba WS-Management (WS-Man).

Poznámka

Příkaz FormatTracing otevře okno Průzkumníka Windows zobrazující C:\Windows\Logs\OpsMgrTrace adresář. V tomto adresáři se nachází soubor TracingGuidsNative.log.

Správa souborů protokolu pro systémy UNIX a Linux

Agenti nástroje Operations Manager pro UNIX a Linux velikost souborů protokolu agenta neomezuje. Pro účely kontroly nad maximální velikostí souborů protokolu implementujte proces správy souborů protokolu. Ve spoustě operačních systémů UNIX a Linux je třeba dostupný standardní nástroj logrotate. Nástroj logrotate se dá nakonfigurovat na řízení souborů protokolu používaných agenty nástroje Operations Manager v systému UNIX nebo Linux. Po rotaci nebo změně souborů protokolu agenta musí agent dostat signál, že proběhla rotace protokolů, aby bylo možné v protokolování pokračovat. Příkaz scxadmin je možné použít s parametrem -log-rotate s následující syntaxí:

scxadmin -log-rotate all

Příklad konfiguračního souboru Logrotate

Následující příklad ukazuje konfigurační soubor pro otočení souborů scx.log a omiserver.log pomocí nástroje logrotate linuxu. Logrotate se obvykle spouští jako naplánovaná úloha (s crondem) a bude pracovat s konfiguračními soubory v /etc/logrotate.dsouboru . Pokud chcete tento konfigurační soubor otestovat a použít, upravte konfiguraci tak, aby byla vhodná pro vaše prostředí, a propojte nebo uložte soubor do /etc/logrotate.d.

#opsmgr.lr  

#Rotate scx.log  
#Weekly rotation, retain four weeks of compressed logs  
#Invoke scxadmin -log-rotate to resume logging after rotation  

/var/opt/microsoft/scx/log/scx.log {  
rotate 4  
weekly  
compress  
missingok  
notifempty  
postrotate  

/usr/sbin/scxadmin -log-rotate all  
endscript  
}

#Rotate scx.log for the monitoring user account named: monuser  
#Weekly rotation, retain four weeks of compressed logs  
#Invoke scxadmin -log-rotate to resume logging after rotation  

/var/opt/microsoft/scx/log/monuser/scx.log {  
rotate 4  
weekly  
compress  
missingok  
notifempty  
postrotate  

/usr/sbin/scxadmin -log-rotate all
endscript  
}  

#Optionally, rotate omiserver.log. This requires that OMI be stopped and started to prevent  
#impact to logging. Monthly rotation, retain two weeks of compressed logs  
#Uncomment these lines if rotation of omiserver.log is needed  

#/var/opt/microsoft/scx/log/omiserver.log{  
#        rotate 2  
#        monthly  
#        compress  
#        missingok  
#        notifempty  
#        prerotate  
#        /usr/sbin/scxadmin -stop  
#        endscript  
#        postrotate  
#        /usr/sbin/scxadmin -start  
#        endscript\
#}  

Další kroky

Další doprovodné materiály, které vám pomůžou s řešením běžných problémů s nasazením agenta, najdete na wikiwebu věnovaném řešení potíží s nástrojem Operations Manager 2012: Zjišťování agenta systému UNIX/Linux.