Panduan pemecahan masalah untuk agen Azure Monitor di komputer virtual Linux dan set skala

Gambaran umum untuk agen Azure Monitor

Sebelum membaca lebih lanjut, Anda harus terbiasa dengan agen Azure Monitor dan Aturan Pengumpulan Data.

Terminologi

Nama Singkatan Deskripsi
Agen Azure Monitor AMA Agen Azure Monitor baru
Aturan Pengumpulan Data DCR Aturan untuk mengonfigurasi pengumpulan data oleh agen, yaitu apa yang harus dikumpulkan, ke mana harus dikirim, dan banyak lagi
Azure Monitor Configuration Service AMCS Layanan regional yang dihosting di Azure, yang mengontrol pengumpulan data untuk agen ini dan bagian lain dari Azure Monitor. Agen memanggil ke layanan ini untuk mengambil DCI.
Titik akhir log -- Titik akhir untuk mengirim data ke ruang kerja Analitik Log
Titik akhir metrik -- Titik akhir untuk mengirim data ke database Metrik Azure Monitor.
Instance Metadata Service dan Hybrid IMDS dan HIMDS Layanan yang dihosting di Azure yang menyediakan informasi tentang komputer virtual yang saat ini berjalan, set skala (melalui IMDS) dan server berkemampuan Arc (melalui HIMDS) masing-masing
Ruang kerja Analitik Log LAW Tujuan di Azure Monitor tempat Anda dapat mengirim log yang dikumpulkan oleh agen ke
Metrik Kustom -- Tujuan di Azure Monitor tempat Anda dapat mengirim metrik tamu yang dikumpulkan oleh agen

Langkah-langkah pemecahan masalah dasar

Ikuti langkah-langkah di bawah ini untuk memecahkan masalah versi terbaru agen Azure Monitor yang berjalan di komputer virtual Linux Anda:

  1. Tinjau prasyarat dengan cermat di sini.

  2. Verifikasi bahwa ekstensi berhasil diinstal dan disediakan, yang menginstal biner agen di komputer Anda:

    1. Buka portal Azure > pilih Pengaturan Buka komputer > virtual Anda: Ekstensi + aplikasi dari panel di sebelah kiri > 'AzureMonitorLinuxAgent'harus muncul dengan Status: 'Provisi berhasil'
    2. Jika Anda tidak melihat ekstensi tercantum, periksa apakah mesin dapat mencapai Azure dan menemukan ekstensi untuk diinstal menggunakan perintah di bawah ini:
      az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Tunggu selama 10-15 menit karena ekstensi mungkin dalam status transisi. Jika masih tidak muncul seperti di atas, hapus instalan dan instal ekstensi lagi.
    4. Periksa apakah Anda melihat kesalahan dalam log agen inti yang terletak di /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ pada komputer Anda
    5. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan sebagai 'Ekstensi AMA gagal diinstal atau disediakan' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.
  3. Pastikan bahwa layanan agen berjalan:

    1. Periksa apakah agen memancarkan log heartbeat ke ruang kerja Log Analytics menggunakan kueri di bawah ini. Lewati jika 'Metrik Kustom' adalah satu-satunya tujuan di DCR:
      Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
      
    2. Pastikan bahwa layanan agen berjalan
      systemctl status azuremonitoragent
      
    3. Periksa apakah Anda melihat kesalahan apa pun di log agen inti yang terletak di /var/opt/microsoft/azuremonitoragent/log/mdsd.* pada komputer Anda
    4. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan sebagai 'Ekstensi AMA yang disediakan tetapi tidak berjalan' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.
  4. Verifikasi bahwa DCR ada dan dikaitkan dengan komputer virtual:

    1. Jika menggunakan ruang kerja Analitik Log sebagai tujuan, verifikasi bahwa DCR ada di wilayah fisik yang sama dengan ruang kerja Analitik Log.
    2. Buka portal Azure > pilih aturan > pengumpulan data Anda Konfigurasi Terbuka: Sumber daya dari panel di sebelah kiri > Anda akan melihat komputer virtual yang tercantum di sini.
    3. Jika tidak tercantum, klik 'Tambahkan' dan pilih komputer virtual Anda dari pemilih sumber daya. Ulangi di semua DCI.
    4. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan sebagai 'DCR tidak ditemukan atau terkait' dan Jenis masalah sebagai 'Saya perlu bantuan mengonfigurasi pengumpulan data dari VM'.
  5. Verifikasi bahwa agen dapat mengunduh DCR terkait dari layanan AMCS:

    1. Periksa apakah Anda melihat DCR terbaru yang diunduh di lokasi ini /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
    2. Jika tidak, ajukan tiket dengan Ringkasan sebagai 'AMA tidak dapat mengunduh konfigurasi DCR' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.

Masalah saat mengumpulkan Syslog

Untuk informasi selengkapnya tentang cara memecahkan masalah syslog dengan Agen Azure Monitor, lihat di sini.

  • File quality of service (QoS) /var/opt/microsoft/azuremonitoragent/log/mdsd.qos menyediakan agregasi format CSV 15 menit dari peristiwa yang diproses dan berisi informasi tentang jumlah peristiwa syslog yang diproses dalam jangka waktu tertentu. File ini berguna dalam melacak penurunan penyerapan peristiwa Syslog.

    Misalnya, fragmen di bawah ini menunjukkan bahwa dalam 15 menit sebelumnya 2022-02-28T19:55:23.5432920Z, agen menerima 77 peristiwa syslog dengan daemon fasilitas dan info tingkat dan mengirim 77 peristiwa tersebut ke tugas pengunggahan. Selain itu, tugas pengunggahan agen menerima 77 dan berhasil mengunggah 77 pesan daemon.info ini.

    #Time: 2022-02-28T19:55:23.5432920Z
    #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
    ...
    MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
    MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
    ...
    MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Langkah-langkah pemecahan masalah

  1. Tinjau langkah-langkah pemecahan masalah AMA Linux generik terlebih dahulu. Jika agen memancarkan heartbeat, lanjutkan ke langkah 2.
  2. Konfigurasi yang diurai disimpan di /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Periksa apakah koleksi Syslog didefinisikan dan tujuan log sama dengan yang dibangun di DCR UI / DCR JSON.
    1. Jika ya, lanjutkan ke langkah 3. Jika tidak, masalahnya ada dalam alur kerja konfigurasi.
    2. Selidiki file mdsd.err,mdsd.warn, mdsd.info pada /var/opt/microsoft/azuremonitoragent/log untuk kemungkinan kesalahan konfigurasi.
    3. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan sebagai 'Syslog DCR tidak tersedia' dan Jenis masalah sebagai 'Saya perlu bantuan mengonfigurasi pengumpulan data dari VM'.
  3. Validasi tata letak alur kerja pengumpulan Syslog untuk memastikan semua bagian yang diperlukan ada di tempat dan dapat diakses:
    1. Untuk rsyslog pengguna, pastikan /etc/rsyslog.d/10-azuremonitoragent.conf file ada, tidak kosong, dan dapat diakses oleh rsyslog daemon (pengguna syslog).
      1. Periksa konfigurasi rsyslog Anda di /etc/rsyslog.conf dan /etc/rsyslog.d/* untuk melihat apakah Anda memiliki input yang terikat ke set aturan non-default, karena pesan dari input ini tidak akan diteruskan ke Agen Azure Monitor. Misalnya, pesan dari input yang dikonfigurasi dengan set aturan non-default seperti input(type="imtcp" port="514" ruleset="myruleset") tidak akan diteruskan.
    2. Untuk syslog-ng pengguna, pastikan /etc/syslog-ng/conf.d/azuremonitoragent.conf file ada, tidak kosong, dan dapat diakses oleh syslog-ng daemon (pengguna syslog).
    3. Pastikan file /run/azuremonitoragent/default_syslog.socket ada dan dapat diakses oleh rsyslog atau syslog-ng masing-masing.
    4. Periksa penurunan terkait jumlah peristiwa syslog yang diproses di /var/opt/microsoft/azuremonitoragent/log/mdsd.qos. Jika penurunan tersebut tidak ditunjukkan dalam file, ajukan tiket dengan Ringkasan sebagai 'Data Syslog yang dihilangkan dalam alur' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.
    5. Periksa apakah antrean daemon syslog tidak meluap, menyebabkan unggahan gagal, dengan merujuk panduan di sini: Data Rsyslog tidak diunggah karena masalah ruang Disk Penuh di Agen Linux AMA
  4. Untuk men-debug penyerapan peristiwa syslog lebih lanjut, Anda dapat menambahkan bendera pelacakan -T 0x2002 di akhir MDSD_OPTIONS dalam file /etc/default/azuremonitoragent, dan memulai ulang agen:
    export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Setelah masalah direproksi dengan bendera pelacakan aktif, Anda akan menemukan informasi debug lainnya di /var/opt/microsoft/azuremonitoragent/log/mdsd.info. Periksa file untuk kemungkinan penyebab masalah pengumpulan syslog, seperti kesalahan penguraian / pemrosesan / konfigurasi / pengunggahan.

    Peringatan

    Pastikan untuk menghapus pengaturan bendera pelacakan -T 0x2002 setelah sesi debugging, karena menghasilkan banyak pernyataan jejak yang dapat mengisi disk lebih cepat atau membuat penguraian file log secara visual sulit.

  6. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan karena 'AMA gagal mengumpulkan peristiwa syslog' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.

Pemecahan masalah di server yang diaktifkan Arc

Jika setelah memeriksa langkah-langkah pemecahan masalah dasar, Anda tidak melihat Agen Azure Monitor memancarkan log atau menemukan kesalahan 'Gagal mendapatkan token MSI dari titik akhir IMDS' dalam /var/opt/microsoft/azuremonitoragent/log/mdsd.err file log, kemungkinan syslog pengguna bukan anggota grup himds. Tambahkan syslog pengguna ke himds grup pengguna jika pengguna bukan anggota grup ini. Buat pengguna syslog dan grup syslog, jika perlu, dan pastikan bahwa pengguna berada dalam grup tersebut. Untuk informasi selengkapnya, lihat persyaratan autentikasi server dengan dukungan Azure Arc di sini.

Ajukan tiket

  1. Buka aturan pengumpulan data dan pada menu di sebelah kiri, pilih Permintaan Dukungan Baru. Anda juga dapat membuka panel Bantuan + dukungan dan memilih Buat permintaan dukungan.
  2. Pilih:
    • Jenis masalah: Teknis.
    • Langganan: Pilih langganan tempat komputer Anda berada.
    • Jenis layanan: Aturan pengumpulan data dan Agen Azure Monitor.
    • Apakah masalah Anda terkait dengan sumber daya?: Ya. Pilih komputer Anda dengan menggunakan pemilih sumber daya.
  3. Masukkan Ringkasan dan Jenis masalah seperti yang ditunjukkan dari langkah-langkah pemecahan masalah. Informasi yang akurat mengarah pada penyelesaian masalah yang lebih cepat.
  4. Pilih Berikutnya dan tinjau solusi yang direkomendasikan untuk melihat apakah solusi tersebut membantu.
  5. Jika tidak membantu, pilih Berikutnya dan isi kumpulan detail berikutnya.
  6. Pilih Berikutnya, tinjau detail akhir, dan pilih Buat.