Panduan pemecahan masalah untuk agen Azure Monitor di komputer virtual Linux dan set skala

Gambaran umum untuk agen Azure Monitor

Sebelum membaca lebih lanjut, Anda harus terbiasa dengan agen Azure Monitor dan Aturan Pengumpulan Data.

Terminologi

Nama Singkatan Deskripsi
Agen Azure Monitor AMA Agen Azure Monitor baru
Aturan Pengumpulan Data DCR Aturan untuk mengonfigurasi pengumpulan data oleh agen, yaitu apa yang harus dikumpulkan, ke mana harus dikirim, dan banyak lagi
Azure Monitor Configuration Service AMCS Layanan regional yang dihosting di Azure, yang mengontrol pengumpulan data untuk agen ini dan bagian lain dari Azure Monitor. Agen memanggil ke layanan ini untuk mengambil DCI.
Titik akhir log -- Titik akhir untuk mengirim data ke ruang kerja Analitik Log
Titik akhir metrik -- Titik akhir untuk mengirim data ke database Metrik Azure Monitor.
Instance Metadata Service dan Hybrid IMDS dan HIMDS Layanan yang dihosting di Azure yang menyediakan informasi tentang komputer virtual yang saat ini berjalan, set skala (melalui IMDS) dan server berkemampuan Arc (melalui HIMDS) masing-masing
Ruang kerja Analitik Log LAW Tujuan di Azure Monitor tempat Anda dapat mengirim log yang dikumpulkan oleh agen ke
Metrik Kustom -- Tujuan di Azure Monitor tempat Anda dapat mengirim metrik tamu yang dikumpulkan oleh agen

Langkah-langkah pemecahan masalah dasar

Ikuti langkah-langkah di bawah ini untuk memecahkan masalah versi terbaru agen Azure Monitor yang berjalan di komputer virtual Linux Anda:

  1. Tinjau prasyarat dengan cermat di sini.

  2. Verifikasi bahwa ekstensi berhasil diinstal dan disediakan, yang menginstal biner agen di komputer Anda:

    1. Buka portal Azure > pilih komputer > virtual Anda Buka Pengaturan : Bilah Ekstensi + aplikasi dari menu > kiri 'AzureMonitorLinuxAgent'harus muncul dengan Status: 'Provisi berhasil'
    2. Jika Anda tidak melihat ekstensi tercantum, periksa apakah mesin dapat mencapai Azure dan menemukan ekstensi untuk diinstal menggunakan perintah di bawah ini:
       az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Tunggu selama 10-15 menit karena ekstensi mungkin dalam status transisi. Jika masih tidak muncul seperti di atas, hapus instalan dan instal ekstensi lagi.
    4. Periksa apakah Anda melihat kesalahan dalam log agen inti yang terletak di /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ pada komputer Anda
    5. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan sebagai 'Ekstensi AMA gagal diinstal atau disediakan' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.
  3. Pastikan bahwa layanan agen berjalan:

    1. Periksa apakah agen memancarkan log heartbeat ke ruang kerja Log Analytics menggunakan kueri di bawah ini. Lewati jika 'Metrik Kustom' adalah satu-satunya tujuan di DCR:
       Heartbeat | where Category == "Azure Monitor Agent" and 'Computer' == "<computer-name>" | take 10
      
    2. Pastikan bahwa layanan agen berjalan
       systemctl status azuremonitoragent
      
    3. Periksa apakah Anda melihat kesalahan apa pun di log agen inti yang terletak di /var/opt/microsoft/azuremonitoragent/log/mdsd.* pada komputer Anda
    4. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan sebagai 'Ekstensi AMA yang disediakan tetapi tidak berjalan' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.
  4. Verifikasi bahwa DCR ada dan dikaitkan dengan komputer virtual:

    1. Jika menggunakan ruang kerja Analitik Log sebagai tujuan, verifikasi bahwa DCR ada di wilayah fisik yang sama dengan ruang kerja Analitik Log.
    2. Buka portal Azure > pilih aturan > pengumpulan data Anda Buka Konfigurasi : Bilah sumber daya dari menu > kiri Anda akan melihat komputer virtual tercantum di sini.
    3. Jika tidak tercantum, klik 'Tambahkan' dan pilih komputer virtual Anda dari pemilih sumber daya. Ulangi di semua DCI.
    4. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan sebagai 'DCR tidak ditemukan atau terkait' dan Jenis masalah sebagai 'Saya perlu bantuan mengonfigurasi pengumpulan data dari VM'.
  5. Verifikasi bahwa agen dapat mengunduh DCR terkait dari layanan AMCS:

    1. Periksa apakah Anda melihat DCR terbaru yang diunduh di lokasi ini /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
    2. Jika tidak, ajukan tiket dengan Ringkasan sebagai 'AMA tidak dapat mengunduh konfigurasi DCR' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.

Masalah saat mengumpulkan penghitung Kinerja

Masalah saat mengumpulkan Syslog

Berikut cara AMA mengumpulkan peristiwa syslog:

  • AMA menginstal konfigurasi output untuk daemon syslog sistem selama proses penginstalan. File konfigurasi menentukan cara peristiwa mengalir antara daemon syslog dan AMA.

  • Untuk rsyslog (sebagian besar distribusi Linux), file konfigurasinya adalah /etc/rsyslog.d/10-azuremonitoragent.conf. Untuk syslog-ng, file konfigurasinya adalah /etc/syslog-ng/conf.d/azuremonitoragent.conf.

  • AMA mendengarkan soket domain UNIX untuk menerima peristiwa dari rsyslog / syslog-ng. Jalur soket untuk komunikasi ini adalah /run/azuremonitoragent/default_syslog.socket

  • Daemon syslog akan menggunakan antrean ketika penyerapan AMA tertunda, atau ketika AMA tidak dapat dijangkau.

  • AMA menyerap peristiwa syslog melalui soket yang disebutkan di atas dan memfilternya berdasarkan kombinasi fasilitas / tingkat keparahan dari konfigurasi DCR di /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Setiap facility / severity yang tidak ada di DCR akan dihilangkan.

  • AMA mencoba mengurai peristiwa sesuai dengan RFC3164 dan RFC5424. Selain itu, ia tahu cara mengurai format pesan yang tercantum di sini.

  • AMA mengidentifikasi titik akhir tujuan untuk peristiwa Syslog dari konfigurasi DCR dan mencoba mengunggah peristiwa.

    Catatan

    AMA menggunakan persistensi lokal secara default, semua peristiwa yang diterima dari rsyslog / syslog-ng diantrekan di /var/opt/microsoft/azuremonitoragent/events sebelum diunggah.

  • File quality of service (QoS) /var/opt/microsoft/azuremonitoragent/log/mdsd.qos menyediakan agregasi format CSV 15 menit dari peristiwa yang diproses dan berisi informasi tentang jumlah peristiwa syslog yang diproses dalam jangka waktu tertentu. File ini berguna dalam melacak penurunan penyerapan peristiwa Syslog.

    Misalnya, fragmen di bawah ini menunjukkan bahwa dalam 15 menit sebelumnya 2022-02-28T19:55:23.5432920Z, agen menerima 77 peristiwa syslog dengan daemon fasilitas dan info tingkat dan mengirim 77 peristiwa tersebut ke tugas pengunggahan. Selain itu, tugas pengunggahan agen menerima 77 dan berhasil mengunggah 77 pesan daemon.info ini.

      #Time: 2022-02-28T19:55:23.5432920Z
      #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
      ...
      MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
      MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
      ...
      MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Langkah-langkah pemecahan masalah

  1. Tinjau langkah-langkah pemecahan masalah AMA Linux generik terlebih dahulu. Jika agen memancarkan heartbeat, lanjutkan ke langkah 2.
  2. Konfigurasi yang diurai disimpan di /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Periksa apakah koleksi Syslog didefinisikan dan tujuan log sama dengan yang dibangun di DCR UI / DCR JSON.
    1. Jika ya, lanjutkan ke langkah 3. Jika tidak, masalahnya ada dalam alur kerja konfigurasi.
    2. Selidiki file mdsd.err,mdsd.warn, mdsd.info pada /var/opt/microsoft/azuremonitoragent/log untuk kemungkinan kesalahan konfigurasi.
    3. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan sebagai 'Syslog DCR tidak tersedia' dan Jenis masalah sebagai 'Saya perlu bantuan mengonfigurasi pengumpulan data dari VM'.
  3. Validasi tata letak alur kerja pengumpulan Syslog untuk memastikan semua bagian yang diperlukan ada di tempat dan dapat diakses:
    1. Untuk rsyslog pengguna, pastikan /etc/rsyslog.d/10-azuremonitoragent.conf file ada, tidak kosong, dan dapat diakses oleh rsyslog daemon (pengguna syslog).
    2. Untuk syslog-ng pengguna, pastikan /etc/syslog-ng/conf.d/azuremonitoragent.conf file ada, tidak kosong, dan dapat diakses oleh syslog-ng daemon (pengguna syslog).
    3. Pastikan file /run/azuremonitoragent/default_syslog.socket ada dan dapat diakses oleh rsyslog atau syslog-ng masing-masing.
    4. Periksa penurunan terkait jumlah peristiwa syslog yang diproses di /var/opt/microsoft/azuremonitoragent/log/mdsd.qos. Jika penurunan tersebut tidak ditunjukkan dalam file, ajukan tiket dengan Ringkasan sebagai 'Data Syslog yang dihilangkan dalam alur' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.
    5. Periksa apakah antrean daemon syslog tidak meluap, menyebabkan unggahan gagal, dengan merujuk panduan di sini: Data Rsyslog tidak diunggah karena masalah ruang Disk Penuh di Agen Linux AMA
  4. Untuk men-debug penyerapan peristiwa syslog lebih lanjut, Anda dapat menambahkan bendera pelacakan -T 0x2002 di akhir MDSD_OPTIONS dalam file /etc/default/azuremonitoragent, dan memulai ulang agen:
     export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Setelah masalah direproksi dengan bendera pelacakan aktif, Anda akan menemukan informasi debug lainnya di /var/opt/microsoft/azuremonitoragent/log/mdsd.info. Periksa file untuk kemungkinan penyebab masalah pengumpulan syslog, seperti kesalahan penguraian / pemrosesan / konfigurasi / pengunggahan.

    Peringatan

    Pastikan untuk menghapus pengaturan bendera pelacakan -T 0x2002 setelah sesi debugging, karena menghasilkan banyak pernyataan jejak yang dapat mengisi disk lebih cepat atau membuat penguraian file log secara visual sulit.

  6. Jika tidak ada hal di atas yang membantu, ajukan tiket dengan Ringkasan karena 'AMA gagal mengumpulkan peristiwa syslog' dan Jenis masalah sebagai 'Saya memerlukan bantuan dengan Agen Linux Azure Monitor'.

Ajukan tiket

  1. Buka aturan pengumpulan data dan pilih Permintaan Dukungan Baru dari menu kiri ATAU buka bilah 'Bantuan + dukungan' dan pilih Buat permintaan dukungan
  2. Pilih
    • Jenis Masalah: Teknis
    • Langganan: Pilih langganan tempat komputer Anda berada
    • Jenis layanan: Aturan Pengumpulan Data (DCR) dan Agen (AMA)
    • Apakah masalah Anda terkait dengan sumber daya? Ya (Pilih komputer Anda menggunakan pemilih sumber daya muncul)
  3. Masukkan 'Ringkasan' dan 'Jenis masalah' seperti yang ditunjukkan dari langkah-langkah pemecahan masalah. Detail yang akurat akan menyebabkan penyelesaian masalah yang lebih cepat.
  4. Klik 'Berikutnya' dan tinjau solusi yang direkomendasikan untuk melihat apakah solusi tersebut membantu.
  5. Jika tidak membantu, klik 'Berikutnya' dan isi kumpulan detail berikutnya.
  6. Klik 'Berikutnya', tinjau detail akhir dan tekan 'Buat'.