Solusi Kesehatan Agen di Azure Monitor

Solusi Agent Health di Azure membantu Anda memahami agen pemantauan mana yang tidak responsif dan mengirimkan data operasional. Solusi ini mencakup semua agen yang melapor langsung ke ruang kerja Analitik Log di Azure Monitor atau ke grup manajemen Manajer Operasi Pusat Sistem yang terhubung ke Azure Monitor.

Anda juga dapat menggunakan solusi Agent Health untuk:

  • Melacak berapa banyak agen yang disebarkan dan di mana mereka didistribusikan secara geografis.
  • Melakukan kueri lainnya untuk mempertahankan kesadaran akan distribusi agen yang disebarkan di Azure, di lingkungan cloud lain, atau di komputer lokal.

Penting

Solusi Kesehatan Agen hanya memantau kesehatan agen Log Analytics yang berada di jalur penghentian. Solusi ini tidak memantau kesehatan agen Azure Monitor.

Prasyarat

Sebelum Anda menyebarkan solusi ini, konfirmasikan bahwa Anda telah mendukung agen Windows yang melaporkan ke ruang kerja Analitik Log atau melaporkan ke grup manajemen Manajer Operasi yang terintegrasi dengan ruang kerja Anda.

Paket manajemen

Jika grup manajemen Operations Manager Anda tersambung ke ruang kerja Analitik Log, paket manajemen berikut ini dipasang di Operations Manager. Paket manajemen ini juga diinstal pada komputer Windows yang terhubung langsung setelah Anda menambahkan solusi ini:

  • Paket Kecerdasan Saluran Langsung HealthAssessment Advisor Pusat Sistem Microsoft (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Paket Kecerdasan Saluran Server HealthAssessment Microsoft System Center Advisor (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

Tidak ada yang perlu dikonfigurasi atau dikelola dengan paket manajemen ini. Untuk informasi selengkapnya tentang bagaimana paket manajemen solusi diperbarui, lihat Menghubungkan Manajer Operasi ke Analitik Log.

Konfigurasi

Tambahkan solusi Agent Health ke ruang kerja Analitik Log Anda dengan menggunakan proses yang dijelaskan di Menambahkan solusi. Tidak diperlukan konfigurasi lainnya.

Agen yang didukung

Tabel berikut ini menjelaskan sumber tersambung yang didukung oleh solusi ini.

Sumber yang tersambung Didukung Deskripsi
Agen Windows Ya Peristiwa heartbeat dikumpulkan dari agen Windows langsung.
Grup manajemen Manajer Pengoperasian Pusat Sistem Ya Peristiwa heartbeat dikumpulkan dari agen yang melaporkan ke grup manajemen setiap 60 detik dan kemudian diteruskan ke Azure Monitor. Koneksi langsung dari agen Operations Manager ke Azure Monitor tidak diperlukan. Data peristiwa heartbeat diteruskan dari grup manajemen ke ruang kerja Analitik Log.

Menggunakan solusi

Saat Anda menambahkan solusi ke ruang kerja Analitik Log, petak peta Agent Health akan ditambahkan ke dasbor Anda. Petak ini menunjukkan jumlah total agen dan jumlah agen yang tidak responsif dalam 24 jam terakhir.

Cuplikan layar yang memperlihatkan petak peta Agent Health di dasbor.

Pilih petak peta Agent Health untuk membuka dasbor Agent Health. Dasbor menyertakan kolom dalam tabel berikut. Setiap kolom mencantumkan 10 peristiwa teratas menurut hitungan yang cocok dengan kriteria kolom tersebut untuk rentang waktu yang ditentukan. Anda dapat menjalankan pencarian log yang menyediakan seluruh daftar. Pilih Lihat semua di bawah setiap kolom atau pilih judul kolom.

Kolom Deskripsi
Jumlah agen dari waktu ke waktu Tren agen Anda dihitung selama periode tujuh hari untuk agen Linux dan Windows
Jumlah agen yang tidak responsif Daftar agen yang tidak mengirim heartbeat dalam 24 jam terakhir
Distribusi berdasarkan jenis OS Partisi jumlah agen Windows dan Linux yang Anda miliki di lingkungan Anda
Distribusi berdasarkan versi agen Partisi versi agen yang diinstal di lingkungan Anda dan jumlah setiap versi agen
Distribusi berdasarkan kategori agen Partisi dari kategori agen yang mengirimkan peristiwa heartbeat: agen langsung, agen Operations Manager, atau server manajemen Operations Manager
Distribusi berdasarkan grup manajemen Partisi grup manajemen Operations Manager yang berbeda di lingkungan Anda
Geolokasi agen Partisi negara/wilayah tempat Anda memiliki agen dan hitungan total jumlah agen yang telah diinstal di setiap negara/wilayah
Jumlah gateway yang terinstal Jumlah server yang menginstal gateway Analitik Log, dan daftar server ini

Cuplikan layar yang memperlihatkan contoh dasbor solusi Agent Health.

Catatan log Azure Monitor

Solusi ini membuat satu jenis catatan di ruang kerja Analitik Log: heartbeat. Rekaman heartbeat memiliki properti yang tercantum dalam tabel berikut ini.

Properti Deskripsi
Type Heartbeat
Category Direct Agent, SCOM Agent, atau SCOM Management Server
Computer Nama komputer
OSType Sistem operasi Windows atau Linux
OSMajorVersion Versi utama sistem operasi
OSMinorVersion Versi minor sistem operasi
Version Versi agen Analitik Log atau agen Manajer Operasi
SCAgentChannel Direct dan/atau SCManagementServer
IsGatewayInstalled true jika gateway Analitik Log diinstal; sebaliknya false
ComputerIP Alamat IP publik untuk mesin virtual Azure, jika ada; Alamat Azure SNAT (bukan alamat IP pribadi) untuk mesin virtual yang menggunakan IP pribadi
ComputerPrivateIPs Daftar IP pribadi komputer
RemoteIPCountry Lokasi geografis tempat komputer disebarkan
ManagementGroupName Nama grup manajemen Manajer Operasi
SourceComputerId ID unik komputer
RemoteIPLongitude Garis bujur lokasi geografis komputer
RemoteIPLatitude Garis lintang lokasi geografis komputer

Setiap agen yang melapor ke server manajemen Manajer Operasi akan mengirim dua heartbeat. Nilai properti SCAgentChannel akan mencakup Direct dan SCManagementServer, tergantung pada sumber data dan solusi pemantauan apa yang telah Anda aktifkan dalam langganan Anda.

Jika Anda ingat, data dari solusi juga dikirim:

  • Langsung dari server manajemen Manajer Operasi ke Azure Monitor.
  • Langsung dari agen ke Azure Monitor, karena volume data yang dikumpulkan pada agen.

Untuk peristiwa heartbeat yang memiliki nilai SCManagementServer, nilai ComputerIP adalah alamat IP server manajemen karena benar-benar mengunggah data. Untuk heartbeat tempat SCAgentChannel diatur ke Direct, itu adalah alamat IP publik agen.

Contoh pencarian log

Tabel berikut ini menyediakan sampel pencarian log untuk catatan yang dikumpulkan oleh solusi ini.

Kueri Deskripsi
Heartbeat | Komputer yang berbeda Jumlah total agen
Heartbeat | meringkas LastCall = max(TimeGenerated) berdasarkan Komputer | di mana LastCall < ago(24h) Jumlah agen yang tidak responsif dalam 24 jam terakhir
Heartbeat | meringkas LastCall = max(TimeGenerated) berdasarkan Komputer | di mana LastCall < ago(15m) Jumlah agen yang tidak responsif dalam 15 menit terakhir
Heartbeat | di mana TimeGenerated > ago(24h) dan Komputer di ((Heartbeat | di mana TimeGenerated > ago(24h) | Komputer berbeda)) | meringkas LastCall = max(TimeGenerated) berdasarkan Komputer Komputer online dalam 24 jam terakhir
Heartbeat | di mana TimeGenerated > ago(24h) dan Komputer !in ((Heartbeat | di mana TimeGenerated > ago(30m) | Komputer berbeda)) | meringkas LastCall = max(TimeGenerated) berdasarkan Komputer Total agen yang offline dalam 30 menit terakhir (selama 24 jam terakhir)
Heartbeat | meringkas AggregatedValue = dcount(Computer) berdasarkan OSType Tren jumlah agen dari waktu ke waktu berdasarkan jenis OS
Heartbeat | meringkas AggregatedValue = dcount(Computer) berdasarkan OSType Distribusi berdasarkan jenis OS
Heartbeat | meringkas AggregatedValue = dcount(Computer) berdasarkan Versi Distribusi berdasarkan versi agen
Heartbeat | meringkas AggregatedValue = count() berdasarkan Kategori Distribusi berdasarkan kategori agen
Heartbeat | meringkas AggregatedValue = dcount(Computer) berdasarkan ManagementGroupName Distribusi berdasarkan grup manajemen
Heartbeat | meringkas AggregatedValue = dcount(Computer) berdasarkan RemoteIPCountry Geolokasi agen
Heartbeat | di mana iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | Komputer yang berbeda Jumlah gateway Analitik Log yang terinstal

Langkah berikutnya

Pelajari tentang membuat pemberitahuan dari kueri log di Azure Monitor.