Mengumpulkan data pemantauan yang tepat

Mengamati kesehatan dan ketersediaan solusi cloud Anda membantu membangun pemahaman tentang sinyal yang Anda harapkan di sistem Anda sehingga Anda dapat menentukan data apa yang harus Anda kumpulkan.

Artikel ini adalah bagian dari seri dalam panduan pemantauan cloud.

Pertimbangan pengumpulan data

Tanyakan pada diri Anda pertanyaan-pertanyaan ini untuk menetapkan kriteria untuk konfigurasi pemantauan:

  • Komposisi layanan: Apa komposisi layanan? Apakah dependensi tersebut dipantau hari ini? Jika demikian, apakah ada beberapa alat yang terlibat, dan apakah ada kesempatan untuk mengonsolidasikan tanpa menimbulkan risiko tambahan?

  • Tentukan status kegagalan yang dapat diprediksi: Sinyal-sinyal ini adalah gejala kegagalan, bukan penyebabnya. Alat pemantauan menggunakan metrik dan log untuk diagnostik tingkat lanjut dan analisis akar penyebab.

  • SLA Layanan: Apa itu Perjanjian Tingkat Layanan (SLA) layanan, dan bagaimana Anda akan mengukur dan melaporkannya?

  • Desain dasbor layanan: Seperti apa dasbor layanan saat meninjau insiden? Seperti apa dasbor untuk pemilik layanan dan tim yang mendukung layanan?

  • Metrik sumber daya: Metrik sumber daya apa yang diproduksi oleh solusi yang perlu Anda pantau?

  • Pencarian log: Bagaimana pemilik layanan, tim dukungan, dan personel lainnya akan mencari log?

  • Keterlibatan pemangku kepentingan: Meliputi pemilik layanan pemantauan, manajer operasi TI, dan pemangku kepentingan lainnya selama fase perencanaan. Terus libatkan mereka di seluruh siklus pengembangan dan rilis solusi pemantauan Anda.

  • Data sensitif: Data sensitif apa yang harus saya hindari untuk dikumpulkan untuk aplikasi yang tidak ingin saya ekspos ke operator saya?

Bagaimana Anda menjawab pertanyaan itu, dan kriteria untuk memperingatkan, menentukan bagaimana Anda akan menggunakan platform pemantauan.

Mengevaluasi sinyal pemantauan yang diperlukan

Baik Anda menyebarkan beban kerja baru dengan solusi pemantauan baru, atau bermigrasi dari platform pemantauan yang ada atau serangkaian alat pemantauan, mengevaluasi sinyal pemantauan yang diperlukan sangat penting. Merancang sinyal yang diperlukan dengan hati-hati membantu mendorong hasil yang diharapkan dan mengurangi kebisingan.

Pertimbangkan hal berikut:

  • Dapat ditindak: Ingat, data pemantauan perlu ditindak untuk mengurangi kebisingan dan positif palsu.
  • Dioptimalkan: Optimalkan data yang dikumpulkan untuk memberi Anda tampilan holistik tentang kesehatan keseluruhan layanan.
  • Instrumentasi insiden: Instrumentasi yang didefinisikan untuk mengidentifikasi insiden aktual harus sesering mungkin, dapat diprediksi, dan dapat diandalkan.

Mengembangkan konfigurasi pemantauan

Biasanya, pemilik layanan pemantauan dan tim mereka mematuhi serangkaian aktivitas standar untuk membuat konfigurasi pemantauan. Kegiatan ini mencakup tahap perencanaan, pengujian dan validasi di lingkungan nonproduksi, dan penyebaran ke dalam produksi.

Untuk mengembangkan konfigurasi pemantauan, tim menarik mode kegagalan yang diketahui, hasil pengujian dari kegagalan yang disimulasikan, dan pengalaman berbagai individu dalam organisasi, seperti meja layanan, personel operasi, insinyur, dan pengembang.

Konfigurasi ini dirancang berdasarkan asumsi bahwa layanan sudah ada, sedang menjalani migrasi ke cloud, dan belum direstrukturisasi. Untuk memastikan bahwa hasil kualitas tingkat layanan tercapai, memantau kesehatan dan ketersediaan layanan ini di awal proses pengembangan sangat penting. Jika memantau layanan atau desain aplikasi hanya dianggap sebagai setelahnya, hasilnya cenderung kurang berhasil.

Untuk mendorong resolusi insiden lebih cepat, pertimbangkan rekomendasi berikut:

  • Dasbor komponen individual: Tentukan dasbor untuk setiap komponen layanan untuk membantu mengidentifikasi masalah yang diketahui dengan cepat di area tertentu dari aplikasi dan infrastruktur Anda.

  • Gunakan metrik: Gunakan sinyal metrik yang dibangun ke dalam berbagai komponen untuk membantu mendiagnosis dan mengidentifikasi resolusi atau solusi jika Anda tidak dapat mengidentifikasi akar penyebabnya.

  • Aktifkan kustomisasi dasbor: Desain dasbor Anda sehingga Anda dapat dengan mudah menelusuri data dari dasbor pemantauan. Pastikan Anda mendukung penyesuaian tampilan secara dinamis, memungkinkan pemfilteran dan pemecahan masalah yang mudah.

Merangkul serangkaian prinsip panduan ini dapat membantu memberi Anda wawasan mendekati real-time dan manajemen layanan Anda yang lebih baik.

Langkah berikutnya