Memulai dengan SRE

Selesai

Sebagai pelajaran terakhir dalam modul ini, mari kita membahas tentang apa yang harus dilakukan setelah modul ini selesai jika Anda tertarik untuk menjelajahi SRE.

Membaca dan menonton

Untuk informasi lebih detail tentang SRE, sumber terbaik adalah tiga buku yang telah diterbitkan tentang masalah ini

  1. Rekayasa Keandalan Situs: Cara Google Menjalankan Sistem Produksi (dikenal sebagai "Buku SRE")
  2. Buku Kerja Keandalan Situs: Cara Praktis untuk Menerapkan SRE (dikenal sebagai "Buku Kerja SRE")
  3. Mencari SRE: Percakapan Tentang Menjalankan Sistem Produksi dalam Skala Besar

(Sebagai pembukaan singkat, penulis utama modul ini adalah kurator/penyunting buku ketiga)

Masing-masing buku tersebut menyediakan sekumpulan informasi penting:

  • Buku SRE - memberikan penjelasan terperinci tentang bagaimana Google menerapkan SRE selama bertahun-tahun.

  • Buku Kerja SRE - pendamping Buku SRE yang memberikan penjelasan lebih rinci tentang tidak hanya "apa" SRE di Google dan beberapa tempat lain, tetapi "bagaimana" dan "mengapa".

  • Mencari SRE - memberikan tampilan yang lebih luas tentang dunia SRE di luar asalnya termasuk informasi tentang bagaimana hal itu telah diterapkan di lingkungan lain.

Pastikan untuk membaca ketiga buku dengan saksama. Tidak semua yang tertulis dalam buku-buku ini akan berlaku untuk Anda dan organisasi Anda. Luangkan waktu untuk mengidentifikasi informasi yang Anda yakini dapat memberikan beberapa nilai positif. Pikirkan tentang bagian mana dari budaya dan nilai organisasi Anda yang dapat mendukung pekerjaan SRE seperti yang dijelaskan dan yang mungkin membuatnya lebih menantang.

Jika Anda lebih menyukai visual, coba tonton pembicaraan tentang Kunci dari SRE oleh Ben Treynor di konferensi SREcon14. Treynor memberikan penjelasan yang sangat meyakinkan tentang apa yang dia yakini sebagai SRE (setidaknya dalam konteks Google). Rekaman pembicaraan lain tentang SRE dari serial konferensi ini dan lainnya juga dapat menjadi sangat berguna.

Bicaralah dengan orang lain yang tertarik

Sama pentingnya dengan membaca di SRE, sering kali lebih penting untuk membicarakannya dengan rekan-rekan Anda. Mendiskusikan tantangan, keberhasilan, dan kegagalan Anda di sekitar SRE dapat sangat penting untuk mendapatkan pemahaman bernuansa subjek.

Ada sejumlah pertemuan dan konferensi yang menampilkan konten SRE. Mungkin yang paling relevan secara langsung adalah konferensi SREcon yang didistribusikan secara global yang diadakan oleh USENIX (pengelakan: penulis utama modul ini adalah salah satu pendiri SREcon).

Semakin banyak konten SRE yang muncul di konferensi seperti Velocity, LISA, dan konferensi DevOps lokal seperti DevOps Days. Cari konten ini dan orang lain yang tertarik dengan topik ini di mana pun Anda dapat menemukannya.

Langkah pertama yang dikerjakan

Jika Anda ingin mulai menjelajahi bagaimana rasanya menghadirkan SRE ke lingkungan Anda, penting untuk diingat bahwa SRE bukan merupakan proposisi “semua atau tidak sama sekali”. Anda dapat mulai mengadopsi prinsip dan praktik SRE dalam langkah-langkah kecil.

Mikey Dickerson, seorang SRE yang terkenal akan pekerjaannya yang dikenal sebagai United States Digital Service (yang bertanggung jawab untuk menyelamatkan health.gov) telah mengusulkan hierarki keandalan sebagai penghormatan kepada hierarki kebutuhan Maslow. Hal ini dikutip di Bagian praktik dari buku SRE pertama.

Hierarki ini mengusulkan bahwa seseorang harus terlebih dahulu mendapatkan pemantauan di lingkungan Anda yang berfungsi dan dapat dipercaya. Hal ini harus menjadi langkah pertama menuju SRE untuk lingkungan Anda juga. Anda tidak dapat mengetahui apakah sesuatu dapat diandalkan (atau menjadi lebih baik atau lebih buruk) jika Anda tidak dapat mengukurnya.

Setelah Anda memiliki platform pemantauan yang dapat Anda percayai, langkah berikutnya yang dapat dilakukan adalah memilih layanan yang aktif dan mulai melakukan percakapan SLI dan SLO tentang layanan yang aktif. Mulai dengan sederhana. Buat SLI dan SLO untuk layanan, terapkan dalam sistem pemantauan Anda dan lihat apa yang terjadi ketika Anda mulai memperhatikan keandalan menggunakan lensa SRE. Ini adalah tempat yang bagus untuk memulai.