SRE'yi kullanmaya başlama

Tamamlandı

Bu modülün son ünitesinde, SRE'yi incelemek ilginizi çekiyorsa buradan nereye doğru ilerlemek gerektiğine değinmek istiyoruz.

Okuma ve izleme

SRE hakkında daha ayrıntılı bilgi için en iyi kaynak, konuyla ilgili yayımlanan üç kitaplık bir dizidir

  1. Site Reliability Engineering: How Google Runs Production Systems (Site Güvenilirliği Mühendisliği: Google Üretim Sistemlerini Nasıl Çalıştırıyor; "SRE Kitabı" olarak bilinir)
  2. The Site Reliability Workbook: Practical Ways to Implement SRE (Site Güvenilirliği Çalışma Kitabı: SRE'yi Uygulamanın Pratik Yolları; "SRE Çalışma Kitabı" olarak bilinir)
  3. Seeking SRE: Conversations About Running Production Systems at Scale (SRE'yi Amaçlama: Üretim Sistemlerini Uygun Ölçekte Çalıştırma Hakkında Konuşmalar)

(Kısaca açıklayalım; bu modülün birincil yazarı, üçüncü kitabın kuratörü/editörüdür)

Bu kitaplardan her biri önemli bilgiler sağlar:

  • SRE Kitabı - Google'ın yıllardır SRE'yi nasıl uyguladığını ayrıntılı olarak açıklar.

  • SRE Çalışma Kitabı - SRE Kitabı'na eşlik eden ve Google'da ve diğer birkaç yerde SRE'nin yalnızca "ne" olduğunu değil, "nasıl" ve "neden" olduğu da daha ayrıntılı olarak açıklayan bir kitap.

  • SRE'yi Amaçlama - İlk ortaya çıkışının ötesinde SRE dünyasının daha kapsamlı bir görünümünü sağlar ve diğer ortamlarda nasıl uygulandığına ilişkin bilgiler de içerir.

Bu kitapların üçünü de eleştirel bir bakışla okumaya dikkat edin. Bu kitaplarda yazılan her şey size ve kuruluşunuza uygulanamayabilir. Biraz zaman ayırıp sizin için olumlu değer sağlayabilecek bilgileri belirleyin. Kuruluşunuzun kültürü ve değerlerinin hangi yönlerden SRE'nin açıklandığı gibi çalışmasını destekleyebileceği, hangi yönlerden bunun daha güç olacağı konusunu düşünün.

Daha çok görsel öğrenen biri olduğunuzu düşünüyorsanız, SREcon14 konferansında Ben Treynor'u yaptığı Keys to SRE konuşmasını izlemeyi deneyin. Treynor SRE'nin ne olduğu konusundaki inancını (en azından Google bağlamında) gayet ikna edici bir şekilde açıklıyor. Bu konferans serisindeki ve diğerlerindeki kayıtlı SRE konuşmaları da gerçekten yararlı olabilir.

İlgilenen diğer insanlarla konuşun

SRE konusunda okumak kadar, çoğunlukla da daha önemli olan, meslektaşlarınızla bu konuda konuşmaktır. SRE çerçevesinde yaşadığınız güçlükleri, başarılarınızı ve başarısızlıklarınızı konuşmak, konuyla ilgili incelikli bir anlayış elde etme açısından kritik önem taşır.

SRE içeriğinin tanıtıldığı çeşitli toplantılar ve konferanslar vardır. Belki de doğrudan konuyla en ilgili olan, USENIX tarafından küresel olarak dağıtılan SREcon konferansları olabilir (bildirim: bu modülün birincil yazarı SREcon'un kurucularından biridir).

Giderek daha fazla SRE içeriği konferanslara eklenmektedir. Örnek olarak Velocity, LISA ve DevOps Days gibi yerel DevOps konferansları sayılabilir. Bulabildiğiniz her yerde bu içeriği ve konuyla ilgilenen diğer kişileri arayın.

Çalışmada ilk adımlar

SRE'yi ortamınıza taşımanın nasıl bir şey olacağını araştırmaya başlamak istiyorsanız, SRE'nin "hepsi veya hiçbiri" önermesine uymadığını anımsamanız önemlidir. SRE ilkelerini ve uygulamalarını benimsemeye küçük adımlarla başlayabilirsiniz.

Daha sonra United States Digital Service'e (healthcare.gov sitesini kurtarma sorumluluğunu üstlendiler) dönüşen kurumda yaptığı çalışmalarla tanınan SRE Mikey Dickerson, Maslow’un ihtiyaç hiyerarşisine saygı gösterisi niteliğinde güvenilirlik hiyerarşisi kavramını önermişti. İlk SRE kitabının Uygulamalar bölümünde bu alıntı yer alıyor.

Bu hiyerarşide önce ortamınızda işlevsel ve güvenilir bir izleme elde etmeniz öneriliyor. Bu ayrıca ortamınız için SRE'ye yönelmenin de ilk adımı olmalıdır. Ölçemediğiniz bir şeyin güvenilir olduğunu (ya da iyiye veya kötüye gittiğini) söyleyemezsiniz.

Güvenebileceğiniz bir izleme platformuna sahip olduktan sonra, ulaşılabilecek bir sonraki adım, çalışan bir hizmet seçip o hizmetle ilgili SLI ve SLO görüşmeleri yapmaya başlamaktır. Basit başlayın. Hizmet için SLI ve SLO'ları oluşturun, bunları izleme sisteminize uygulayın ve SRE merceklerini kullanarak güvenilirliğe dikkat etmeye başlayın. Burası başlamak için harika bir noktadır.