SRE'yi kullanmaya başlama

Tamamlandı

Bu modülün son ünitesinde, SRE'yi incelemek ilginizi çekiyorsa buradan nereye doğru ilerlemek gerektiğine değinmek istiyoruz.

Okuma ve izleme

SRE hakkında daha ayrıntılı bilgi için en iyi kaynak, konuyla ilgili yayımlanan üç kitaplık bir dizidir

  1. Site Reliability Engineering: How Google Runs Production Systems (Site Güvenilirliği Mühendisliği: Google Üretim Sistemlerini Nasıl Çalıştırıyor; "SRE Kitabı" olarak bilinir)
  2. The Site Reliability Workbook: Practical Ways to Implement SRE (Site Güvenilirliği Çalışma Kitabı: SRE'yi Uygulamanın Pratik Yolları; "SRE Çalışma Kitabı" olarak bilinir)
  3. Seeking SRE: Conversations About Running Production Systems at Scale (SRE'yi Amaçlama: Üretim Sistemlerini Uygun Ölçekte Çalıştırma Hakkında Konuşmalar)

(Kısaca açıklayalım; bu modülün birincil yazarı, üçüncü kitabın kuratörü/editörüdür)

Bu kitaplardan her biri önemli bilgiler sağlar:

  • SRE Kitabı - Google'ın yıllardır SRE'yi nasıl uyguladığını ayrıntılı olarak açıklar.

  • SRE Çalışma Kitabı - SRE Kitabı'na eşlik eden ve Google'da ve diğer birkaç yerde SRE'nin yalnızca "ne" olduğunu değil, "nasıl" ve "neden" olduğu da daha ayrıntılı olarak açıklayan bir kitap.

  • SRE'yi Amaçlama - İlk ortaya çıkışının ötesinde SRE dünyasının daha kapsamlı bir görünümünü sağlar ve diğer ortamlarda nasıl uygulandığına ilişkin bilgiler de içerir.

Bu kitapların üçünü de eleştirel bir bakışla okumaya dikkat edin. Bu kitaplarda yazılan her şey siz ve kuruluşunuz için geçerli olmayabilir. Emin olduğunuz bilgilerin olumlu bir değer sağlayabileceğini belirlemek için biraz zaman alın. Kuruluşunuzun kültürü ve değerlerinin hangi yönlerden SRE'nin açıklandığı gibi çalışmasını destekleyebileceği, hangi yönlerden bunun daha güç olacağı konusunu düşünün.

Daha çok görsel bir kişi olduğunuzu fark ederseniz, SREcon14 konferansında Ben Treynor'un SRE'ye Konuşma Anahtarları'nı izlemeyi deneyin. Treynor, SRE'nin (en azından Google bağlamında) ne olduğuna ilişkin cogent bir açıklama sağlar. Bu konferans serisinden ve diğerlerinden SRE ile ilgili kaydedilen diğer konuşmalar da yararlı olabilir.

İlgilenen diğer insanlarla konuşun

SRE konusunda okumak kadar, çoğunlukla da daha önemli olan, meslektaşlarınızla bu konuda konuşmaktır. SRE ile ilgili zorluklarınız, başarılarınız ve başarısızlıklarınız hakkında bir tartışma yapmak, konuyu ayrıntılı bir şekilde anlamak için çok önemli olabilir.

SRE içeriğine sahip birçok toplantı ve konferans vardır. Belki de doğrudan konuyla en ilgili olan, USENIX tarafından küresel olarak dağıtılan SREcon konferansları olabilir (bildirim: bu modülün birincil yazarı SREcon'un kurucularından biridir).

Daha da fazla SRE içeriği Velocity, LISA ve DevOps Days gibi yerel DevOps konferanslarına yol açmaktadır. Bulabildiğiniz her yerde bu içeriği ve konuyla ilgilenen diğer kişileri arayın.

Çalışmada ilk adımlar

SRE'nin bir "tümü veya hiç" teklifi olmadığını unutmamak önemlidir. SRE'yi ortamınıza nasıl getirebileceğinizi keşfetmeye başlamak istiyorsanız, küçük adımlarda SRE ilkelerini ve uygulamalarını benimsemeye başlayabilirsiniz.

Mikey Dickerson, Birleşik Devletler Dijital Hizmet haline gelecek çalışmalarına dayanan iyi bilinen bir SRE'dir. healthcare.gov kurtarmak onların sorumluluğundaydı. Maslow'un ihtiyaç hiyerarşisine uygun bir güvenilirlik hiyerarşisi önerdi. İlk SRE kitabının Uygulamalar bölümünde alıntılanmıştır.

Bu hiyerarşi, önce ortamınızda işlevsel ve güvenilir izleme almanız gerektiğini önerir. İzleme, ortamınız için de SRE'ye yönelik ilk adım olmalıdır. Ölçemediğiniz bir şeyin güvenilir olduğunu (ya da iyiye veya kötüye gittiğini) söyleyemezsiniz.

Güvenebileceğiniz bir izleme platformuna sahip olduktan sonra, bir sonraki ulaşılabilir adım iş yerinde bir hizmet seçmektir. Ardından bu konuda SLI ve SLO konuşmaları yapmaya başlayın. Basit bir başlangıç yapın. Hizmet için SLI ve SLO'ları oluşturun, bunları izleme sisteminize uygulayın ve SRE merceklerini kullanarak güvenilirliğe dikkat etmeye başlayın. Bu adımlar başlamak için harika bir yerdir.