Azure uygulamaları için yedekleme ve olağanüstü durum kurtarma

Olağanüstü durum kurtarma, yıkıcı bir kaybın ardından uygulama işlevselliğini geri yükleme işlemidir.

Bulutta hataların yaşanacak olduğunu açık bir şekilde kabul etmek gerekir. Hedef, hataları tamamen önlemeye çalışmak yerine hata veren bir bileşenin etkilerini en aza indirmektir. Bu etkileri en aza indirmenin bir yolu test etmektir. Uygulamalarınızı mümkün olduğunca test etme işlemini otomatikleştirin, ancak başarısız olduğunda hazırlıklı olun. Bir hata olduğunda yedekleme ve kurtarma stratejilerinin olması önemli hale gelir.

Olağanüstü durum sırasında daha az işleve dayanıklılığınız, bir uygulamanın bir sonrakine göre değişiklik gösterdiklerinden iş kararıdır. Bazı uygulamaların kullanılamaz olması veya işlevselliğin azalması ya da bir süre gecikmeli işleme ile kısmen kullanılabilir olması kabul edilebilir. Diğer uygulamalar için tüm azaltılmış işlevler kabul edilemez.

Önemli noktalar

  • Önemli hata senaryolarını kullanarak düzenli olarak bir olağanüstü durum kurtarma planı oluşturun ve test etmek.
  • İşlevselliği azaltılmış uygulamaların çoğunu çalıştırmak için olağanüstü durum kurtarma stratejisi tasarla.
  • Uygulamanın iş gereksinimlerine ve koşullarına göre uyarlanmış bir yedekleme stratejisi tasarlar.
  • Yük devretme ve yeniden çalışma adımlarını ve işlemlerini otomatikleştirin.
  • Yük devretme ve yeniden çalışma yaklaşımını en az bir kez başarıyla test etmek ve doğrulamak.

Olağanüstü durum kurtarma planı

Başlangıç olarak bir kurtarma planı oluşturma. Plan tamamen test edildikten sonra tamamlandı olarak kabul edilir. Müşterileriniz için tanımlandığı hizmet düzeyi sözleşmesi (SLA) kapsamında işlevselliği geri yüklemek için gereken kişi, süreç ve uygulamaları dahil etmek.

Olağanüstü durum kurtarma planınızı oluştururken ve test etmek için aşağıdaki önerileri göz önünde bulundurabilirsiniz:

  • Destekle iletişim kurma ve sorunları yükseltme sürecini dahil etmek. Kurtarma işlemini ilk kez tamamlarken bu bilgiler uzun süreli kapalı kalma sürelerini önlemeye yardımcı olur.
  • Uygulama hatalarının iş etkisini değerlendirin.
  • Görev açısından kritik uygulamalar için bir bölgeler arası kurtarma mimarisi seçin.
  • Otomasyon ve test dahil olmak üzere olağanüstü durum kurtarma planının belirli bir sahibini belirleme.
  • Süreci, özellikle de el ile yapılan tüm adımları belgeye ekleyin.
  • Süreci mümkün olduğunca otomatikleştirin.
  • Tüm başvuru ve işlem verileri için bir yedekleme stratejisi kurma ve yedekleme geri yüklemesini düzenli olarak test et.
  • Uygulamanız tarafından tüketilen Azure hizmetlerinin yığını için uyarılar ayarlayın.
  • Operasyon personelini planı yürütmesi için eğitin.
  • Planı doğrulamak ve geliştirmek için düzenli olağanüstü durum simülasyonları gerçekleştirin.

Sanal makineleri (VM Azure Site Recovery çoğaltmak için sanal makine kullanıyorsanız, uygulamanın tamamına yük devretmek için tam otomatik bir kurtarma planı oluşturun.

operasyonel hazır olma testi

İkincil bölgeye yük devretme ve birincil bölgeye yeniden çalışma için bir operasyonel hazırlık testi gerçekleştirin. Birçok Azure hizmeti kurtarma tatbikatları için el ile yük devretmeyi veya test için yük devretmeyi destekler. Bunun yerine, Azure hizmetlerini kapatarak veya kaldırarak bir kesintinin benzetimini sabilirsiniz.

İşletimsel etkinliği sağlamak için otomatik işlem yanıtları normal uygulama yaşam döngüsünün bir parçası olarak sık sık test edilir.

Yük devretme ve yeniden çalışma testi

Olağanüstü durum kurtarma sırasında uygulamanıza bağımlı hizmetlerin eşitlenmiş bir şekilde geri yük devretme ve yeniden çalışma testi yapma. Sistemlerde ve işlemlerde yapılan değişiklikler yük devretme ve yeniden çalışma işlevlerini etkileyebilir, ancak ana sistem başarısız olana veya aşırı yüke dönüşene kadar etki algılanmaz. Yük devretme testi özellikleri, canlı bir sorunu telafi etmek için gerekli olmadan önce. Ayrıca bağımlı hizmetlerin yük devretme ve yeniden çalışma için doğru sırada olduğundan emin olun.

VM'leri çoğaltmak için Azure Site Recovery kullanıyorsanız, çoğaltma stratejinizi doğrulamak için yük devretmeleri test etmek amacıyla olağanüstü durum kurtarma tatbikatlarını düzenli aralıklarla çalıştırın. Yük devretme testi devam eden VM çoğaltmayı veya üretim ortamınızı etkilemez. Daha fazla bilgi için bkz. Azure'da olağanüstü durum kurtarma tatbikatı çalıştırma.

Bağımlı hizmet kesintisi

Her bağımlı hizmet için, hizmet kesintisi etkilerini ve uygulamanın nasıl yanıt ver gerektiğini anlamanız gerekir. Birçok hizmet, kullanılabilirliği ve kullanılabilirliği destekleyen özellikler içerir. Bu nedenle, her hizmetin bağımsız olarak değerlendirilmesi, olağanüstü durum kurtarma planınızı geliştirme olasılığına sahiptir. Örneğin, Azure Event Hubs ikincil ad alanına teslimi destekler.

Ağ kesintisi

Azure ağının bazı bölümlerine erişilemiyorsa uygulamanıza veya verilerinize erişeyemebilirsiniz. Bu durumda, azaltılmış işlevlere sahip uygulamaların çoğunu çalıştırmak için olağanüstü durum kurtarma stratejisi tasarlamayı öneririz.

İşlevselliği azaltmak bir seçenek değilse, kalan seçenekler uygulama kapalı kalma süresi veya alternatif bir bölgeye yük devretmedir.

Azaltılmış işlevsellik senaryosunda:

  • Azure ağ kesintisi nedeniyle uygulamanız verilerine erişenene kadar önbelleğe alınmış verileri kullanarak daha az uygulama işleviyle yerel olarak çalıştırabilirsiniz.
  • Bağlantı geri yüklenene kadar verileri alternatif bir konumda depoabilirsiniz.

Kurtarma otomasyonu

Hata durumlarında uygulamanın kurtarılması veya ikincil Bir Azure bölgesinde yük devretmesi için gereken adımlar, kesintiye etkiyi sınırlayan bir şekilde etkili bir şekilde yanıt vermek için yeteneklerin mevcut olduğundan emin olmak için tercihen otomatik bir şekilde codified gerekir. Yük devretmeyi tetikleyen bir sorun giderildiktan sonra uygulamanın birincil bölgede yeniden çalışması için gereken işlemi yakalamak için de benzer ortak adımlar mevcut olması gerekir.

Yük devretme yordamlarını otomatik olarak hazırlarken, yük devretmeyi düzenleme için kullanılan aracın da yük devretme stratejisinde dikkate alınmalıdır. Örneğin, bir SANAL makine üzerinde çalışan Jenkins'den yük devretmeyi çalıştırırsanız, bu sanal makine kesintinin bir parçası ise sorun olur. Azure DevOps Projelerin kapsamı da bir bölgeye göredir.

Yedekleme stratejisi

Bölgeler arasında dağıtılmış işlem uygulamak için birçok alternatif strateji mevcuttur. Bu stratejiler, uygulamanın belirli iş gereksinimlerine ve koşullarına göre uyarlanmış olması gerekir. Üst düzeyde yaklaşımlar aşağıdaki kategorilere ayrılabilir:

  • Olağanüstü durumda yeniden dağıt:Bu yaklaşımda uygulama, olağanüstü durum zamanında sıfırdan yeniden dağıtılır. Sıfırdan yeniden uygulama, garantili kurtarma süresi gerektirmeyen kritik olmayan uygulamalar için uygundur.

  • Sıcak Yedek (Etkin/Pasif):Alternatif bir bölgede ikincil bir barındırılan hizmet oluşturun ve minimum kapasiteyi garanti etmek için roller dağıtın. Ancak roller üretim trafiğini almaz. Bu yaklaşım, trafiği bölgeler arasında dağıtmak için tasarlanmamıştı uygulamalar için kullanışlıdır.

  • Etkin Yedek (Etkin/Etkin):Uygulama, üretim yükünü birden çok bölgede alacak şekilde tasarlanmıştır. Her bölgedeki bulut hizmetleri, olağanüstü durum kurtarma amacıyla gerekenden daha yüksek kapasite için yapılandırılmış olabilir. Bunun yerine, olağanüstü durum ve yük devretme zamanında bulut hizmetlerinin ölçeği gerektiğinde uztar. Bu yaklaşım, uygulama tasarımına büyük bir yatırım gerektirir, ancak önemli avantajları vardır. Bunlar arasında düşük ve garantili kurtarma süresi, tüm kurtarma konumlarının sürekli testi ve kapasitenin verimli kullanımı yer almaktadır.

Bölgesel hataları planlama

Azure fiziksel ve mantıksal olarak bölgeler olarak adlandırılan birimlere bölündü. Bir bölge, yakın bir bölgedeki bir veya daha fazla veri merkezi içerir. Birçok bölge ve hizmet, tek birveri merkezinde kesintilere karşı daha fazla koruma sağlamak için kullanılmaktadır. Çözüm kullanılabilirliğini geliştirmek için kullanılabilirlik alanlarıyla bölgeleri kullanmayı göz önünde bulundurabilirsiniz.

Nadir durumlarda, örneğin ağ hataları nedeniyle kullanılabilirlik alanı veya bölgenin tamamına tesisler erişilemez hale gelebilir. Veya doğal afetler gibi özellikler tamamen kaybolabilir. Azure' ın bölgeler ve bölgeler arasında dağıtılmış uygulamalar oluşturma özellikleri vardır. Bu tür bir dağıtım, bir bölgede veya bölgede hatanın diğer bölgeleri veya bölgeleri etkileme olasılığını en aza indirmeye yardımcı olur.

Sonraki adım

Geri dön makaleye bakın: Test