Azure uygulamaları için yedekleme ve olağanüstü durum kurtarma

Olağanüstü durum kurtarma , uygulama işlevselliğini çok zararlı bir kaybı uyandığında geri yükleme işlemidir.

Bulutta, hataların meydana gelebileceğini önliyoruz. Hedef, hataları tamamen önlemeye çalışmak yerine hata veren bir bileşenin etkilerini en aza indirmektir. Test, bu etkileri en aza indirecek bir yoldur. Uygulamalarınızın mümkün olduğu yerlerde test etmeyi otomatikleştirin, ancak başarısız olduklarında hazırlanalmanız gerekir. Bir hata oluştuğunda, yedekleme ve kurtarma stratejilerini önemli hale gelir.

Bir olağanüstü durum sırasında azaltılmış işlevsellik için toleransı, bir uygulamadan sonrakine göre farklılık gösteren bir iş karardır. Bazı uygulamaların kullanılamaz olması veya daha az işlevsellik ya da bir süre gecikirken kısmen kullanılabilmesi kabul edilebilir. Diğer uygulamalar için, azaltılmış işlevler kabul edilemez.

Önemli noktalar

  • Anahtar hatası senaryolarını kullanarak düzenli olarak bir olağanüstü durum kurtarma planı oluşturun ve test edin.
  • Daha az işlevselliğe sahip birçok uygulamayı çalıştırmak için olağanüstü durum kurtarma stratejisi tasarlayın.
  • İş gereksinimlerine ve uygulamanın koşullara uygun bir yedekleme stratejisi tasarlayın.
  • Yük devretme ve yeniden çalışma adımlarını ve süreçlerini otomatikleştirin.
  • Yük devretme ve yeniden çalışma yaklaşımını en az bir kez başarıyla test edin ve doğrulayın.

Olağanüstü durum kurtarma planı

Bir kurtarma planı oluşturarak başlayın. Plan tamamen sınandıktan sonra tamamlanmış olarak kabul edilir. Müşterileriniz için tanımladığınız hizmet düzeyi sözleşmesi (SLA) içinde işlevselliği geri yüklemek için gereken kişileri, süreçlerini ve uygulamaları ekleyin.

Olağanüstü durum kurtarma planınızı oluştururken ve test ederken aşağıdaki önerileri göz önünde bulundurun:

  • Destek ile iletişim kurma sürecini ve diğer sorunları da içerir. Bu bilgiler, kurtarma işlemini ilk kez çalışırken uzun süre kapalı kalma süresini önlemeye yardımcı olur.
  • Uygulama hatalarının iş etkisini değerlendirin.
  • Görev açısından kritik uygulamalar için bir çapraz bölge kurtarma mimarisi seçin.
  • Otomasyon ve test dahil olmak üzere olağanüstü durum kurtarma planının belirli bir sahibini belirler.
  • İşlemi, özellikle el ile yapılan adımları belgeleyin.
  • İşlemi mümkün olduğunca otomatikleştirin.
  • Tüm başvuru ve işlem verileri için bir yedekleme stratejisi oluşturun ve yedekleme geri yüklemesini düzenli olarak test edin.
  • Uygulamanız tarafından kullanılan Azure hizmetlerinin yığınına yönelik uyarıları ayarlayın.
  • Planı yürütmek için operasyon personelini eğitme.
  • Planı doğrulamak ve geliştirmek için düzenli olağanüstü durum benzetimleri gerçekleştirin.

Sanal makineleri (VM 'Ler) çoğaltmak için Azure Site Recovery kullanıyorsanız, tüm uygulamanın yükünü devretmek için tam bir otomatik kurtarma planı oluşturun.

İşlemsel hazırlık testi

İkincil bölgeye yük devretme ve birincil bölgeye yeniden çalışma için işlemsel hazırlık testi gerçekleştirin. Birçok Azure hizmeti kurtarma tatbikatları için el ile yük devretmeyi veya test için yük devretmeyi destekler. Bunun yerine, Azure hizmetlerini kapatarak veya kaldırarak bir kesinti benzetimi yapabilirsiniz.

İşlem verimliliğini sağlamak için otomatik işlemsel yanıtlar, normal uygulama yaşam döngüsünün bir parçası olarak sıklıkla test edilmelidir.

Yük devretme ve yeniden çalışma testi

Uygulamanızın bağımlı hizmetlerinin olağanüstü durum kurtarma sırasında eşitlenmiş bir şekilde geri gelip gelmediğini doğrulamak için yük devretme ve yeniden çalışma testi yapın. Sistemlerdeki ve işlemlerdeki değişiklikler yük devretme ve yeniden çalışma işlevlerini etkileyebilir, ancak ana sistem başarısız olana veya aşırı yüklenmiş hale gelene kadar etki algılanmayabilir. Canlı bir sorun için telafi gerekmeden önce yük devretme yeteneklerini test edin. Ayrıca, bağımlı hizmetlerin yük devretmesinin ve yeniden çalışmasının doğru sırada olduğundan emin olun.

VM 'Leri çoğaltmak için Azure Site Recovery kullanıyorsanız çoğaltma stratejinizi doğrulamak için yük devretme sınamasını gerçekleştirerek, olağanüstü durum kurtarma 'yı düzenli aralıklarla çalıştırın. Yük devretme testi, devam eden VM çoğaltmasını veya üretim ortamınızı etkilemez. Daha fazla bilgi için bkz. Azure 'da olağanüstü durum kurtarma ayrıntısı çalıştırma.

Bağımlı hizmet kesintisi

Her bağımlı hizmet için, hizmet kesintisini ve uygulamanın yanıt verme şeklini anlamanız gerekir. Birçok hizmet esneklik ve kullanılabilirliği destekleyen özellikler içerir, bu nedenle her hizmeti bağımsız olarak değerlendirmek olağanüstü durum kurtarma planınızı geliştirir. Örneğin, Azure Event Hubs ikincil ad alanına yük devretmesini destekler.

Ağ kesintisi

Azure ağının bölümlerine erişilemediğinde, uygulamanıza veya verilerinize erişemeyebilirsiniz. Bu durumda, daha az işlevselliğe sahip birçok uygulamayı çalıştırmak için olağanüstü durum kurtarma stratejisi tasarlamayı öneririz.

İşlevselliği azaltmak bir seçenek değilse, geri kalan seçenekler uygulama kapalı kalma süresi veya alternatif bir bölgeye yük devretme olur.

Azaltılmış işlevsellik senaryosunda:

  • Azure ağ kesintisi nedeniyle uygulamanız verilerine erişemediyse, önbelleğe alınmış verileri kullanarak azaltılmış uygulama işlevselliğiyle yerel olarak çalıştırabilirsiniz.
  • Bağlantı geri yüklenene kadar verileri alternatif bir konuma kaydedebilirsiniz.

Kurtarma otomasyonu

Uygulamanın hata durumlarında ikincil bir Azure bölgesine kurtarılması veya yük devretilmesi için gereken adımlar, koşulların etkili bir şekilde kesintiye neden olacak şekilde kesintiye yanıt vermesini sağlamak için, tercihen otomatik bir şekilde bir arada olmalıdır. Ayrıca, bir yük devretme tetikleme sorunu giderildikten sonra uygulamayı birincil bölgeye yeniden uygulamak için gereken işlemi yakalamak için de benzer bir adım vardır.

Yük devretme yordamlarını otomatikleştirmede, yük devretmeyi düzenlemek için kullanılan araç, yük devretme stratejisinde de göz önünde bulundurulmaya dikkat edin. Örneğin, yük devretmesini bir VM üzerinde çalışan Jenkins 'den çalıştırırsanız, sanal makinenin kesintiden bir parçası olup olmadığı konusunda sorun yaşayabilirsiniz. Azure DevOps projeler bir bölgeye göre kapsamlandırılır.

Yedekleme stratejisi

Bölgeler arasında dağıtılmış işlem uygulamak için pek çok alternatif strateji vardır. Bu stratejiler, uygulamanın belirli iş gereksinimlerine ve koşullara göre uyarlanmalıdır. Yüksek düzeyde, yaklaşımlar aşağıdaki kategorilere ayrılabilir:

  • Olağanüstüduruma yeniden dağıtma: Bu yaklaşımda, uygulama olağanüstü durum sırasında sıfırdan yeniden dağıtılır. Sıfırdan yeniden dağıtım, garantili bir kurtarma süresi gerektirmeyen kritik olmayan uygulamalar için uygundur.

  • Sıcak yedek (etkin/Pasif): ikincil bir barındırılan hizmeti alternatif bir bölgede oluşturun ve minimum kapasiteyi güvence altına almak için roller dağıtın. Ancak, roller üretim trafiği almaz. Bu yaklaşım, trafiği bölgeler arasında dağıtmak üzere tasarlanmamış uygulamalar için yararlıdır.

  • Etkin yedek (etkin/etkin): uygulama, birden çok bölgede üretim yükünü alacak şekilde tasarlanmıştır. Her bölgedeki bulut Hizmetleri, olağanüstü durum kurtarma amacıyla gerekenden daha yüksek kapasite için yapılandırılmış olabilir. Bunun yerine, bulut Hizmetleri, olağanüstü durum ve yük devretme sırasında gerektiği şekilde ölçeklenebilir. Bu yaklaşım, uygulama tasarımında büyük bir yatırım gerektirir, ancak önemli avantajlara sahiptir. Bunlar arasında düşük ve garantili kurtarma zamanı, tüm kurtarma konumlarının sürekli testi ve kapasitenin etkili kullanımı dahildir.

Bölgesel hatalara yönelik plan

Azure fiziksel olarak ve bölgeler adlı birimlere mantıksal olarak bölünür. Bir bölge, bir veya daha fazla veri merkezinden yakın yakınlardan oluşur. Birçok bölge ve hizmet, tek bir veri merkezinde kesintiler için daha fazla esneklik sağlamak üzere kullanılabilen kullanılabilirlik bölgelerinide destekler. Çözümünüzün kullanılabilirliğini geliştirmek için, kullanılabilirlik alanları olan bölgeleri kullanmayı göz önünde bulundurun.

Nadir koşullarda, bir kullanılabilirlik alanı veya bölgesindeki tesislerin, ağ arızalarına göre erişilemez hale gelebilmesi olasıdır. Ya da tesisler, örneğin doğal bir olağanüstü durum nedeniyle tamamen kaybedilebilir. Azure 'da bölgeler ve bölgeler arasında dağıtılan uygulamalar oluşturmaya yönelik yetenekler vardır. Bu dağıtım, bir bölgedeki veya bölgedeki bir başarısızlığın diğer bölgeleri veya bölgeleri etkileyebilecek olasılığını en aza indirmenize yardımcı olur.

Sonraki adım

Ana makaleye geri dönün: test etme