Güvenilirlik
Bir sağlık kuruluşu için klinik sistem çalıştırdığınızı düşünün. Doktorların ve hasta bakıcıların çalışmama süresine yönelik dayanıklılığı azdır. Sürekli olarak en kaliteli hizmeti sağlamaları için klinik BT sistemlerine gece gündüz erişebilmeleri gerekir.
Doktorların taleplerini gün boyunca karşılamak için, uygulamaların hataları kullanıcılara mümkün olan en az etkiyle çözümlemeleri gereklidir. Hem yerel olaylar hem de büyük ölçekli felaketlere karşı uygulamalarının çalışmaya devam etmesini nasıl sağlıyorlar?
Bu ünitede, güvenilirlik yapı taşındaki öğeleri mimari tasarımınıza eklemeyi öğreneceksiniz.
Güvenilirlik nedir?
Karmaşık bir uygulamada, herhangi bir ölçekte pek çok sayıda şey yanlış gidebilir. Bireysel sunucular ve sabit sürücüler arızalanabilir. Bir dağıtım sorunu istemeden bir veritabanındaki tüm tabloları bırakabilir. Veri merkezlerinin tamamı ulaşılamaz hale gelebilir. Bir fidye yazılımı olayı tüm verilerinizi zararlı bir şekilde şifreleyebilir. Uygulamanızın güvenilir durumda kalması ve hem yerel hem de kapsamlı etkiye sahip olayların üstesinden gelebilmesi oldukça önemlidir.
Güvenilirlik için tasarlamada kısmi ağ kesintileri gibi küçük ölçekli, olaylar ve geçici koşullar sırasında çalışma süresini sürdürme yer alır. Uygulamanızın yerel arızaların üstesinden gelmesini, yüksek kullanılabilirliği bir uygulamanın her bir bileşenine tümleştirerek ve tek hata noktalarını ortadan kaldırarak sağlayabilirsiniz. Böyle bir tasarım ayrıca altyapı bakımının etkisini en aza indirir. Yüksek kullanılabilirlik sağlayan tasarımlar, olayların etkisinin hızlıca ve otomatik olarak ortadan kaldırılmasını ve sistemin neredeyse hiç etkilenmeden istekleri işlemeye devam etmesinin sağlanmasını hedefler.
Güvenilirliğe yönelik tasarlama, veri kaybı ve büyük ölçekli felaketler sırasında kurtarmaya odaklanır. Bu olay türlerinden kurtarmak için genellikle etkin müdahale gerekir, ancak otomatik kurtarma adımları kurtarma için gerekli olan süreyi azaltabilir. Bu tür olaylar bir miktar çalışmama süresi veya kalıcı veri kaybı ile sonuçlanabilir. Olağanüstü durum kurtarması dikkatli planlama olduğu kadar yürütmeyle de ilgilidir.
Yüksek kullanılabilirliği ve kurtarılabilirliği mimarinizin tasarımına dahil etmek, işletmenizi çalışmama süresi veya kayıp verilerin neden olduğu mali kayıplardan korur. Saygınlığınızın, müşterilerin güven kaybı ile olumsuz bir şekilde etkilenmemesini sağlar.
Güvenilirlik için mimari oluşturma, uygulamanızın müşterilerinize karşı gerçekleştirdiğiniz taahhütleri karşılayabilmesini sağlar. Bu, sistemlerinizin son kullanıcılar tarafından kullanılabilir olmasını ve hatalardan kurtarılmasını sağlamayı içerir.
Yüksek oranda kullanılabilir mimari oluşturma
Kullanılabilirlik için taahhütte bulunduğunuz hizmet düzeyi sözleşmesini (SLA) tanımlayın. Uygulamanızın SLA’nıza ilişkin olası yüksek kullanılabilirlik özelliklerini inceleyin ve nerede düzgün bir kapsamınızın olduğunu ve nerede iyileştirmeler yapmanız gerektiğini tanımlayın. Hedefiniz, kesinti yaşama ihtimalinizin daha az olması için mimari bileşenlerine yedeklilik eklemektir.
Yüksek kullanılabilirlik tasarımı bileşenlerinin örnekleri arasında kümeleme ve yük dengeleme yer alır:
Kümeleme, tek bir VM’yi eşgüdümlü VM’ler kümesi ile değiştirir. Bir VM arızalandığında veya ulaşılamaz olduğunda hizmetler, istekleri gerçekleştirebilen başka bir hizmete yük devredebilir.
Yük dengeleme, başarısız örnekleri algılayarak ve isteklerin bunlara yönlendirilmesine engel olarak istekleri pek çok hizmet örneği arasında yayar.
Hatadan kurtarabileceğiniz bir mimari oluşturma
Kurtarılabilirlik için olası veri kaybı ve önemli çalışmama süresi senaryolarınızı inceleyen bir analiz gerçekleştirmeniz gerekir. Analiziniz, kurtarma stratejilerinin keşfi ve bunların her birine ilişkin maliyet/fayda dengesini içermelidir. Bu alıştırma, kuruluşunuzun önceliklerine ilişkin önemli bir içgörü sağlar ve uygulamanızın rolünün netleştirilmesine yardımcı olur. Sonuçlar, uygulamanın şu özelliklerini içermelidir:
Kurtarma noktası hedefi (RPO): Kabul edilebilir en uzun veri kaybı süresi. RPO, hacimle değil zaman birimiyle ölçülür. Örneğin, “30 dakikalık veri”, “dört saatlik veri” vb. RPO, veri kaybı konusunda sınırlama ve kurtarma gerçekleştirmeyi hedefler, veri hırsızlığı ile ilgili değildir.
Kurtarma süresi hedefi (RTO): Kabul edilebilir maksimum kesinti süresidir ve burada kesinti süresi gereksinimlerinize göre belirlenir. Örneğin, afet sırasında kabul edilebilir kesinti süresi sekiz saatse RTO’nuz sekiz saattir.
RPO ve RTO’nun tanımlanmasıyla, bu hedeflere ulaşmak için mimarinizde yedekleme, geri yükleme, çoğaltma ve kurtarma özelliklerini tasarlayabilirsiniz.
Tüm bulut sağlayıcıları, uygulamanızın kullanılabilirliği ve kurtarılabilirliğini geliştirmek üzere kullanabileceğiniz birtakım hizmetler ve özellikler sunar. Mümkün olduğunda mevcut hizmetleri ve en iyi uygulamaları kullanın ve kendi uygulamalarınızı oluşturmamaya çalışın.
Sabit sürücüler arızalanabilir, veri merkezleri ulaşılamaz hale gelebilir ve bilgisayar korsanları saldırabilir. Kullanılabilirliği ve kurtarılabilirliği kullanarak müşterileriniz arasındaki saygınlığınızı korumanız önemlidir. Kullanılabilirlik, ağ kesintileri gibi koşullar sırasında çalışma süresini sürdürmeye ve kurtarılabilirlik de bir felaket sonrasında verilerin alınmasına odaklanır.
Bilgilerinizi kontrol edin
Yardıma mı ihtiyacınız var? Sorun giderme kılavuzumuza gözatın veya sorun bildirerek belirli bir konuda geri bildiriminizi paylaşın.