نظرة عامة على استمرارية الأعمال مع قاعدة بيانات Azure ل PostgreSQL - خادم مرن

تشير استمرارية الأعمال في قاعدة بيانات Azure ل PostgreSQL - الخادم المرن إلى الآليات والسياسات والإجراءات التي تمكن شركتك من مواصلة العمل في مواجهة الاضطرابات، وخاصة البنية التحتية للحوسبة. في معظم الحالات ، سيتعامل الخادم المرن مع الأحداث التخريبية التي قد تحدث في البيئة السحابية ويحافظ على تشغيل تطبيقاتك وعملياتك التجارية. ومع ذلك ، هناك بعض الأحداث التي لا يمكن التعامل معها تلقائيا مثل:

  • يقوم المستخدم بحذف صف أو تحديثه في جدول عن طريق الخطأ.
  • يتسبب الزلزال في انقطاع التيار الكهربائي ويعطل مؤقتا مركز بيانات أو منطقة توافر الخدمات.
  • يلزم تصحيح قاعدة البيانات لإصلاح خطأ أو مشكلة أمنية.

يوفر الخادم المرن ميزات تحمي البيانات وتخفف من وقت التوقف عن العمل لقواعد البيانات المهمة الخاصة بك في حالة حدوث أحداث توقف مخططة وغير مخطط لها. تم بناء الخادم المرن على رأس البنية الأساسية ل Azure التي توفر بالفعل مرونة وتوافرا قويين ، ويحتوي على ميزات استمرارية الأعمال التي توفر حماية إضافية من الأخطاء ، وتعالج متطلبات وقت الاسترداد ، وتقلل من التعرض لفقدان البيانات. أثناء تصميم تطبيقاتك ، يجب أن تفكر في التسامح مع وقت التوقف عن العمل - وهو هدف وقت الاسترداد (RTO) والتعرض لفقدان البيانات - وهو هدف نقطة الاسترداد (RPO). على سبيل المثال، تتطلب قاعدة بيانات الأعمال المهمة متطلبات وقت تشغيل أكثر صرامة مقارنة بقاعدة بيانات الاختبار.

يوضح الجدول أدناه الميزات التي يوفرها الخادم المرن.

الميزة الوصف ⁩الاعتبارات⁧
النسخ الاحتياطي التلقائي: يقوم الخادم المرن تلقائيا بإجراء نسخ احتياطية يومية من ملفات قاعدة البيانات الخاصة بك ويقوم بعمل نسخة احتياطية باستمرار من سجلات المعاملات. يمكن الاحتفاظ بالنسخ الاحتياطية من 7 أيام حتى 35 يوما. ستتمكن من استعادة خادم قاعدة البيانات الخاص بك إلى أي وقت خلال فترة الاحتفاظ بالنسخ الاحتياطي. يعتمد RTO على حجم البيانات لاستعادة + الوقت اللازم لإجراء استرداد السجل. يمكن أن يكون من بضع دقائق حتى 12 ساعة. لمزيد من التفاصيل، راجع المفاهيم - النسخ الاحتياطي والاستعادة. تبقى بيانات النسخ الاحتياطي داخل المنطقة.
توفر مرتفع متكرر في المنطقة يمكن نشر الخادم المرن باستخدام تكوين التوفر العالي (HA) المتكرر للمنطقة حيث يتم نشر الخوادم الأساسية والخادمة في منطقتي توافر خدمات مختلفتين داخل المنطقة. يحمي تكوين HA هذا قواعد البيانات الخاصة بك من حالات الفشل على مستوى المنطقة ويساعد أيضا في تقليل وقت تعطل التطبيق أثناء أحداث التوقف المخطط لها وغير المخطط لها. يتم نسخ البيانات من الخادم الأساسي إلى النسخة المتماثلة في وضع الاستعداد في الوضع المتزامن. في حالة حدوث أي انقطاع في الخادم الأساسي ، يتم فشل الخادم تلقائيا في النسخة المتماثلة في وضع الاستعداد. من المتوقع أن يكون RTO في معظم الحالات أقل من 120s. من المتوقع أن يكون RPO صفرا (لا يوجد فقدان للبيانات). لمزيد من المعلومات، راجع المفاهيم - التوافر العالي. مدعوم في طبقات الحوسبة المحسنة للأغراض العامة والذاكرة. متوفر فقط في المناطق التي تتوفر فيها مناطق متعددة.
الأقراص المدارة Premium يتم تخزين ملفات قاعدة البيانات في وحدة تخزين متينة للغاية وموثوقة ومدارة بشكل ممتاز. يوفر هذا تكرار البيانات مع ثلاث نسخ من النسخة المتماثلة المخزنة داخل منطقة توافر الخدمات مع إمكانات استعادة البيانات تلقائيا. لمزيد من المعلومات، راجع وثائق الأقراص المدارة. البيانات المخزنة داخل منطقة توافر الخدمات.
منطقة النسخ الاحتياطي الزائدة عن الحاجة يتم تخزين النسخ الاحتياطية المرنة للخادم تلقائيا وبشكل آمن في منطقة تخزين زائدة عن الحاجة داخل المنطقة. أثناء فشل على مستوى المنطقة حيث يتم توفير الخادم الخاص بك، وإذا لم يتم تكوين الخادم الخاص بك مع تكرار المنطقة، فلا يزال بإمكانك استعادة قاعدة البيانات الخاصة بك باستخدام أحدث نقطة استعادة في منطقة مختلفة. لمزيد من المعلومات، راجع المفاهيم - النسخ الاحتياطي والاستعادة. ينطبق فقط في المناطق التي تتوفر فيها مناطق متعددة.
النسخ الاحتياطي الجغرافي الزائد يتم نسخ النسخ الاحتياطية المرنة للخادم إلى منطقة بعيدة. التي تساعد في حالة التعافي من الكوارث في حالة تعطل منطقة الخادم الأساسي. يتم تمكين هذه الميزة حاليا في مناطق محددة. يستغرق RTO أطول و RPO أعلى اعتمادا على حجم البيانات لاستعادة ومقدار الاسترداد لأداء.

أحداث التوقف عن العمل المخطط لها

فيما يلي بعض سيناريوهات الصيانة المخطط لها. عادة ما تتكبد هذه الأحداث ما يصل إلى بضع دقائق من التوقف عن العمل ، ودون فقدان البيانات.

السيناريو عملية
قياس الحوسبة (بمبادرة من المستخدم) أثناء عملية توسيع نطاق الحوسبة ، يسمح لنقاط التفتيش النشطة بالإكمال ، ويتم استنزاف اتصالات العميل ، ويتم إلغاء أي معاملات غير ملتزمة ، ويتم فصل التخزين ، ثم يتم إيقاف تشغيله. يتم توفير خادم مرن جديد بنفس اسم خادم قاعدة البيانات مع تكوين الحوسبة المقاسة. ثم يتم إرفاق التخزين بالخادم الجديد ويتم بدء تشغيل قاعدة البيانات التي تقوم بالاسترداد إذا لزم الأمر قبل قبول اتصالات العميل.
زيادة مساحة التخزين (بمبادرة من المستخدم) عند بدء عملية تخزين موسعة، يسمح لنقاط التفتيش النشطة بالإكمال، ويتم استنزاف اتصالات العميل، ويتم إلغاء أي معاملات غير ملتزم بها، ثم يتم إيقاف تشغيلها. يتم تحجيم التخزين إلى الحجم المطلوب ثم يتم توصيله بالخادم الجديد. يتم إجراء استرداد إذا لزم الأمر قبل قبول اتصالات العميل. لاحظ أن تقليل حجم التخزين غير مدعوم.
نشر البرامج الجديدة (Azure-startd) يحدث طرح الميزات الجديدة أو إصلاحات الأخطاء تلقائيا كجزء من الصيانة المخطط لها للخدمة، ويمكنك جدولة وقت حدوث هذه الأنشطة. لمزيد من المعلومات، راجع البوابة الإلكترونية.
ترقيات الإصدارات الثانوية (Azure-startd) تقوم قاعدة بيانات Azure ل PostgreSQL تلقائيا بتصحيح خوادم قاعدة البيانات إلى الإصدار الثانوي الذي يحدده Azure. يحدث ذلك كجزء من الصيانة المخطط لها للخدمة. يتم إعادة تشغيل خادم قاعدة البيانات تلقائيا باستخدام الإصدار الثانوي الجديد. لمزيد من المعلومات، انظر الوثائق. يمكنك أيضا التحقق من البوابة الإلكترونية.

عندما يتم تكوين الخادم المرن مع توفر عالي زائد عن الحاجة في المنطقة، يقوم الخادم المرن بتنفيذ عمليات القياس والصيانة على خادم الاستعداد أولا. لمزيد من المعلومات، راجع المفاهيم - التوافر العالي.

تخفيف وقت التوقف عن العمل غير المخطط له

يمكن أن تحدث أوقات التوقف غير المخطط لها نتيجة للاضطرابات غير المتوقعة مثل خطأ الأجهزة الأساسي ومشكلات الشبكات وأخطاء البرامج. إذا تعطل خادم قاعدة البيانات الذي تم تكوينه مع توفر عال بشكل غير متوقع ، تنشيط النسخة المتماثلة في وضع الاستعداد ويمكن للعملاء استئناف عملياتهم. إذا لم يتم تكوينه مع توفر عال (HA)، ثم إذا فشلت محاولة إعادة التشغيل، يتم توفير خادم قاعدة بيانات جديد تلقائيا. على الرغم من أنه لا يمكن تجنب وقت التوقف غير المخطط له ، إلا أن الخادم المرن يساعد في تخفيف وقت التوقف عن العمل من خلال إجراء عمليات الاسترداد تلقائيا دون الحاجة إلى تدخل بشري.

وقت التوقف غير المخطط له: سيناريوهات الفشل واسترداد الخدمة

فيما يلي بعض سيناريوهات الفشل غير المخطط لها وعملية الاسترداد.

السيناريو عملية الاسترداد
[الخوادم التي تم تكوينها بدون HA زائدة عن الحاجة في المنطقة]
عملية الاسترداد
[الخوادم التي تم تكوينها باستخدام HA الزائدة عن الحاجة للمنطقة]
فشل في خادم قاعدة البيانات إذا كان خادم قاعدة البيانات معطلا، فسيحاول Azure إعادة تشغيل خادم قاعدة البيانات. إذا فشل ذلك، سيتم إعادة تشغيل خادم قاعدة البيانات على عقدة فعلية أخرى.

يعتمد وقت الاسترداد (RTO) على عوامل مختلفة بما في ذلك النشاط في وقت الخطأ مثل المعاملة الكبيرة وحجم الاسترداد الذي سيتم إجراؤه أثناء عملية بدء تشغيل خادم قاعدة البيانات.

يجب إنشاء التطبيقات التي تستخدم قواعد بيانات PostgreSQL بطريقة تكتشف وتعيد محاولة الاتصالات التي تم إسقاطها والمعاملات الفاشلة.
إذا تم الكشف عن فشل خادم قاعدة البيانات، يتم فشل الخادم إلى خادم الاستعداد، وبالتالي تقليل وقت التوقف. لمزيد من المعلومات، راجع صفحة مفاهيم HA. من المتوقع أن يكون RTO 60-120s ، مع عدم فقدان البيانات.
فشل في التخزين لا ترى التطبيقات أي تأثير لأي مشكلات متعلقة بالتخزين مثل فشل القرص أو تلف الكتلة الفعلية. نظرا لأن البيانات مخزنة في ثلاث نسخ ، يتم تقديم نسخة البيانات بواسطة التخزين الباقي. يتم إصلاح كتلة البيانات التالفة تلقائيا ويتم إنشاء نسخة جديدة من البيانات تلقائيا. بالنسبة لأي أخطاء نادرة وغير قابلة للاسترداد مثل تعذر الوصول إلى وحدة التخزين بأكملها ، يتم فشل الخادم المرن في النسخ المتماثلة في وضع الاستعداد لتقليل وقت التوقف. لمزيد من المعلومات، راجع صفحة مفاهيم HA.
الأخطاء المنطقية/أخطاء المستخدم للاسترداد من أخطاء المستخدم، مثل الجداول التي تم إسقاطها عن طريق الخطأ أو البيانات المحدثة بشكل غير صحيح، يجب عليك إجراء استرداد نقطة زمنية (PITR). أثناء تنفيذ عملية الاستعادة، يمكنك تحديد نقطة الاستعادة المخصصة، وهو الوقت الذي يسبق حدوث الخطأ مباشرة.

إذا كنت تريد استعادة مجموعة فرعية فقط من قواعد البيانات أو جداول معينة بدلا من كافة قواعد البيانات في خادم قاعدة البيانات، فيمكنك استعادة خادم قاعدة البيانات في مثيل جديد، وتصدير الجدول (الجداول) عبر pg_dump، ثم استخدام pg_restore لاستعادة هذه الجداول إلى قاعدة البيانات الخاصة بك.
لا تتم حماية أخطاء المستخدم هذه مع توفر عال حيث يتم نسخ جميع التغييرات إلى النسخة المتماثلة في وضع الاستعداد بشكل متزامن. يجب عليك إجراء استعادة في الوقت المناسب للتعافي من مثل هذه الأخطاء.
فشل منطقة توافر الخدمات للاسترداد من فشل على مستوى المنطقة، يمكنك إجراء استعادة نقطة في الوقت المناسب باستخدام النسخة الاحتياطية واختيار نقطة استعادة مخصصة مع آخر وقت لاستعادة أحدث البيانات. سيتم نشر خادم مرن جديد في منطقة أخرى غير متأثرة. يعتمد الوقت المستغرق للاستعادة على النسخة الاحتياطية السابقة وحجم سجلات المعاملات المراد استردادها. يتم فشل الخادم المرن تلقائيا في خادم الاستعداد خلال 60-120s دون فقدان البيانات. لمزيد من المعلومات، راجع صفحة مفاهيم HA.
فشل المنطقة إذا تم تكوين الخادم الخاص بك باستخدام نسخة احتياطية جغرافية زائدة عن الحاجة، فيمكنك إجراء استعادة جغرافية في المنطقة المقترنة. سيتم توفير خادم جديد واسترداده إلى آخر البيانات المتاحة التي تم نسخها إلى هذه المنطقة. نفس العملية.

هام

لا يمكن استعادة الخوادم المحذوفة. إذا قمت بحذف الملقم، يتم أيضا حذف كافة قواعد البيانات التي تنتمي إلى الخادم ولا يمكن استردادها. استخدم قفل موارد Azure للمساعدة في منع الحذف غير المقصود للخادم.

الخطوات التالية