نظرة عامة على استمرارية الأعمال مع قاعدة بيانات Azure SQL & المثيل المدار لـ Azure SQL

ينطبق على:قاعدة بيانات Azure SQL المثيل المدار لـ Azure SQL

تشير استمرارية الأعمال في قاعدة بيانات Azure SQL والمثيل المدار SQL إلى الآليات والنهج والإجراءات التي تمكن نشاطك التجاري من الاستمرار في العمل في مواجهة التعطل، خاصة البنية الأساسية للحوسبة. في معظم الحالات، ستتعامل قاعدة بيانات SQL والمثيل المدار SQL مع أحداث مخلة بالنظام التي قد تحدث في بيئة السحابة والحفاظ على تشغيل التطبيقات والعمليات التجارية. ومع ذلك، هناك بعض الأحداث المخلة بالنظام التي لا يمكن معالجتها بواسطة قاعدة بيانات SQL تلقائيًا مثل:

  • تم حذف المستخدم بطريقة الخطأ أو تحديث صف في جدول.
  • نجح المهاجم الضار في حذف البيانات أو إسقاط قاعدة بيانات.
  • تسبب الزلزال في انقطاع التيار الكهربائي وتعطل مركز البيانات المؤقت.

توضح هذه النظرة العامة القدرات التي توفرها قاعدة بيانات SQL ومثيل مدار SQL لاستمرارية العمل والتعافي من الكوارث. تعرف على الخيارات والتوصيات والبرامج التعليمية للتعافي من أحداث مخلة بالنظام التي قد تتسبب في فقدان البيانات أو تتسبب في عدم توفر قاعدة البيانات والتطبيق. تعرف على ما يجب فعله عندما يؤثر خطأ للمستخدم أو للتطبيق في تكامل البيانات، أو عند وجود انقطاع في منطقة Azure، أو عندما يتطلب التطبيق الصيانة.

ميزات قاعدة بيانات SQL التي يمكنك استخدامها لتوفير استمرارية الأعمال

من منظور قاعدة البيانات، هناك أربعة سيناريوهات رئيسية محتملة للتعطل:

  • فشل الأجهزة أو البرامج المحلية التي تؤثر على عقدة قاعدة البيانات مثل فشل محرك الأقراص.
  • تلف البيانات أو حذفها عادة بسبب خطأ بالتطبيق أو خطأ بشري. عمليات الفشل هذه خاصة بالتطبيق ولا يمكن الكشف عنها عادة بواسطة خدمة قاعدة البيانات.
  • انقطاع مركز البيانات، ربما بسبب كارثة طبيعية. يتطلب هذا السيناريو مستوى معين من التكرار الجغرافي مع تجاوز فشل التطبيق إلى مركز بيانات بديل.
  • أخطاء الترقية أو الصيانة، قد تتطلب المشكلات غير المتوقعة التي تحدث أثناء صيانة البنية الأساسية المخطط لها أو الترقيات العودة السريعة إلى حالة قاعدة بيانات سابقة.

للتخفيف من فشل الأجهزة والبرامج المحلية، تتضمن قاعدة بيانات SQL بنية أساسية ذات توافر عال، والتي تضمن الاسترداد التلقائي من عمليا الفشل هذه مع SLA بتوافر بنسبة 99.995٪.

لحماية أعمالك من فقدان البيانات، تنشئ قاعدة بيانات SQL والمثيل المدار من SQL تلقائيًا النسخ الاحتياطي قاعدة بيانات كاملة أسبوعيًا، والنسخ الاحتياطي لقاعدة بيانات تفاضلية كل 12 ساعة، والنسخ الاحتياطي لسجل المعاملات كل 5-10 دقائق. يتم تخزين النسخ الاحتياطية في محزن RA-GRS لمدة سبعة أيام على الأقل لكافة مستويات الخدمة. كافة مستويات الخدمة باستثناء فترة الاحتفاظ بالنسخ الاحتياطي الأساسية القابلة للتكوين لاسترداد في نقطة زمنية، حتى 35 يومًا.

توفر قاعدة بيانات SQL ومثيل SQL المدار أيضًا العديد من ميزات استمرارية الأعمال التي يمكنك استخدامها للتخفيف من سيناريوهات مختلفة غير مخطط لها.

استرداد قاعدة بيانات داخل نفس منطقة Azure

يمكنك استخدام النسخ الاحتياطية التلقائية لقاعدة البيانات لاسترداد قاعدة بيانات إلى نقطة زمنية في الماضي. بهذه الطريقة يمكنك الاسترداد من تلف البيانات الناجم عن الأخطاء البشرية. استرداد في نقطة زمنية يسمح لك بإنشاء قاعدة بيانات جديدة في نفس الخادم الذي يمثل حالة البيانات قبل تلف الحدث. بالنسبة لمعظم قواعد البيانات، تستغرق عمليات الاستعادة أقل من 12 ساعة. قد يستغرق وقتًا أطول استرداد قاعدة بيانات كبيرة جدًا أو نشطة جدًا. لمزيد من المعلومات حول وقت الاسترداد، راجع وقت استرداد قاعدة البيانات.

إذا كانت فترة استبقاء النسخ الاحتياطي المعتمدة القصوى لاسترداد في نقطة زمنية (PITR) غير كافية للتطبيق الخاص بك، يمكنك توسيعه عن طريق تكوين نهج استبقاء (LTR) طويل الأجل لقاعدة البيانات (قواعد البيانات). لمزيد من المعلومات، راجع استبقاء النسخ الاحتياطي طويل المدى.

مقارنة النسخ المتماثل الجغرافي بمجموعات تجاوز الفشل

مجموعات تجاوز الفشل التلقائي تبسط نشر واستخدام النسخ المتماثل الجغرافي وإضافة قدرات إضافية كما هو موضح في الجدول التالي:

النسخ الجغرافي مجموعات تجاوز الفشل
تجاوز الفشل التلقائي لا نعم
تجاوز الفشل عبر قواعد بيانات متعددة في نفس الوقت لا نعم
يجب على المستخدم تحديث سلسلة الاتصال بعد تجاوز الفشل نعم لا
دعم SQL Managed Instance لا نعم
يمكن أن تكون في نفس المنطقة التي فيها الابتدائي نعم لا
نسخ متماثلة متعددة نعم لا
يدعم مقياس القراءة نعم نعم

استرداد قاعدة بيانات إلى الخادم الموجود

على الرغم من أن ذلك نادر، يمكن أن يكون هناك انقطاع بمركز بيانات Azure. عند حدوث انقطاع، فإنه يتسبب في خلل بالأعمال قد يستمر لبضع دقائق فقط أو لساعات.

  • أحد الخيارات هو انتظار قاعدة البيانات الخاصة بك للعودة إلى الاتصال عند انتهاء انقطاع مركز البيانات. يعمل هذا للتطبيقات التي يمكن أن تتحمل أن تكون قاعدة البيانات دون اتصال. على سبيل المثال، مشروع تطوير أو إصدار تجريبي مجاني لا تحتاج إلى العمل عليه باستمرار. عندما يكون مركز البيانات به انقطاع، فلن تعرف كم من الوقت قد يستمر الانقطاع، لذلك هذا الخيار يعمل فقط إذا كنت لا تحتاج قاعدة البيانات الخاصة بك لفترة من الوقت.
  • خيار آخر هو استعادة قاعدة بيانات على أي خادم في أي منطقة Azure باستخدام النسخ الاحتياطية لقاعدة البيانات الجغرافية المكررة (استعادة جغرافية). يستخدم الاسترداد الجغرافي نسخة احتياطية جغرافية مكررة كمصدر له ويمكن استخدامها لاسترداد قاعدة بيانات حتى إذا كان الوصول إلى قاعدة البيانات أو مركز البيانات غير قابل للوصول بسبب انقطاع.
  • وأخيرًا، يمكنك الاسترداد بسرعة من انقطاع إذا قمت بتكوين إما جغرافي ثانوي باستخدام النسخ المتماثل الجغرافي النشط أو مجموعة تجاوز الفشل التلقائية لقاعدة البيانات أو قواعد البيانات الخاصة بك. حسب اختيارك لهذه التقنيات، يمكنك استخدام إما تجاوز الفشل اليدوي أو التلقائي. بينما تجاوز الفشل نفسه يستغرق بضع ثوان فقط، فستستغرق الخدمة على الأقل 1 ساعة لتنشيطه. وهذا ضروري لضمان تبرير تجاوز الفشل حسب حجم الانقطاع. أيضًا، قد ينتج تجاوز الفشل فقدان البيانات الصغيرة بسبب طبيعة النسخ المتماثل غير المتزامن.

أثناء تطوير خطة استمرارية العمل، تحتاج إلى فهم أقصى وقت مقبول قبل أن يتعافى التطبيق بالكامل بعد وقوع حدث مخل بالنظام. يُعرف الوقت المطلوب لاسترداد تطبيق بالكامل باسم هدف وقت الاسترداد (RTO). تحتاج أيضًا إلى فهم الفترة القصوى من تحديثات البيانات الأخيرة (الفاصل الزمني) الذي يمكن للتطبيق أن يتسامح مع فقدان البيانات عند الاسترداد من حدث غير مخطط له مخل بالنظام. تعرف خسارة البيانات المحتملة باسم هدف نقطة الاسترداد (RPO).

تعرض طرق الاسترداد المختلفة مستويات مختلفة من RPO وRTO. يمكنك اختيار طريقة استرداد معينة، أو استخدام مجموعة من الطرق لتحقيق استرداد التطبيق الكامل. يقارن الجدول التالي بين RPO وRTO لكل خيار استرداد. مجموعات تجاوز الفشل التلقائي تبسط نشر واستخدام النسخ المتماثل الجغرافي وإضافة قدرات إضافية كما هو موضح في الجدول التالي:

أسلوب الاسترداد هدف وقت الاسترداد (RTO) هدف نقطة الاسترداد (RPO)
الاستعادة الجغرافية من النسخ الاحتياطية التي تم نسخها جغرافيًا 12 س 1 س
مجموعات تجاوز الفشل التلقائي 1 س 5 ث
تجاوز الفشل اليدوي لقاعدة البيانات 30 ث 5 ث

ملاحظة

يشير تجاوز الفشل اليدوي لقاعدة البيانات إلى تجاوز فشل قاعدة بيانات واحدة إلى قاعدة بيانات ثانوية خاصة بها للمنسوخ جغرافيًا باستخدام الوضع غير المخطط له. راجع الجدول السابق في هذه المقالة للحصول على تفاصيل RTO وRPO للوضع التلقائي لتجاوز الفشل.

استخدم مجموعات تجاوز الفشل التلقائي إذا كان التطبيق يستوفي أيًا من هذه المعايير:

  • المهمة حرجة.
  • لديه اتفاقية على مستوى الخدمة (SLA) لا تسمح بوقت تعطل مدته 12 ساعة أو أكثر.
  • قد ينتج عن وقت التعطل مسؤولية مالية.
  • لديه معدل مرتفع من تغيير البيانات وساعة واحدة من فقدان البيانات غير مقبول.
  • التكلفة الإضافية للنسخ الجغرافي المتماثل النشط أقل من المسؤولية المالية المحتملة وما يرتبط بها من خسارة في الأعمال.

يمكنك اختيار استخدام مجموعة من النسخ الاحتياطية لقاعدة البيانات والنسخ المتماثل الجغرافي النشط اعتمادًا على متطلبات التطبيق الخاص بك. لمناقشة اعتبارات التصميم لقواعد البيانات المستقلة والتجمعات المرنة باستخدام ميزات استمرارية الأعمال هذه، راجع تصميم تطبيق للتعافي من كوارث السحابة واستراتيجيات التعافي من الكوارث المرن في التجمع.

توفر الأقسام التالية نظرة عامة حول خطوات الاسترداد باستخدام النسخ الاحتياطية لقاعدة البيانات أو النسخ المتماثل الجغرافي النشط. للحصول على خطوات تفصيلية بما في ذلك متطلبات التخطيط وخطوات الاسترداد اللاحقة ومعلومات حول كيفية محاكاة انقطاع لإجراء تنقل للتعافي من الكوارث، راجع استرداد قاعدة بيانات في قاعدة بيانات SQL من انقطاع.

الاستعداد عند انقطاع

بغض النظر عن ميزة استمرارية الأعمال التي تستخدمها، يجب عليك:

  • تحديد الملقم الهدف وإعداده، بما في ذلك قواعد جدار حماية IP على مستوى الخادم، وتسجيلات الدخول، masterوأذونات مستوى قاعدة البيانات.
  • تحديد كيفية إعادة توجيه العملاء وتطبيقات العميل إلى الخادم الجديد
  • توثيق التبعيات الأخرى، مثل إعدادات التدقيق والتنبيهات

إذا لم تحضر بشكل صحيح، سيتم إحضار التطبيقات الخاصة بك عبر الإنترنت بعد تجاوز الفشل أو استرداد قاعدة بيانات وقتًا إضافيًا ومن المحتمل أيضًا تتطلب استكشاف الأخطاء وإصلاحها في وقت من الإجهاد - تركيبة سيئة.

تجاوز فشل إلى قاعدة بيانات ثانوية منسوخة جغرافيًا

إذا كنت تستخدم النسخ المتماثل الجغرافي النشط أو مجموعات تجاوز الفشل التلقائي كآلية استرداد، يمكنك تكوين نهج تجاوز الفشل التلقائي أو استخدام تجاوز الفشل اليدوي غير المخطط له. بمجرد بدء تشغيل تجاوز الفشل تصبح قاعدة البيانات الثانوية الأساسية الجديدة وجاهزة لتسجيل المعاملات الجديدة والاستجابة للاستعلامات - مع حد أدنى لفقدان البيانات لم يتم نسخها بعد. للحصول على معلومات حول تصميم عملية تجاوز الفشل، راجع تصميم تطبيق للتعافي من الكوارث بالسحابة.

ملاحظة

عندما يعود مركز البيانات متصلًا، فإن قواعد البيانات القديمة تعيد الاتصال تلقائيًا بالبيانات الأساسية الجديدة وتصبح قواعد بيانات ثانوية. إذا كنت بحاجة إلى نقل قاعدة البيانات الأساسية إلى المنطقة الأصلية، يمكنك بدء تجاوز الفشل المخطط له يدويًا (الإرجاع).

إجراء استعادة جغرافية

إذا كنت تستخدم النسخ الاحتياطية التلقائية مع التخزين الجغرافي المكرر (ممكن افتراضيًا)، يمكنك استرداد قاعدة البيانات باستخدام الاستعادة الجغرافية. عادة يتم الاسترداد في غضون 12 ساعة - مع فقدان البيانات لمدة تصل إلى ساعة واحدة محددة بوقت حدوث النسخ الاحتياطي للسجل الأخير ونسخه نسخًا متماثلا. حتى اكتمال استرداد قاعدة البيانات، تصبح قاعدة البيانات غير قادرة على تسجيل أية معاملات أو الاستجابة إلى أية استعلامات. ملاحظة، تستعيد الاستعادة الجغرافية فقط قاعدة البيانات إلى آخر نقطة متوفرة في الوقت المناسب.

ملاحظة

إذا عاد مركز البيانات متصلًا قبل التبديل التطبيق الخاص بك إلى قاعدة البيانات المستردة، يمكنك إلغاء الاسترداد.

تنفيذ مهام ما بعد تجاوز الفشل / الاسترداد

بعد الاسترداد من آلية الاسترداد، يجب تنفيذ المهام الإضافية التالية قبل أن يتم النسخ الاحتياطي للمستخدمين والتطبيقات الخاصة بك والتشغيل:

  • أعد توجيه العملاء وتطبيقات العميل إلى الخادم الجديد وقاعدة البيانات المستعادة.
  • تأكد من وجود قواعد جدار حماية IP مناسبة على مستوى الخادم للمستخدمين للاتصال أو استخدم جدران حماية على مستوى قاعدة البيانات لتمكين القواعد المناسبة.
  • تأكد من عمليات تسجيل الدخول المناسبة وأذونات مستوى قاعدة البيانات الرئيسية في موضعها (أو استخدام للمستخدمين المضمنين).
  • تكوين التدقيق، حسب ما هو مناسب.
  • تكوين التنبيهات، حسب ما هو مناسب.

ملاحظة

إذا كنت تستخدم مجموعة تجاوز الفشل وتتصل بقواعد البيانات باستخدام وحدة استماع للقراءة والكتابة، ستحدث إعادة التوجيه بعد تجاوز الفشل تلقائيًا وبشفافية إلى التطبيق.

ترقية تطبيق بأدنى وقت تعطل

في بعض الأحيان يجب أن بدء التطبيق دون اتصال بسبب الصيانة المخطط لها مثل ترقية التطبيق. تصف ترقيات إدارة التطبيقات كيفية استخدام النسخ المتماثل الجغرافي النشط لتمكين الترقيات المتداولة لتطبيق السحابة لتقليل وقت التعطل أثناء الترقيات وتوفير مسار استرداد إذا حدث خطأ ما.

الخطوات التالية

لمناقشة اعتبارات تصميم التطبيق لقواعد البيانات وللتجمعات المرنة، راجع تصميم تطبيق للتعافي من كوارث السحابة واستراتيجيات التعافي من الكوارث المرن في التجمع.