مراقبة استرداد الموقع مع سجلات Azure Monitor

توضح هذه المقالة كيفية مراقبة الأجهزة التي تم نسخها بواسطة Azure Site Recovery، باستخدام Azure Monitor Logs وتحليلات السجلات.

Azure Monitor Logs يوفر نظاما أساسيا بيانات السجل يجمع سجلات الأنشطة والموارد، إلى جانب بيانات مراقبة أخرى. ضمن سجلات Azure Monitor، يمكنك استخدام Log Analytics لكتابة استعلامات السجل واختبارها وتحليل بيانات السجل بشكل تفاعلي. يمكنك تصور نتائج السجل والاستعلام عنها، وتكوين التنبيهات لاتخاذ إجراءات استنادا إلى البيانات التي تتم مراقبتها.

بالنسبة إلى استرداد الموقع، يمكنك استخدام Azure Monitor Logs لمساعدتك في القيام بما يلي:

  • مراقبة صحة وحالة استرداد الموقع. على سبيل المثال، يمكنك مراقبة حالة النسخ المتماثل وحالة تجاوز الفشل الاختبارية وأحداث استرداد الموقع وأهداف نقطة الاسترداد (RPOs) للأجهزة المحمية ومعدلات تغيير القرص/البيانات.
  • إعداد تنبيهات لاسترداد الموقع. على سبيل المثال، يمكنك تكوين تنبيهات لصحة الجهاز أو حالة تجاوز الفشل الاختبارية أو حالة مهمة استرداد الموقع.

يتم دعم استخدام سجلات Azure Monitor مع Site Recovery ل Azure إلى النسخ المتماثل Azure والجهاز الظاهري VMware/ الخادم الفعلي إلى النسخ المتماثل Azure .

إشعار

للحصول على سجلات بيانات الاضطرابات وسجلات معدل التحميل لـ VMware والأجهزة الفعلية، تحتاج إلى تثبيت عامل مراقبة Microsoft على خادم العملية. يرسل هذا العامل سجلات أجهزة النسخ المتماثل إلى مساحة العمل. تتوفر هذه الإمكانية فقط لإصدار عامل التنقل 9.30 فصاعدا.

المتطلبات الأساسية

إليك ما تحتاج إليه:

  • يتم حماية جهاز واحد على الأقل في مخزن خدمات الاسترداد.
  • مساحة عمل تحليلات السجل لتخزين سجلات استرداد الموقع. تعرف على إعداد مساحة عمل.
  • فهم أساسي لكيفية كتابة استعلامات السجل وتشغيلها وتحليلها في تحليلات السجل. اعرف المزيد.

نوصي بمراجعة أسئلة المراقبة الشائعة قبل البدء.

سجلات الأحداث المتوفرة ل Azure Site Recovery

يوفر Azure Site Recovery الجداول التالية الخاصة بالموارد والجداول القديمة. يوفر كل حدث بيانات مفصلة حول مجموعة محددة من البيانات الاصطناعية المتعلقة باسترداد الموقع.

الجداول الخاصة بالموارد:

الجداول القديمة:

  • أحداث استرداد موقع Azure
  • العناصر المكررة لاسترداد موقع Azure
  • إحصائيات النسخ المتماثل لاسترداد موقع Azure
  • نقاط استرداد موقع Azure
  • معدل تحميل بيانات النسخ المتماثل لاسترداد موقع Azure
  • استعادة بيانات الموقع المحمية من Azure
  • تفاصيل العنصر المنسوخ نسخا متماثلا لاسترداد موقع Azure

تكوين استرداد الموقع لإرسال السجلات

  1. في المخزن، حدد "إعدادات التشخيص>إضافة إعدادات تشخيص".

    لقطة شاشة تعرض خيار إضافة إعدادات التشخيص.

  2. في إعدادات التشخيص، حدد اسما، وحدد المربع إرسال إلى تحليلات السجل.

  3. حدد اشتراك Azure Monitor Logs ومساحة عمل Log Analytics.

  4. حدد Azure Diagnostics في التبديل.

  5. من قائمة السجلات، حدد كافة السجلات التي تحتوي على البادئة AzureSiteRecovery. ثم حدد موافق.

    لقطة شاشة لشاشة إعدادات التشخيص.

تبدأ سجلات استرداد الموقع في التغذية بجدول (AzureDiagnostics) في مساحة العمل المحددة.

تكوين وكيل مراقبة Microsoft على خادم العملية لإرسال سجلات الاضطرابات ومعدل التحميل

يمكنك التقاط معلومات معدل اضطرابات البيانات ومعلومات معدل تحميل بيانات المصدر لأجهزة VMware/الأجهزة الفعلية الخاصة بك في أماكن العمل. لتمكين ذلك، يلزم تثبيت عامل مراقبة Microsoft على خادم العملية.

  1. انتقل إلى مساحة عمل "تحليلات السجل" وحدد "الإعدادات المتقدمة".

  2. حدد صفحة "المصادر المتصلة" وحدد "خوادم Windows".

  3. قم بتنزيل عامل Windows (64 بت) على خادم العمليات.

  4. الحصول على معرف ومفتاح مساحة العمل

  5. تكوين العامل لاستخدام TLS 1.2

  6. أكمل تثبيت العامل من خلال توفير معرف ومفتاح مساحة العمل التي تم الحصول عليها.

  7. بمجرد اكتمال التثبيت، انتقل إلى مساحة عمل Log Analytics وحدد Legacy agents management. انتقل إلى صفحة "البيانات" وحدد "عدّادات الأداء Windows".

  8. حدد '+' لإضافة العدادين التاليين بفاصل زمني نموذجي مدته 300 ثانية:

    • ASRAnalytics(*)\SourceVmChurnRate
    • ASRAnalytics(*)\SourceVmThrpRate

    ستبدأ بيانات معدل التحميل والشحن في التغذية في مساحة العمل.

  9. عدادات Site Recovery التالية غير قابلة للبحث حاليا:

    • ASRAnalytics(*)\SourceVmChurnRate
    • ASRAnalytics(*)\SourceVmThrpRate
      ومع ذلك، يمكن إضافتها عن طريق لصق الأسماء بالكامل.

    لقطة شاشة لعداد أداء Windows.

  • ASRAnalytics(*)\SourceVmChurnRate يوفر رؤى حول معدل الخسارة للأجهزة الظاهرية المنسوخة نسخا متماثلا.
  • ASRAnalytics(*)\SourceVmThrpRate يمثل معدل النقل للأجهزة الظاهرية المنسوخة نسخا متماثلا الذي يمثل مؤشرا لسرعة نقل البيانات بين المصدر والهدف أثناء النسخ المتماثل.

الاستعلام عن السجلات - أمثلة

يمكنك استرداد البيانات من السجلات باستخدام استعلامات السجل المكتوبة بلغة استعلام Kusto. يوفر هذا القسم بعض الأمثلة على الاستعلامات الشائعة التي قد تستخدمها لمراقبة استرداد الموقع.

إشعار

تستخدم بعض الأمثلة replicationProviderName_s تعيينها إلى A2A. يؤدي ذلك إلى استرداد أجهزة Azure الظاهرية التي يتم نسخها نسخا متماثلا إلى منطقة Azure ثانوية باستخدام Site Recovery. في هذه الأمثلة، يمكنك استبدال A2A ب InMageRcm، إذا كنت تريد استرداد أجهزة VMware الظاهرية المحلية أو الخوادم الفعلية التي يتم نسخها نسخا متماثلا إلى Azure باستخدام Site Recovery.

صحة النسخ المتماثل للاستعلام

يرسم هذا الاستعلام مخططا دائريا لصحة النسخ المتماثل الحالية لجميع أجهزة Azure الظاهرية المحمية، مقسمة إلى ثلاث حالات: عادي أو تحذير أو حرج.

AzureDiagnostics  
| where replicationProviderName_s == "A2A"   
| where isnotempty(name_s) and isnotnull(name_s)  
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s  
| project name_s , replicationHealth_s  
| summarize count() by replicationHealth_s  
| render piechart   

إصدار خدمة التنقل للاستعلام

يرسم هذا الاستعلام مخططا دائريا لأجهزة Azure الظاهرية المنسوخة نسخا متماثلا باستخدام Site Recovery، مقسما حسب إصدار عامل التنقل الذي يتم تشغيله.

AzureDiagnostics  
| where replicationProviderName_s == "A2A"   
| where isnotempty(name_s) and isnotnull(name_s)  
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s  
| project name_s , agentVersion_s  
| summarize count() by agentVersion_s  
| render piechart 

وقت الاستعلام عن هدف نقطة الاسترداد

يرسم هذا الاستعلام مخططا شريطيا لأجهزة Azure الظاهرية المنسوخة نسخا متماثلا مع Site Recovery، مقسما حسب هدف نقطة الاسترداد (RPO): أقل من 15 دقيقة، بين 15-30 دقيقة، أكثر من 30 دقيقة.

AzureDiagnostics 
| where replicationProviderName_s == "A2A"   
| where isnotempty(name_s) and isnotnull(name_s)  
| extend RPO = case(rpoInSeconds_d <= 900, "<15Min",   
rpoInSeconds_d <= 1800, "15-30Min", ">30Min")  
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s  
| project name_s , RPO  
| summarize Count = count() by RPO  
| render barchart 

لقطة شاشة تعرض مخطط شريطي لأجهزة Azure الظاهرية المنسوخة نسخا متماثلا باستخدام Site Recovery.

الاستعلام عن مهام استرداد الموقع

يقوم هذا الاستعلام باسترداد كافة مهام استرداد الموقع (لكافة سيناريوهات الإصلاح بعد كارثة)، التي تم تشغيلها في آخر 72 ساعة، وحالة اكتمالها.

AzureDiagnostics  
| where Category == "AzureSiteRecoveryJobs"  
| where TimeGenerated >= ago(72h)   
| project JobName = OperationName , VaultName = Resource , TargetName = affectedResourceName_s, State = ResultType  

الاستعلام عن أحداث استرداد الموقع

يسترد هذا الاستعلام جميع أحداث استرداد الموقع (لجميع سيناريوهات الإصلاح بعد كارثة) التي تم جمعها في آخر 72 ساعة، إلى جانب شدتها.

AzureDiagnostics   
| where Category == "AzureSiteRecoveryEvents"   
| where TimeGenerated >= ago(72h)   
| project AffectedObject=affectedResourceName_s , VaultName = Resource, Description_s = healthErrors_s , Severity = Level  

الاستعلام عن حالة تجاوز فشل الاختبار (مخطط دائري)

يرسم هذا الاستعلام مخططا دائريا لحالة اختبار تجاوز الفشل لأجهزة Azure الظاهرية المنسوخة نسخا متماثلا باستخدام Site Recovery.

AzureDiagnostics  
| where replicationProviderName_s == "A2A"   
| where isnotempty(name_s) and isnotnull(name_s)  
| where isnotempty(failoverHealth_s) and isnotnull(failoverHealth_s)  
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s  
| project name_s , Resource, failoverHealth_s  
| summarize count() by failoverHealth_s  
| render piechart 

الاستعلام عن حالة تجاوز فشل الاختبار (جدول)

يرسم هذا الاستعلام جدولا لحالة اختبار تجاوز الفشل لأجهزة Azure الظاهرية المنسوخة نسخا متماثلا باستخدام Site Recovery.

AzureDiagnostics   
| where replicationProviderName_s == "A2A"   
| where isnotempty(name_s) and isnotnull(name_s)   
| where isnotempty(failoverHealth_s) and isnotnull(failoverHealth_s)   
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s   
| project VirtualMachine = name_s , VaultName = Resource , TestFailoverStatus = failoverHealth_s 

الاستعلام عن هدف نقطة الاسترداد لجهاز

يرسم هذا الاستعلام رسما بيانيا للاتجاه يتتبع RPO لجهاز Azure ظاهري معين (ContosoVM123) لآخر 72 ساعة.

AzureDiagnostics   
| where replicationProviderName_s == "A2A"   
| where TimeGenerated > ago(72h)  
| where isnotempty(name_s) and isnotnull(name_s)   
| where name_s == "ContosoVM123"  
| project TimeGenerated, name_s , RPO_in_seconds = rpoInSeconds_d   
| render timechart 

لقطة شاشة لرسم بياني للاتجاه يتتبع RPO لجهاز Azure ظاهري معين.

معدل تغيير بيانات الاستعلام (خسارة) ومعدل التحميل لجهاز Azure الظاهري

يرسم هذا الاستعلام رسما بيانيا للاتجاه لجهاز Azure ظاهري معين (ContosoVM123)، يمثل معدل تغيير البيانات (كتابة وحدات البايت في الثانية)، ومعدل تحميل البيانات.

AzureDiagnostics   
| where Category in ("AzureSiteRecoveryProtectedDiskDataChurn", "AzureSiteRecoveryReplicationDataUploadRate")   
| extend CategoryS = case(Category contains "Churn", "DataChurn",   
Category contains "Upload", "UploadRate", "none")  
| extend InstanceWithType=strcat(CategoryS, "_", InstanceName_s)   
| where TimeGenerated > ago(24h)   
| where InstanceName_s startswith "ContosoVM123"   
| project TimeGenerated , InstanceWithType , Churn_MBps = todouble(Value_s)/1048576   
| render timechart  

لقطة شاشة لرسم بياني للاتجاه لجهاز Azure ظاهري معين.

الاستعلام عن معدل تغيير بيانات (الاضطراب) ومعدل التحميل لـ VMware أو جهاز فعلي

إشعار

تأكد من إعداد عامل المراقبة على خادم العملية لجلب هذه السجلات. راجع خطوات تكوين وكيل المراقبة.

يقوم هذا الاستعلام برسم بياني للاتجاه لقرص معين disk0 لعنصر منسوخ نسخًا متماثلًا win-9r7sfh9qlru، والذي يمثل معدل تغيير البيانات (بايت الكتابة في الثانية)، ومعدل تحميل البيانات. يمكنك العثور على اسم القرص على شفرة Disks للعنصر المنسوخ نسخا متماثلا في مخزن خدمات الاسترداد. اسم المثيل الذي سيتم استخدامه في الاستعلام هو اسم DNS للجهاز متبوعا ب _ واسم القرص كما في هذا المثال.

Perf
| where ObjectName == "ASRAnalytics"
| where InstanceName contains "win-9r7sfh9qlru_disk0"
| where TimeGenerated >= ago(4h) 
| project TimeGenerated ,CounterName, Churn_MBps = todouble(CounterValue)/5242880 
| render timechart

يدفع خادم العملية هذه البيانات كل 5 دقائق إلى مساحة عمل تحليلات السجل. تمثل نقاط البيانات هذه المتوسط المحسوب لمدة 5 دقائق.

الاستعلام عن ملخص الإصلاح بعد كارثة (Azure إلى Azure)

يرسم هذا الاستعلام جدول ملخص لأجهزة Azure الظاهرية المنسوخة نسخا متماثلا إلى منطقة Azure ثانوية. يعرض اسم الجهاز الظاهري والنسخ المتماثل وحالة الحماية وRPO وحالة تجاوز الفشل الاختبار وإصدار عامل التنقل وأي أخطاء نسخ متماثل نشطة وموقع المصدر.

AzureDiagnostics 
| where replicationProviderName_s == "A2A"   
| where isnotempty(name_s) and isnotnull(name_s)   
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s   
| project VirtualMachine = name_s , Vault = Resource , ReplicationHealth = replicationHealth_s, Status = protectionState_s, RPO_in_seconds = rpoInSeconds_d, TestFailoverStatus = failoverHealth_s, AgentVersion = agentVersion_s, ReplicationError = replicationHealthErrors_s, SourceLocation = primaryFabricName_s 

ملخص الاستعلام عن الإصلاح بعد كارثة (VMware/الخوادم الفعلية)

يرسم هذا الاستعلام جدول ملخص لأجهزة VMware الظاهرية والخوادم الفعلية المنسوخة نسخا متماثلا إلى Azure. يعرض اسم الجهاز، وحالة النسخ المتماثل والحماية، وRPO، وحالة تجاوز الفشل الاختباري، وإصدار عامل التنقل، وأي أخطاء نسخ متماثل نشطة، وخادم العملية ذي الصلة.

AzureDiagnostics  
| where replicationProviderName_s == "InMageRcm"   
| where isnotempty(name_s) and isnotnull(name_s)   
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s   
| project VirtualMachine = name_s , Vault = Resource , ReplicationHealth = replicationHealth_s, Status = protectionState_s, RPO_in_seconds = rpoInSeconds_d, TestFailoverStatus = failoverHealth_s, AgentVersion = agentVersion_s, ReplicationError = replicationHealthErrors_s, ProcessServer = processServerName_g  

إعداد التنبيهات - أمثلة

يمكنك إعداد تنبيهات استرداد الموقع استنادا إلى بيانات Azure Monitor. تعرف على المزيد حول إعداد تنبيهات السجلات.

إشعار

تستخدم بعض الأمثلة replicationProviderName_s تعيينها إلى A2A. يؤدي هذا إلى تعيين تنبيهات لأجهزة Azure الظاهرية التي يتم نسخها نسخا متماثلا إلى منطقة Azure ثانوية. في هذه الأمثلة، يمكنك استبدال A2A ب InMageRcm إذا كنت تريد تعيين تنبيهات لأجهزة VMware الظاهرية المحلية أو الخوادم الفعلية المنسوخة نسخا متماثلا إلى Azure.

أجهزة متعددة في حالة حرجة

إعداد تنبيه إذا انتقل أكثر من 20 جهازا ظاهريا من أجهزة Azure الظاهرية المنسوخة نسخا متماثلا إلى حالة حرجة.

AzureDiagnostics   
| where replicationProviderName_s == "A2A"   
| where replicationHealth_s == "Critical"  
| where isnotempty(name_s) and isnotnull(name_s)   
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s   
| summarize count() 

للتنبيه، قم بتعيين قيمة الحد إلى 20.

جهاز واحد في حالة حرجة

إعداد تنبيه إذا كان جهاز Azure ظاهري معين منسوخ نسخا متماثلا ينتقل إلى حالة حرجة.

AzureDiagnostics   
| where replicationProviderName_s == "A2A"   
| where replicationHealth_s == "Critical"  
| where name_s == "ContosoVM123"  
| where isnotempty(name_s) and isnotnull(name_s)   
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s   
| summarize count()  

للتنبيه، قم بتعيين قيمة الحد إلى 1.

أجهزة متعددة تتجاوز هدف نقطة الاسترداد

قم بإعداد تنبيه إذا تجاوز RPO لأكثر من 20 جهازا ظاهريا من Azure 30 دقيقة.

AzureDiagnostics   
| where replicationProviderName_s == "A2A"   
| where isnotempty(name_s) and isnotnull(name_s)   
| where rpoInSeconds_d > 1800  
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s   
| project name_s , rpoInSeconds_d   
| summarize count()  

للتنبيه، قم بتعيين قيمة الحد إلى 20.

آلة واحدة تتجاوز هدف نقطة الاسترداد

إعداد تنبيه إذا تجاوز RPO لجهاز Azure ظاهري واحد 30 دقيقة.

AzureDiagnostics   
| where replicationProviderName_s == "A2A"   
| where isnotempty(name_s) and isnotnull(name_s)   
| where name_s == "ContosoVM123"  
| where rpoInSeconds_d > 1800  
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s   
| project name_s , rpoInSeconds_d   
| summarize count()  

للتنبيه، قم بتعيين قيمة الحد إلى 1.

تجاوز فشل الاختبار لعدة أجهزة يتجاوز 90 يوما

إعداد تنبيه إذا كان تجاوز فشل الاختبار الناجح الأخير أكثر من 90 يوما، لأكثر من 20 جهازا ظاهريا.

AzureDiagnostics  
| where replicationProviderName_s == "A2A"   
| where Category == "AzureSiteRecoveryReplicatedItems"  
| where isnotempty(name_s) and isnotnull(name_s)   
| where lastSuccessfulTestFailoverTime_t <= ago(90d)   
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s   
| summarize count()  

للتنبيه، قم بتعيين قيمة الحد إلى 20.

تجاوز فشل الاختبار لجهاز واحد 90 يوما

قم بإعداد تنبيه إذا كان آخر تجاوز فشل اختبار ناجح لجهاز ظاهري معين قبل أكثر من 90 يوما.

AzureDiagnostics  
| where replicationProviderName_s == "A2A"   
| where Category == "AzureSiteRecoveryReplicatedItems"  
| where isnotempty(name_s) and isnotnull(name_s)   
| where lastSuccessfulTestFailoverTime_t <= ago(90d)   
| where name_s == "ContosoVM123"  
| summarize hint.strategy=partitioned arg_max(TimeGenerated, *) by name_s   
| summarize count()  

للتنبيه، قم بتعيين قيمة الحد إلى 1.

فشل مهمة استرداد الموقع

قم بإعداد تنبيه في حالة فشل مهمة استرداد الموقع (في هذه الحالة مهمة "إعادة الحماية") لأي سيناريو استرداد موقع، خلال اليوم الأخير.

AzureDiagnostics   
| where Category == "AzureSiteRecoveryJobs"   
| where OperationName == "Reprotect"  
| where ResultType == "Failed"  
| summarize count()  

بالنسبة للتنبيه، اضبط قيمة الحد على 1 والفترة على 1440 دقيقة للتحقق من حالات الفشل في اليوم الأخير.

الخطوات التالية

تعرف على مراقبة استرداد الموقع التي تحمل في ثناياها عوامل داخليا.