تحديد الجهاز الظاهري المناسب لنظام مجموعة Azure HDInsight

تتناول هذه المقالة كيفية تحديد حجم الجهاز الظاهري المناسب للعُقد المختلفة في نظام مجموعة HDInsight.

ابدأ بفهم كيفية تأثير خصائص الجهاز الظاهري مثل معالجة CPU وحجم ذاكرة RAM وزمن انتقال الشبكة، على معالجة أحمال العمل. بعد ذلك، ارجع إلى تطبيقك وكيفية تطابقه مع عائلات الأجهزة الظاهرية المختلفة المثالية لها. تأكد من أن مجموعة الأجهزة الظاهرية التي ترغب في استخدامها متوافقة مع نوع نظام المجموعة الذي تخطط لاستخدامه. للحصول على قائمة بكافة أحجام الأجهزة الظاهرية المعتمدة والموصى بها لكل نوع نظام مجموعة، راجع عمليات تكوين العقدة المدعومة من Azure HDInsight. وأخيراً، يمكنك استخدام معيار تقييم الأداء لاختبار بعض النماذج من أحمال العمل والتحقق من وحدة SKU المناسبة لك ضمن تلك المجموعة.

لمزيد من المعلومات حول تخطيط جوانب أخرى من نظام المجموعة الخاصة بك مثل تحديد نوع تخزين أو حجم نظام مجموعة، راجع تخطيط السعة لمجموعات HDInsight.

خصائص الجهاز الظاهري وأحمال عمل البيانات الضخمة

يتم تحديد حجم الجهاز الظاهري ونوعه بواسطة قوة معالجة CPU وحجم ذاكرة RAM وزمن انتقال الشبكة:

  • CPU: حجم الجهاز الظاهري يشير إلى عدد الذاكرات الأساسية. كلما زادت الذاكرات الأساسية، زادت درجة الحساب المتوازي الذي يمكن أن تحققه كل عقدة. وكذلك، تحتوي بعض أنواع الأجهزة الظاهرية على ذاكرات أساسية أسرع.

  • RAM: حجم الجهاز الظاهري أيضاً يشير إلى مقدار ذاكرة RAM المتوفرة في الجهاز الظاهري. بالنسبة لأحمال العمل التي تخزن البيانات في الذاكرة للمعالجة، بدلاً من القراءة من القرص، تأكد من أن العُقد العاملة لديها ذاكرة كافية لتناسب البيانات.

  • الشبكة: بالنسبة لمعظم أنواع المجموعات، فإن البيانات التي تتم معالجتها بواسطة الكتلة ليست على القرص المحلي، ولكن بدلاً من ذلك في خدمة تخزين خارجية مثل Data Lake Storage أو تخزين Azure. خذ بعين الاعتبار عرض النطاق الترددي للشبكة ومعدل النقل بين الجهاز الظاهري للعقدة وخدمة التخزين. عادةً ما يزيد عرض النطاق الترددي للشبكة المتوفرة إلى جهاز ظاهري مع أحجام أكبر. للحصول على التفاصيل، راجع نظرة عامة على أحجام الأجهزة الظاهرية.

فهم تحسين الأجهزة الظاهرية

تم تحسين مجموعات الأجهزة الظاهرية في Azure لتناسب حالات الاستخدام المختلفة. في الجدول أدناه، يمكنك العثور على بعض حالات الاستخدام الأكثر شيوعاً ومجموعات الأجهزة الظاهرية التي تتطابق معها.

النوع أحجام الوصف
المستوى المبدئي Av2 يتوفر أداء وCPU وتكوينات الذاكرة الأنسب لأحمال العمل الأساسية مثل التطوير. فهي اقتصادية وتوفر خياراً منخفض التكلفة للبدء مع Azure.
الغرض العام D، DSv2، Dv2 نسبة وحدة معالج CPU إلى الذاكرة المتوازنة. مثالية للاختبار والتطوير، وقواعد البيانات الصغيرة إلى المتوسطة، وخوادم الويب بنسبة استخدام شبكة المنخفضة إلى المتوسطة.
حساب محسّن F#‎ نسبة معالج CPU إلى الذاكرة العالية. ويكون ذلك مناسباً لخوادم الويب ذات نسبة استخدام الشبكة المتوسطة، وأجهزة الشبكة، وعمليات الدُفعة، وخوادم التطبيقات.
الذاكرة المُحسنة Esv3، Ev3 نسبة الذاكرة العالية إلى معالج CPU. يكون ممتازًا لخوادم قواعد البيانات الارتباطية، وذاكرة التخزين المؤقت المتوسطة إلى الكبيرة، والتحليلات داخل الذاكرة.
  • للحصول على معلومات حول أسعار مثيلات الأجهزة الظاهرية المتوفرة عبر المناطق المدعومة بخدمة HDInsight، راجع أسعار HDInsight.

أنواع الأجهزة الظاهرية الموفرة للتكلفة لأحمال العمل الخفيفة

إذا كان لديك متطلبات معالجة خفيفة، يمكن أن تكون سلسلة F خياراً جيداً للبدء مع HDInsight. بسعر أقل في الساعة، فإن الفئة F هي أفضل قيمة للأداء السعري في محفظة Azure استناداً إلى وحدة الحساب Azure (ACU) لكل وحدة معالج CPU ظاهري.

يصف الجدول التالي أنواع نظام المجموعة وأنواع العقدة، التي يمكن إنشاؤها باستخدام الأجهزة الظاهرية لسلسلة Fsv2.

نوع شبكة نظام المجموعة إصدار عقدة العامل عقدة الرأس عقدة وسيطة
"Spark" الكل F4 والأحدث لا لا
Hadoop الكل F4 والأحدث لا لا
Kafka الكل F4 والأحدث لا لا
HBase الكل F4 والأحدث لا لا
LLAP معطّل لا لا لا

للاطلاع على مواصفات كل SKU من السلسلة F، راجع أحجام الأجهزة الظاهرية للسلسلة F.

معيار تقييم الأداء

إن معيار تقييم الأداء هو عملية تشغيل أحمال عمل تمت محاكاتها على الأجهزة الظاهرية المختلفة لقياس مدى كفاءة أدائها لأحمال عمل الإنتاج الخاص بك.

لمزيد من المعلومات حول معيار تقييم الأداء لوحدات SKU الخاصة بالأجهزة الظاهرية وأحجام نظام المجموعة راجع تخطيط سعة نظام المجموعة في Azure HDInsight .

الخطوات التالية