مساحة الاسم الهرمية لـAzure Data Lake Storage Gen2

آلية رئيسية يستخدمها Azure Data Lake Storage Gen2 لتوفير أداء نظام الملفات في حجم تخزين الكائن والأسعار بالإضافة إلى مساحة أسماء هرمية. يسمح هذا لمجموعة من الكائنات/الملفات داخل حساب لتنظيمها في تسلسل هرمي من الدلائل والدلائل الفرعية المضمنة بنفس الطريقة التي يتم بها تنظيم نظام الملفات على الكمبيوتر الخاص بك. مع تمكين مساحة أسماء هرمية، يصبح حساب التخزين قادرًا على توفير قابلية التوسع والفعالية من حيث التكلفة لتخزين الكائن، مع دلالات نظام الملفات المألوفة لمحركات التحليلات وأطر العمل.

فوائد مساحة الاسم الهرمية

الفوائد التالية مقترنة بأنظمة الملفات التي تقوم بتطبيق مساحة أسماء هرمية عبر بيانات blob:

  • Atomic directory manipulation: تقوم مخازن الكائنات بتقريب التسلسل الهرمي للدليل من خلال اعتماد اصطلاح تضمين الشرطات المائلة (/) في اسم الكائن للإشارة إلى مقاطع المسار. بينما تعمل هذه الاتفاقية لتنظيم العناصر، لا يوفر الاصطلاح أي مساعدة لإجراءات مثل النقل أو إعادة التسمية أو حذف الدلائل. بدون الدلائل الحقيقية يجب أن تعالج التطبيقات الملايين من النقط الفردية المحتملة لتحقيق مهام على مستوى الدليل. وعلى النقيض من ذلك، تقوم مساحة أسماء هرمية بمعالجة هذه المهام عن طريق تحديث إدخال واحد (الدليل الأصلي).

    هذا التحسين الدرامي مهم بشكل خاص للعديد من أطر تحليلات البيانات الضخمة. أدوات مثل Hive، Spark، إلخ غالبًا تكتب الإخراج إلى مواقع مؤقتة ثم تعيد تسمية الموقع في ختام المهمة. بدون مساحة أسماء هرمية، قد تستغرق إعادة التسمية هذه وقتًا أطول من عملية التحليل نفسها. انخفاض زمن الانتقال إلى المهام يساوي انخفاض التكلفة الإجمالية للتملك (TCO) لأحمال عمل التحليلات.

  • Familiar Interface Style: أنظمة الملفات مفهومة جيدًا من قبل المطورين والمستخدمين على حد سواء. ليست هناك حاجة لمعرفة نموذج تخزين جديد عند الانتقال إلى السحابة كما يواجه نظام الملفات الذي يكشف عن Data Lake Storage Gen2 نفس النموذج المستخدم من قبل أجهزة الكمبيوتر، كبيرة وصغيرة.

أحد الأسباب التي لم يتم اعتمادها تاريخيًا بمساحة أسماء هرمية أن مساحة الأسماء الهرمية تحد المقياس. ومع ذلك، تغير مساحة الأسماء الهرمية Data Lake Storage Gen2 من الحجم خطيًا ولا تحلل سعة البيانات ولا الأداء.

تحديد ما إذا كنت تريد تمكين مساحة اسم هرمية

بعد تمكين مساحة اسم هرمية على حسابك، لا يمكنك إعادتها مرة أخرى إلى مساحة اسم ثابت. لذلك، ضع في اعتبارك ما إذا كان من المنطقي تمكين مساحة اسم هرمية استنادًا إلى طبيعة أحمال عمل تخزين الكائنات. لتقييم تأثير تمكين مساحة اسم متدرجة على أعباء العمل والتطبيقات والتكاليف وتكامل الخدمات والأدوات والميزات والوثائق، راجع ترقية تخزين Azure Blob باستخدام قدرات Azure Data Lake Storage Gen2.

قد لا تحصل بعض أحمال العمل على أي فائدة من خلال تمكين مساحة اسم هرمية. تتضمن الأمثلة النسخ الاحتياطية وتخزين الصور والتطبيقات الأخرى حيث يتم تخزين تنظيم الكائنات بشكل منفصل عن الكائنات نفسها (على سبيل المثال: في قاعدة بيانات منفصلة).

أيضًا، بينما يستمر دعم ميزات تخزين Blob والنظام البيئي لخدمة Azure في النمو، لا تزال هناك بعض الميزات وخدمات Azure غير المدعومة حتى الآن في الحسابات التي تحتوي على مساحة اسم هرمية. راجع المشاكل المعروفة.

بشكل عام، نوصي بتشغيل مساحة اسم هرمية لأحمال عمل التخزين المصممة لأنظمة الملفات التي تتعامل مع الدلائل. ويشمل ذلك جميع أعباء العمل المخصصة أساسًا لمعالجة التحليلات. ستستفيد مجموعات البيانات التي تتطلب درجة عالية من التنظيم أيضًا من خلال تمكين مساحة اسم هرمية.

يتم تحديد أسباب تمكين مساحة اسم هرمية من خلال تحليل إجمالي التكلفة الإجمالية للتملك (TCO). بشكل عام، ستتطلب التحسينات في زمن انتقال عبء العمل بسبب تسريع التخزين موارد حسابية لوقت أقل. قد يتم تحسين زمن الوصول للعديد من أحمال العمل بسبب معالجة الدليل الذري الذي يتم تمكينه بواسطة مساحة اسم هرمية. في العديد من أعباء العمل، يمثل مورد الحوسبة > 85% من التكلفة الإجمالية، وبالتالي حتى الانخفاض المتواضع في زمن انتقال عبء العمل يعادل قدرًا كبيرًا من توفير التكلفة الإجمالية للتملك (TCO). حتى في الحالات التي يؤدي فيها تمكين مساحة الأسماء الهرمية إلى زيادة تكاليف التخزين، لا تزال التكلفة الإجمالية للتملك (TCO) منخفضة بسبب انخفاض تكاليف الحساب.

لتحليل الاختلافات في أسعار تخزين البيانات وأسعار المعاملات وتسعير حجز سعة التخزين بين الحسابات التي تحتوي على مساحة اسم هرمية مسطحة مقابل مساحة اسم هرمية، راجع تسعيرAzure Data Lake Storage Gen2.

الخطوات التالية