ما الجهاز الافتراضي لعلوم البيانات من Azure، لـ Linux وWindows؟

الجهاز الظاهري لعلوم البيانات (DSVM) هو صورة جهاز ظاهري مخصصة متاحة على النظام الأساسي السحابي Azure، ويمكنه التعامل مع علم البيانات. يحتوي على العديد من أدوات علم البيانات الشائعة المثبتة مسبقا والمكونة مسبقا لبدء إنشاء تطبيقات ذكية للتحليقات المتقدمة.

يتوفر الجهاز الافتراضي لعلوم البيانات على:

  • Windows Server 2019
  • Windows Server 2022
  • نظام التشغيل Ubuntu 20.04 LTS

بالإضافة إلى ذلك، نقدم Azure DSVM ل PyTorch - صورة Ubuntu 20.04 من Azure Marketplace المحسنة لأحمال عمل التعلم العميق الكبيرة والموزعة. يأتي DSVM المثبت مسبقا هذا متحققا من صحته باستخدام أحدث إصدار PyTorch، لتقليل تكاليف الإعداد وتسريع الوقت إلى القيمة. يأتي مزودا بميزات تحسين مختلفة:

  • وقت تشغيل ONNX
  • DeepSpeed
  • MSCCL
  • ORTMoE
  • تحجيم ال Fairscale
  • Nvidia Apex
  • مكدس محدث مع أحدث الإصدارات المتوافقة من Ubuntu وPython وPyTorch وCUDA

مقارنة مع Azure Machine Learning

DSVM هو صورة جهاز ظاهري مخصصة لعلوم البيانات، ولكن Azure التعلم الآلي هو نظام أساسي شامل يغطي:

  • حساب مدار بالكامل
    • مثيلات الحساب
    • مجموعات الحساب لمهام ML الموزعة
    • مجموعات الاستدلال لتسجيل النقاط في الوقت الحقيقي
  • مخازن البيانات (على سبيل المثال النقطة، ADLS Gen2، SQL DB)
  • تتبع التجربة
  • إدارة النماذج
  • دفاتر الملاحظات
  • بيئات (إدارة تبعيات conda وR)
  • التسمية
  • خطوط الأنابيب (أتمتة سير عمل علوم البيانات من طرف إلى طرف)

المقارنة مع Azure التعلم الآلي Compute Instances

Azure التعلم الآلي Compute Instances هي صورة جهاز ظاهري تم تكوينها وإدارتهابالكامل، بينما DSVM هو جهاز ظاهري غير مدار.

الاختلافات الرئيسية بين DSVM ومثيل حساب Azure التعلم الآلي:

ميزة علوم البيانات
جهاز ظاهري
التعلم الآلي من Azure
مثيل الحساب
مدارة بالكامل لا ‏‏نعم‬
دعم اللغة Python, R, Julia, SQL, C#,
Java, Node.js, F#‎
Python وR
نظام تشغيل Ubuntu
Windows
Ubuntu
خيار وحدة معالجة الرسوم مسبق التكوين ‏‏نعم‬ ‏‏نعم‬
توسيع نطاق الخيار ‏‏نعم‬ ‏‏نعم‬
الوصول إلى SSH ‏‏نعم‬ ‏‏نعم‬
الوصول إلى RDP ‏‏نعم‬ لا
مضمّن
دفاتر الملاحظات المستضافة
لا
(ضرورة التكوين الإضافي)
‏‏نعم‬
تسجيل الدخول الأحادي المدمج لا
(ضرورة التكوين الإضافي)
‏‏نعم‬
التعاون المدمج لا ‏‏نعم‬
الأدوات المثبتة مسبقا Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop، SSMS،
Microsoft Office 365, Apache Drill
Jupyter (مختبر)

نماذج حالات استخدام عميل DSVM

التجريب والتقييم على المدى القصير

يمكن ل DSVM تقييم أدوات علم البيانات الجديدة أو تعلمها. جرب بعض العينات والإرشادات التفصيلية المنشورة.

التعلّم العميق باستخدام وحدات معالجة الرسومات GPU

في DSVM، يمكن لنماذج التدريب الخاصة بك استخدام خوارزميات التعلم العميق على الأجهزة المستندة إلى وحدة معالجة الرسومات (GPU). إذا استفدت من قدرات تحجيم الجهاز الظاهري للنظام الأساسي Azure، فإن DSVM يساعدك على رافعة الأجهزة المستندة إلى وحدة معالجة الرسومات في السحابة، وفقا لاحتياجاتك. يمكنك التبديل إلى جهاز ظاهري يستند إلى وحدة معالجة الرسومات عند تدريب نماذج كبيرة، أو عندما تحتاج إلى حسابات عالية السرعة أثناء الاحتفاظ بنفس قرص نظام التشغيل. يمكنك اختيار أي من وحدات SKU للجهاز الظاهري التي تدعم GPU من السلسلة N مع DSVM. لا تدعم حسابات Azure المجانية وحدات SKU للجهاز الظاهري التي تدعم وحدة معالجة الرسومات.

يأتي DSVM لإصدار Windows مثبتا مسبقا مع برامج تشغيل GPU وأطر العمل وإصدارات GPU من أطر التعلم العميق. على إصدارات Linux، يتم تمكين التعلم العميق على وحدات معالجة الرسومات على الجهاز الافتراضي لعلوم البيانات لـ Ubuntu.

يمكنك أيضا نشر إصدارات Ubuntu أو Windows DSVM على جهاز ظاهري Azure لا يستند إلى وحدات معالجة الرسومات. في هذه الحالة، تعود جميع أطر التعلم العميق إلى وضع وحدة المعالجة المركزية.

تعرف على المزيد حول التعلم العميق المتاح وأطر الذكاء الاصطناعي.

التدريب والتعليم على علم البيانات

عادةً ما يوفر المدربون والمعلمون في المؤسسة الذين يقومون بتدريس فصول علم البيانات صورة جهاز ظاهري. تضمن الصورة أن الطلاب لديهم إعداد متناسق وأن العينات تعمل بشكل متوقع.

ينشئ DSVM بيئة عند الطلب مع إعداد متسق، لتسهيل تحديات الدعم وعدم التوافق. وفي الحالات التي تحتاج فيها هذه البيئات إلى إنشائها بشكل متكرر، خاصة لفصول التدريب القصيرة، تستفيد بشكل كبير.

ما الذي يتضمنه DSVM؟

لمزيد من المعلومات، راجع هذه القائمة الكاملة من الأدوات على كل من Windows وLinux DSVMs.

الخطوات التالية

لمزيد من المعلومات، تفضل بزيارة هذه الموارد: