تحويل إلى مجموعة بيانات
توضح هذه المقالة كيفية استخدام مكون التحويل إلى مجموعة البيانات في Azure التعلم الآلي المصمم لتحويل أية بيانات لخط أنابيب إلى التنسيق الداخلي للمصمم.
التحويل غير مطلوب في معظم الحالات. يقوم Azure التعلم الآلي ضمنيا بتحويل البيانات إلى تنسيق مجموعة البيانات الأصلي الخاص به عند إجراء أي عملية على البيانات.
نوصي بحفظ البيانات في تنسيق مجموعة البيانات إذا كنت قد أجريت نوعا من التطبيع أو التنظيف على مجموعة من البيانات، وتريد التأكد من استخدام التغييرات في خطوط أنابيب أخرى.
ملاحظة
التحويل إلى مجموعة بيانات يغير تنسيق البيانات فقط. لا يحفظ نسخة جديدة من البيانات في مساحة العمل. لحفظ مجموعة البيانات، انقر نقرا مزدوجا فوق منفذ الإخراج، وحدد حفظ كمجموعة بيانات، وأدخل اسما جديدا.
كيفية استخدام تحويل إلى مجموعة بيانات
نوصي باستخدام مكون تحرير بيانات التعريف لإعداد مجموعة البيانات قبل استخدام التحويل إلى مجموعة البيانات. يمكنك إضافة أسماء الأعمدة أو تغييرها وضبط أنواع البيانات وإجراء تغييرات أخرى حسب الحاجة.
أضف مكون التحويل إلى مجموعة البيانات إلى خط الأنابيب الخاص بك. يمكنك العثور على هذا المكون في فئة تحويل البيانات في المصمم.
الاتصال إلى أي مكون يقوم بإخراج مجموعة بيانات.
طالما أن البيانات جدولية، يمكنك تحويلها إلى مجموعة بيانات. يتضمن ذلك البيانات التي تم تحميلها من خلال استيراد البيانات أو البيانات التي تم إنشاؤها من خلال إدخال البيانات يدويا أو مجموعات البيانات المحولة من خلال تطبيق التحويل.
في القائمة المنسدلة إجراء ، أشر إلى ما إذا كنت تريد إجراء أي تنظيف للبيانات قبل حفظ مجموعة البيانات:
لا شيء: استخدم البيانات كما هي.
SetMissingValue: قم بتعيين قيمة معينة إلى قيمة مفقودة في مجموعة البيانات. العنصر النائب الافتراضي هو حرف علامة الاستفهام (؟)، ولكن يمكنك استخدام خيار القيمة المفقودة المخصصة لإدخال قيمة مختلفة. على سبيل المثال، إذا قمت بإدخال Taxi for Custom Missing value، تغيير جميع مثيلات Taxi في مجموعة البيانات إلى القيمة المفقودة.
ReplaceValues: استخدم هذا الخيار لتحديد قيمة دقيقة واحدة ليتم استبدالها بأي قيمة دقيقة أخرى. يمكنك استبدال القيم المفقودة أو القيم المخصصة عن طريق تعيين طريقة الاستبدال :
- مفقود: حدد هذا الخيار لاستبدال القيم المفقودة في مجموعة بيانات الإدخال. بالنسبة إلى القيمة الجديدة، أدخل القيمة لاستبدال القيم المفقودة بها.
- مخصص: حدد هذا الخيار لاستبدال القيم المخصصة في مجموعة بيانات الإدخال. بالنسبة إلى القيمة المخصصة، أدخل القيمة التي تريد البحث عنها. على سبيل المثال، إذا كانت بياناتك تحتوي على السلسلة
obsالمستخدمة كعنصر نائب للقيم المفقودة، فإنك تدخلobs. بالنسبة للقيمة الجديدة، أدخل القيمة الجديدة لاستبدال السلسلة الأصلية بها.
لاحظ أن عملية ReplaceValues تنطبق فقط على التطابقات التامة. على سبيل المثال، لن تتأثر هذه السلاسل:
obs.،obsolete.إرسال المسار.
النتائج
- لحفظ مجموعة البيانات الناتجة باسم جديد، حدد على أيقونة تسجيل مجموعة البيانات ضمن علامة التبويب المخرجات في اللوحة اليمنى من المكون.
ملاحظات فنية
يمكن لأي مكون يأخذ مجموعة بيانات كإدخال أن يأخذ أيضا بيانات في ملف CSV أو ملف TSV. قبل تشغيل أي تعليمات برمجية للمكونات، تتم معالجة المدخلات مسبقا. المعالجة المسبقة تعادل تشغيل مكون التحويل إلى مجموعة البيانات على الإدخال.
لا يمكنك التحويل من تنسيق SVMLight إلى مجموعة بيانات.
عند تحديد عملية استبدال مخصصة، تنطبق عملية البحث والاستبدال على القيم الكاملة. لا يسمح بالمباريات الجزئية. على سبيل المثال، يمكنك استبدال 3 ب -1 أو 33، ولكن لا يمكنك استبدال 3 في رقم مكون من رقمين مثل 35.
بالنسبة لعمليات الاستبدال المخصصة، سيفشل الاستبدال بصمت إذا استخدمت كبديل أي حرف لا يتوافق مع نوع البيانات الحالي للعمود.
الخطوات التالية
راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.