إدخال مكون البيانات يدويا
توضح هذه المقالة مكونا في Azure التعلم الآلي مصمم.
استخدم مكون إدخال البيانات يدويا لإنشاء مجموعة بيانات صغيرة عن طريق كتابة القيم. يمكن أن تحتوي مجموعة البيانات على أعمدة متعددة.
يمكن أن يكون هذا المكون مفيدا في سيناريوهات مثل:
- إنشاء مجموعة صغيرة من القيم للاختبار.
- إنشاء قائمة قصيرة من التسميات.
- كتابة قائمة بأسماء الأعمدة لإدراجها في مجموعة بيانات.
إنشاء مجموعة بيانات
أضف مكون إدخال البيانات يدويا إلى خط الأنابيب الخاص بك. يمكنك العثور على هذا المكون في فئة إدخال البيانات وإخراجها في Azure التعلم الآلي.
بالنسبة إلى DataFormat، حدد أحد الخيارات التالية. تحدد هذه الخيارات كيفية تحليل البيانات التي تقدمها. تختلف متطلبات كل تنسيق اختلافا كبيرا ، لذا تأكد من قراءة الموضوعات ذات الصلة.
- ARFF: تنسيق ملف علاقة السمة المستخدم بواسطة Weka.
- CSV: تنسيق قيم مفصولة بفواصل. لمزيد من المعلومات، راجع التحويل إلى CSV.
- SVMLight: التنسيق المستخدم من قبل Vowpal Wabbit وأطر التعلم الآلي الأخرى.
- TSV: تنسيق القيم المفصولة بعلامات جدولة.
إذا اخترت تنسيقا ولم تقم بتوفير بيانات تفي بمواصفات التنسيق، يحدث خطأ في وقت التشغيل.
انقر داخل مربع النص البيانات لبدء إدخال البيانات . تتطلب التنسيقات التالية اهتماما خاصا:
CSV: لإنشاء أعمدة متعددة، الصق نصا مفصولا بفواصل، أو اكتب أعمدة متعددة باستخدام الفواصل بين الحقول.
إذا قمت بتحديد خيار HasHeader ، فيمكنك استخدام الصف الأول من القيم كعنوان عمود.
إذا قمت بإلغاء تحديد هذا الخيار، استخدام أسماء الأعمدة (Col1 وCol2 وما إلى ذلك). يمكنك إضافة أسماء أعمدة أو تغييرها لاحقا باستخدام تحرير بيانات التعريف.
TSV: لإنشاء أعمدة متعددة، الصق نصا مفصولا بعلامات جدولة، أو اكتب أعمدة متعددة باستخدام علامات تبويب بين الحقول.
إذا قمت بتحديد خيار HasHeader ، فيمكنك استخدام الصف الأول من القيم كعنوان عمود.
إذا قمت بإلغاء تحديد هذا الخيار، استخدام أسماء الأعمدة (Col1 وCol2 وما إلى ذلك). يمكنك إضافة أسماء أعمدة أو تغييرها لاحقا باستخدام تحرير بيانات التعريف.
ARFF: لصق في ملف تنسيق ARFF موجود. إذا كنت تكتب القيم مباشرة، فتأكد من إضافة حقول الرأس الاختيارية والسمة المطلوبة في بداية البيانات.
على سبيل المثال، يمكن إضافة صفوف الرأس والسمات التالية إلى قائمة بسيطة. سيكون
SampleTextعنوان العمود . لاحظ أن نوع السلسلة غير معتمد.% Title: SampleText.ARFF % Source: Enter Data component @ATTRIBUTE SampleText NUMERIC @DATA \<type first data row here>SVMLight: اكتب القيم أو الصقها باستخدام تنسيق SVMLight.
على سبيل المثال، يمثل النموذج التالي أول سطرين من مجموعة بيانات التبرع بالدم، بتنسيق SVMLight:
# features are [Recency], [Frequency], [Monetary], [Time] 1 1:2 2:50 3:12500 4:98 1 1:0 2:13 3:3250 4:28عند تشغيل المكون "إدخال البيانات يدويا" ، يتم تحويل هذه الأسطر إلى مجموعة بيانات من الأعمدة وقيم الفهرس كما يلي:
كول1 كول2 كول3 كول4 التسميات 0.00016 0.004 0.999961 0.00784 1 0 0.004 0.999955 0.008615 1
حدد المفتاح Enter بعد كل صف، لبدء سطر جديد.
إذا قمت بتحديد Enter عدة مرات لإضافة صفوف زائدة فارغة متعددة، إزالة الصفوف الفارغة أو قصها.
إذا قمت بإنشاء صفوف ذات قيم مفقودة، فيمكنك دائما تصفيتها لاحقا.
الاتصال منفذ الإخراج إلى مكونات أخرى، وقم بتشغيل خط الأنابيب.
لعرض مجموعة البيانات، انقر بزر الماوس الأيمن فوق المكون وحدد تصور.
الخطوات التالية
راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.