تحويل إلى قيم المؤشرات
توضح هذه المقالة أحد مكونات Azure التعلم الآلي المصمم.
استخدم مكون التحويل إلى قيم المؤشرات في مصمم Azure التعلم الآلي لتحويل الأعمدة التي تحتوي على قيم فئوية إلى سلسلة من أعمدة المؤشرات الثنائية.
وينتج عن هذا المكون أيضا تعريف للتحويل المستخدم للتحويل إلى قيم مؤشرات. يمكنك إعادة استخدام هذا التحويل على مجموعات بيانات أخرى لها نفس المخطط، باستخدام مكون تطبيق التحويل .
كيفية تكوين تحويل إلى قيم المؤشرات
ابحث عن التحويل إلى قيم المؤشرات واسحبه إلى مسودة خط الأنابيب. يمكنك العثور على هذا المكون ضمن فئة تحويل البيانات .
ملاحظة
يمكنك استخدام مكون تحرير بيانات التعريف قبل مكون التحويل إلى قيم المؤشرات لوضع علامة على العمود (الأعمدة) الهدف على أنه فئوي.
الاتصال المكون تحويل إلى قيم مؤشرات إلى مجموعة البيانات التي تحتوي على الأعمدة التي تريد تحويلها.
حدد تحرير العمود لاختيار عمود فئوي واحد أو أكثر.
حدد خيار الكتابة فوق الأعمدة الفئوية إذا كنت تريد إخراج الأعمدة المنطقية الجديدة فقط . بشكل افتراضي، يكون هذا الخيار متوقفا عن التشغيل.
تلميح
إذا اخترت خيار الكتابة فوق، فلن يتم حذف العمود المصدر أو تعديله بالفعل. بدلا من ذلك، يتم إنشاء الأعمدة الجديدة وعرضها في مجموعة بيانات المخرجات، ويظل العمود المصدر متوفرا في مساحة العمل. إذا كنت بحاجة إلى رؤية البيانات الأصلية، فيمكنك استخدام مكون إضافة أعمدة في أي وقت لإضافة العمود المصدر مرة أخرى.
إرسال المسار.
النتائج
لنفترض أن لديك عمودا يحتوي على درجات تشير إلى ما إذا كان الخادم لديه احتمال كبير أو متوسط أو منخفض للفشل.
| معرف الخادم | درجة الفشل |
|---|---|
| 10301 | منخفض |
| 10302 | متوسط |
| 10303 | درجة عالية |
عند تطبيق تحويل إلى قيم مؤشرات، يقوم المصمم بتحويل عمود واحد من التسميات إلى أعمدة متعددة تحتوي على قيم منطقية:
| معرف الخادم | درجة الفشل - منخفضة | درجة الفشل - متوسطة | درجة الفشل - عالية |
|---|---|---|---|
| 10301 | 1 | 0 | 0 |
| 10302 | 0 | 1 | 0 |
| 10303 | 0 | 0 | 1 |
إليك كيفية عمل التحويل:
في عمود درجة الفشل الذي يصف المخاطر، لا توجد سوى ثلاث قيم ممكنة (عالية ومتوسطة ومنخفضة)، ولا توجد قيم مفقودة. لذلك ، يتم إنشاء ثلاثة أعمدة جديدة بالضبط.
تتم تسمية أعمدة المؤشرات الجديدة استنادا إلى عناوين الأعمدة وقيم العمود المصدر، باستخدام هذا النمط: <قيمة> بيانات عمود>< المصدر.
يجب أن يكون هناك 1 في عمود مؤشر واحد بالضبط ، و 0 في جميع أعمدة المؤشرات الأخرى لأن كل خادم يمكن أن يكون له تصنيف خطر واحد فقط.
يمكنك الآن استخدام أعمدة المؤشرات الثلاثة كميزات في نموذج التعلم الآلي.
يرجع المكون مخرجين:
- مجموعة بيانات النتائج: مجموعة بيانات تحتوي على أعمدة قيم المؤشرات المحولة. الأعمدة غير المحددة للتنظيف هي أيضا "تمرير".
- تحويل قيم المؤشرات: تحويل بيانات يستخدم للتحويل إلى قيم مؤشرات، يمكن حفظه في مساحة العمل الخاصة بك وتطبيقه على البيانات الجديدة لاحقا.
تطبيق عملية قيم مؤشر محفوظة على بيانات جديدة
إذا كنت بحاجة إلى تكرار عمليات قيم المؤشرات كثيرا، فيمكنك حفظ خطوات معالجة البيانات كتحويل لإعادة استخدامها مع مجموعة البيانات نفسها. هذا مفيد إذا كان يجب عليك إعادة استيراد البيانات التي تحتوي على نفس المخطط ثم تنظيفها بشكل متكرر.
أضف مكون تطبيق التحويل إلى خط الأنابيب الخاص بك.
أضف مجموعة البيانات التي تريد تنظيفها، وقم بتوصيل مجموعة البيانات بمنفذ الإدخال الأيمن.
قم بتوسيع المجموعة " تحويل البيانات" في الجزء الأيمن من المصمم. حدد موقع التحويل المحفوظ واسحبه إلى خط الأنابيب.
الاتصال التحويل المحفوظ إلى منفذ الإدخال الأيسر لتطبيق التحويل.
عند تطبيق تحويل محفوظ، لا يمكنك تحديد الأعمدة المراد تحويلها. وذلك لأنه تم تعريف التحويل وينطبق تلقائيا على أنواع البيانات المحددة في العملية الأصلية.
إرسال المسار.
ملاحظات فنية
يحتوي هذا القسم على تفاصيل التنفيذ والنصائح والإجابات على الأسئلة المتداولة.
نصائح الاستخدام
يمكن تحويل الأعمدة التي تم وضع علامة عليها على أنها فئوية فقط إلى أعمدة مؤشر. إذا رأيت الخطأ التالي، فمن المحتمل أن يكون أحد الأعمدة التي حددتها غير فئوي:
خطأ 0056: العمود الذي يحمل اسم <> العمود غير موجود في فئة مسموح بها.
بشكل افتراضي، تتم معالجة معظم أعمدة السلسلة كميزات سلسلة، لذلك يجب وضع علامة عليها صراحة على أنها فئوية باستخدام تحرير بيانات التعريف.
لا يوجد حد لعدد الأعمدة التي يمكنك تحويلها إلى أعمدة مؤشرات. ومع ذلك، نظرا لأن كل عمود من أعمدة القيم يمكن أن ينتج عنه أعمدة مؤشرات متعددة، فقد تحتاج إلى تحويل ومراجعة عدد قليل من الأعمدة في المرة الواحدة.
إذا كان العمود يحتوي على قيم مفقودة، يتم إنشاء عمود مؤشر منفصل للفئة المفقودة، بهذا الاسم: <عمود> المصدر - مفقود
إذا كان العمود الذي تقوم بتحويله إلى قيم مؤشرات يحتوي على أرقام، فيجب وضع علامة عليها على أنها فئوية مثل أي عمود معالم آخر. بعد القيام بذلك، يتم التعامل مع الأرقام كقيم منفصلة. على سبيل المثال، إذا كان لديك عمود رقمي بقيم MPG تتراوح من 25 إلى 30، إنشاء عمود مؤشر جديد لكل قيمة منفصلة:
Make الطريق السريع ميلا في الغالون -25 الطريق السريع ميلا في الغالون -26 الطريق السريع ميلا في الغالون -27 الطريق السريع ميلا في الغالون -28 الطريق السريع ميلا في الغالون -29 الطريق السريع ميلا في الغالون -30 سيارات كونتوسو 0 0 0 0 0 1 لتجنب إضافة الكثير من الأبعاد إلى مجموعة البيانات الخاصة بك. نوصي أولا بالتحقق من عدد القيم في العمود، وتخزين البيانات أو قياسها كميا بشكل مناسب.
الخطوات التالية
راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.