قص القيم
توضح هذه المقالة أحد مكونات Azure التعلم الآلي المصمم.
استخدم مكون قيم القصاصة لتحديد قيم البيانات التي تزيد عن عتبة محددة أو تحتها واستبدالها اختياريا بمتوسط أو ثابت أو قيمة بديلة أخرى.
يمكنك توصيل المكون بمجموعة بيانات تحتوي على الأرقام التي تريد قصها، واختيار الأعمدة للعمل معها، ثم تعيين عتبة أو نطاق من القيم، وطريقة بديلة. يمكن للمكون إخراج إما النتائج فقط، أو القيم التي تم تغييرها الملحقة بمجموعة البيانات الأصلية.
كيفية تكوين قيم القصاصة
قبل البدء، حدد الأعمدة التي تريد قصها والطريقة التي تريد استخدامها. نوصي باختبار أي طريقة قطع على مجموعة فرعية صغيرة من البيانات أولا.
يطبق المكون نفس المعايير وطريقة الاستبدال على كافة الأعمدة التي تقوم بتضمينها في التحديد. لذلك، تأكد من استبعاد الأعمدة التي لا تريد تغييرها.
إذا كنت بحاجة إلى تطبيق أساليب القطع أو معايير مختلفة على بعض الأعمدة، فيجب عليك استخدام مثيل جديد من قيم القصاصة لكل مجموعة من الأعمدة المشابهة.
أضف مكون Clip Values إلى خط الأنابيب الخاص بك وقم بتوصيله بمجموعة البيانات التي تريد تعديلها. يمكنك العثور على هذا المكون ضمن تحويل البيانات، في الفئة القياس والتصغير .
في قائمة الأعمدة، استخدم محدد الأعمدة لاختيار الأعمدة التي سيتم تطبيق قيم القصاصة عليها.
بالنسبة إلى مجموعة العتبات، اختر أحد الخيارات التالية من القائمة المنسدلة. تحدد هذه الخيارات كيفية تعيين الحدود العلوية والسفلية للقيم المقبولة مقابل القيم التي يجب قطعها.
ClipPeaks: عندما تقوم بقص القيم حسب القمم، فإنك تحدد حدا أعلى فقط. يتم استبدال القيم الأكبر من قيمة الحدود هذه.
ClipSubpeaks: عندما تقوم بقص القيم حسب القمم الفرعية، فإنك تحدد حدا أدنى فقط. يتم استبدال القيم التي تقل عن تلك القيمة الحدية.
ClipPeaksAndSubpeaks: عندما تقوم بقص القيم حسب القمم والقمم الفرعية، يمكنك تحديد كل من الحدود العلوية والسفلية. يتم استبدال القيم الموجودة خارج هذا النطاق. لا يتم تغيير القيم التي تطابق قيم الحدود.
استنادا إلى اختيارك في الخطوة السابقة، يمكنك تعيين قيم الحد التالية:
- الحد الأدنى : يتم عرضه فقط إذا اخترت ClipSubPeaks
- الحد الأعلى: يتم عرضه فقط إذا اخترت ClipPeaks
- العتبة: يتم عرضها فقط إذا اخترت ClipPeaksAndSubPeaks
لكل نوع عتبة، اختر إما ثابت أو نسبة مئوية.
إذا قمت بتحديد ثابت، فاكتب القيمة القصوى أو الدنيا في مربع النص. على سبيل المثال، افترض أنك تعرف أن القيمة 999 تم استخدامها كقيمة عنصر نائب. يمكنك اختيار ثابت للعتبة العليا، واكتب 999 في القيمة الثابتة للعتبة العليا.
إذا اخترت النسبة المئوية، فإنك تقيد قيم الأعمدة إلى نطاق نسبة مئوية.
على سبيل المثال، افترض أنك تريد الاحتفاظ بالقيم فقط في النطاق المئوي 10-80، واستبدال جميع القيم الأخرى. يمكنك اختيار النسبة المئوية، ثم اكتب 10 لقيمة النسبة المئوية للعتبة الأدنى، واكتب 80 لقيمة النسبة المئوية للعتبة العليا.
راجع القسم الخاص بالنسب المئوية للحصول على بعض الأمثلة حول كيفية استخدام نطاقات النسب المئوية.
تعريف قيمة بديلة.
تعتبر الأرقام التي تتطابق تماما مع الحدود التي حددتها داخل نطاق القيم المسموح به، وبالتالي لا يتم استبدالها. يتم استبدال كافة الأرقام التي تقع خارج النطاق المحدد بالقيمة البديلة.
- استبدال القيمة للذروة: يحدد القيمة لتحل محل جميع قيم الأعمدة التي تكون أكبر من الحد الأدنى المحدد.
- استبدال القيمة للقمم الفرعية: يعرف القيمة المراد استخدامها كبديل لجميع قيم الأعمدة الأقل من العتبة المحددة.
- إذا كنت تستخدم الخيار ClipPeaksAndSubpeaks ، فيمكنك تحديد قيم استبدال منفصلة للقيم المقطوعة العلوية والسفلية.
يتم دعم قيم الاستبدال التالية:
العتبة: تستبدل القيم المقطوعة بقيمة العتبة المحددة.
الوسط: يستبدل القيم المقطوعة بمتوسط قيم العمود. يتم حساب المتوسط قبل قص القيم.
الوسيط: يستبدل القيم المقطوعة بمتوسط قيم العمود. يتم حساب الوسيط قبل قص القيم.
مفقود. يستبدل القيم المقطوعة بالقيمة المفقودة (الفارغة).
إضافة أعمدة مؤشرات: حدد هذا الخيار إذا كنت تريد إنشاء عمود جديد يخبرك بما إذا كانت عملية القطع المحددة مطبقة على البيانات الموجودة في هذا الصف أم لا. يكون هذا الخيار مفيدا عند اختبار مجموعة جديدة من قيم القطع والاستبدال.
علامة الكتابة فوق الصفحة: حدد الطريقة التي تريد بها إنشاء القيم الجديدة. بشكل افتراضي، تقوم قيم القصاصة بإنشاء عمود جديد مع اقتطاع قيم الذروة إلى العتبة المطلوبة. القيم الجديدة تحل محل العمود الأصلي.
للاحتفاظ بالعمود الأصلي وإضافة عمود جديد بالقيم المقطوعة، قم بإلغاء تحديد هذا الخيار.
إرسال المسار.
انقر بزر الماوس الأيمن فوق مكون قيم القصاصة وحدد تصور أو حدد المكون وانتقل إلى علامة التبويب المخرجات في اللوحة اليمنى ، وانقر فوق رمز الرسم البياني في مخرجات المنفذ ، لمراجعة القيم والتأكد من أن عملية القطع تلبي توقعاتك.
أمثلة للقص باستخدام النسب المئوية
لفهم كيفية عمل القطع حسب النسب المئوية، فكر في مجموعة بيانات تحتوي على 10 صفوف، والتي تحتوي على مثيل واحد لكل من القيم 1-10.
إذا كنت تستخدم النسبة المئوية كعتبة عليا، عند قيمة النسبة المئوية 90، يجب أن يكون 90 بالمائة من جميع القيم في مجموعة البيانات أقل من تلك القيمة.
إذا كنت تستخدم النسبة المئوية كعتبة أدنى، عند قيمة النسبة المئوية العاشرة، يجب أن يكون 10 بالمائة من جميع القيم في مجموعة البيانات أقل من تلك القيمة.
بالنسبة إلى مجموعة العتبات، اختر ClipPeaksAndSubPeaks.
بالنسبة إلى العتبة العليا، اختر النسبة المئوية، وبالنسبة للرقم المئوي، اكتب 90.
بالنسبة إلى قيمة الاستبدال العلوي، اختر القيمة المفقودة.
بالنسبة إلى الحد الأدنى ، اختر النسبة المئوية ، وبالنسبة للرقم المئوي ، اكتب 10.
بالنسبة إلى قيمة بديلة أقل، اختر القيمة المفقودة.
قم بإلغاء تحديد الخيار الكتابة فوق العلامة، وحدد الخيار، إضافة عمود المؤشر.
جرب الآن نفس خط الأنابيب باستخدام 60 كعتبة النسبة المئوية العليا و 30 كعتبة النسبة المئوية الأدنى ، واستخدم قيمة العتبة كقيمة استبدال. ويقارن الجدول التالي بين هاتين النتيجتين:
استبدال مع مفقود ؛ العتبة العليا = 90; العتبة الدنيا = 20
يستعاض عنها بالعتبة؛ النسبة المئوية العليا = 60 ؛ النسبة المئوية الأقل = 40
| البيانات الأصلية | استبدال مع مفقود | استبدال مع عتبة |
|---|---|---|
| 1 2 3 4 5 6 7 8 9 10 |
صواب صواب 3 ، خطأ 4 ، خطأ 5 ، خطأ 6 ، خطأ 7 ، خطأ 8 ، خطأ 9 ، خطأ صواب |
4 ، صحيح 4 ، صحيح 4 ، صحيح 4 ، صحيح 5 ، خطأ 6 ، خطأ 7 ، صحيح 7 ، صحيح 7 ، صحيح 7 ، صحيح |
الخطوات التالية
راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.