كيفية تحسين نموذج Custom Vision الخاص بك

مقالة
02/14/2024

في هذا الدليل، ستتعلم كيفية تحسين جودة نموذج الرؤية المخصصة. تعتمد جودة المصنف أو كاشف الكائنات على كمية البيانات المسماة التي تقدمها وجودتها وتنوعها ومدى توازن مجموعة البيانات الإجمالية. يحتوي النموذج الجيد على مجموعة بيانات تدريب متوازنة تمثل ما سيتم تقديمه إليه. عملية بناء مثل هذا النموذج تكرارية. من المتداول أن تأخذ بضع جولات من التدريب للوصول إلى النتائج المتوقعة.

ما يلي هو نمط عام لمساعدتك في تدريب نموذج أكثر دقة:

تدريب الجولة الأولى
إضافة المزيد من الصور وبيانات التوازن؛ إعادة التدريب
إضافة صور ذات خلفية متفاوتة، وإضاءة، وحجم العنصر، وزاوية الكاميرا، والأسلوب؛ إعادة التدريب
استخدام صورة (صور) جديدة لاختبار التنبؤ
تعديل بيانات التدريب الموجودة وفقاً لنتائج التنبؤ

منع الإفراط في جمع البيانات

في بعض الأحيان، سيتعلم النموذج إجراء تنبؤات بناءً على الخصائص التعسفية التي تشترك فيها صورك. على سبيل المثال، إذا كنت تنشئ مصنفاً للتفاح مقابل الحمضيات، واستخدمت صوراً لتفاح في أيدي وحمضيات على أطباق بيضاء، فقد يعطي المصنف أهمية غير ضرورية للأيدي مقابل الأطباق، بدلاً من التفاح مقابل الحمضيات.

لتصحيح هذه المشكلة، قم بتوفير صور بزوايا وخلفيات وأحجام مختلفة ومجموعات وأشكال أخرى مختلفة. الأقسام التالية تتوسع في هذه المفاهيم.

كمية البيانات

عدد صور التدريب هو العامل الأكثر أهمية لمجموعة البيانات الخاصة بك. نوصي باستخدام ما لا يقل عن 50 صورة لكل تصنيف كنقطة بداية. مع وجود عدد أقل من الصور، هناك خطر أكبر من التخصيص، ورغم أن أرقام الأداء الخاصة بك قد تشير إلى جودة جيدة، فقد يعاني نموذجك من البيانات الواقعية.

توازن البيانات

من المهم أيضاً مراعاة الكميات النسبية لبيانات التدريب الخاصة بك. على سبيل المثال، يؤدي استخدام 500 صورة لملصق واحد و50 صورة لملصق آخر إلى مجموعة بيانات تدريب غير متوازنة. سيؤدي ذلك إلى أن يكون النموذج أكثر دقة في توقع تسمية واحدة عن أخرى. من المحتمل أن ترى نتائج أفضل إذا حافظت على نسبة 1: 2 على الأقل بين الملصق الذي يحتوي على أقل عدد من الصور والتسمية التي تحتوي على أكبر عدد من الصور. على سبيل المثال، إذا كان الملصق الذي يحتوي على أكبر عدد من الصور يحتوي على 500 صورة، يجب أن يحتوي الملصق الذي يحتوي على أقل عدد من الصور على 250 صورة على الأقل للتدريب.

تنوع البيانات

تأكد من استخدام الصور التي تمثل ما سيتم تقديمه إلى المصنف أثناء الاستخدام العادي. خلافاً لذلك، يمكن أن يتعلم نموذجك إجراء تنبؤات بناءً على الخصائص العشوائية التي تشترك فيها صورك. على سبيل المثال، إذا كنت تنشئ مصنفاً للتفاح مقابل الحمضيات، واستخدمت صوراً لتفاح في أيدي وحمضيات على أطباق بيضاء، فقد يعطي المصنف أهمية غير ضرورية للأيدي مقابل الأطباق، بدلاً من التفاح مقابل الحمضيات.

Photo of fruits with unexpected matching.

لتصحيح هذه المشكلة، قم بتضمين مجموعة متنوعة من الصور للتأكد من أن النموذج الخاص بك يمكنه التعميم بشكل جيد. فيما يلي بعض الطرق التي يمكنك من خلالها جعل مجموعة التدريب الخاصة بك أكثر تنوعاً:

الخلفية: قدم صوراً للعنصر الخاص بك أمام خلفيات مختلفة. الصور في السياقات الطبيعية أفضل من الصور الموجودة أمام الخلفيات المحايدة لأنها توفر مزيداً من المعلومات للمصنف.
الإضاءة: قدم صوراً ذات إضاءة متنوعة (أي ملتقطة بفلاش وتعريض ضوئي عالٍ وما إلى ذلك)، خاصةً إذا كانت الصور المستخدمة للتنبؤ بها إضاءة مختلفة. من المفيد أيضاً استخدام الصور ذات التشبع المتنوع وتدرج الألوان والسطوع.
حجم العنصر: قدم صوراً تختلف فيها العناصر من حيث الحجم والعدد (على سبيل المثال، صورة عناقيد الموز ولقطة مقرّبة لموزة واحدة). يساعد التحجيم المختلف المصنف على التعميم بشكل أفضل.
زاوية الكاميرا: قدم صوراً تم التقاطها بزوايا مختلفة للكاميرا. بدلاً من ذلك، إذا كان يجب التقاط جميع صورك بكاميرات ثابتة (مثل كاميرات المراقبة)، فتأكد من تعيين تسمية مختلفة لكل عنصر يحدث بانتظام لتجنب الإفراط في التجهيز - تفسير العناصر غير ذات الصلة (مثل أعمدة الإنارة) على أنها الميزة الرئيسية.
النمط: قدم صوراً لأنماط مختلفة من نفس الفئة (على سبيل المثال، أنواع مختلفة من الفاكهة نفسها). ومع ذلك، إذا كان لديك عناصر ذات أنماط مختلفة تماماً (مثل ميكي ماوس مقابل فأر حقيقي)، فإننا نوصيك بتسميتها كفئات منفصلة لتمثيل ميزاتها المميزة بشكل أفضل.

الصور السلبية (المصنفات فقط)

إذا كنت تستخدم مصنف صور، فقد تحتاج إلى إضافة عينات سلبية للمساعدة في جعل المصنف أكثر دقة. العينات السلبية هي صور لا تتطابق مع أي من العلامات الأخرى. عند تحميل هذه الصور، قم بتطبيق التصنيف الخاص Negative عليها.

تتعامل أجهزة الكشف عن العناصر مع العينات السلبية تلقائياً، لأن أي مناطق صورة خارج المربعات المحيطة المرسومة تعد سلبية.

إشعار

تدعم خدمة Custom Vision بعض معالجة الصور السالبة التلقائية. على سبيل المثال، إذا كنت تقوم ببناء مصنف عنب مقابل موز وإرسال صورة حذاء للتنبؤ، يجب أن يسجل المصنف تلك الصورة بالقرب من 0% لكل من العنب والموز.

من ناحية أخرى، في الحالات التي تكون فيها الصور السلبية مجرد اختلاف للصور المستخدمة في التدريب، فمن المحتمل أن يصنف النموذج الصور السلبية على أنها فئة مصنفة بسبب أوجه التشابه الكبيرة. على سبيل المثال، إذا كان لديك مصنف برتقال مقابل جريب فروت، وقمت بإطعام صورة كلمنتاين، فقد يسجل الكلمنتاين على أنه برتقالة لأن العديد من ميزات الكلمنتاين تشبه تلك الموجودة في البرتقال. إذا كانت صورك السلبية من هذا النوع، نوصيك بإنشاء علامة إضافية واحدة أو أكثر (مثل أخرى) وتسمية الصور السلبية بهذه العلامة أثناء التدريب للسماح للنموذج بالتمييز بشكل أفضل بين هذه الفئات.

الانسداد والاقتطاع (أجهزة الكشف عن العناصر فقط)

إذا كنت تريد أن يكتشف كاشف العناصر الخاص بك الأشياء المقتطعة (العناصر المقتطعة جزئياً من الصورة) أو العناصر المحجوبة (العناصر التي تم حظرها جزئياً بواسطة عناصر أخرى في الصورة)، فستحتاج إلى تضمين صور التدريب التي تغطي تلك الحالات.

إشعار

لا يجب الخلط بين قضية العناصر التي تسدها عناصر أخرى وبين Overlap Threshold، وهي معلمة لتقييم أداء النموذج. يتعامل شريط التمرير Overlap Threshold في موقع Custom Vision مع مقدار تداخل مربع الإحاطة المتوقع مع مربع الإحاطة الحقيقي حتى يتم اعتباره صحيحاً.

استخدام صور التنبؤ لمزيد من التدريب

عند استخدام النموذج أو اختباره عن طريق إرسال الصور إلى نقطة نهاية التنبؤ، تقوم خدمة Custom Vision بتخزين تلك الصور. يمكنك بعد ذلك استخدامها لتحسين النموذج.

لعرض الصور المرسلة إلى النموذج، افتح Custom Vision web page، وانتقل إلى مشروعك، وحدد علامة التبويب Predictions. تُظهر طريقة العرض الافتراضية صوراً من التكرار الحالي. يمكنك استخدام القائمة المنسدلة Iteration لعرض الصور التي تم إرسالها أثناء التكرارات السابقة.
مرر مؤشر الماوس فوق صورة لمشاهدة العلامات التي تنبأ بها النموذج. يتم فرز الصور بحيث يتم سرد الصور التي يمكنها تحقيق أكبر قدر من التحسينات على النموذج في الأعلى. لاستخدام طريقة فرز مختلفة، حدد تحديداً في قسم Sort.

لإضافة صورة إلى بيانات التدريب الحالية الخاصة بك، حدد الصورة، وقم بتعيين العلامة (العلامات) الصحيحة، ثم حدد Save and close. ستتم إزالة الصورة من Predictions وإضافتها إلى مجموعة صور التدريب. يمكنك عرضها عن طريق تحديد علامة التبويب Training Images.
ثم استخدم الزر Train لإعادة تدريب النموذج.

فحص التنبؤات بصرياً

لفحص تنبؤات الصور، انتقل إلى علامة التبويب Training Images، وحدد تكرار التدريب السابق في القائمة المنسدلة Iteration، وحدد علامة واحدة أو أكثر ضمن قسم Tags. يجب أن يعرض العرض الآن مربعاً أحمر حول كل صورة فشل النموذج في التنبؤ بالعلامة المحددة بشكل صحيح.

Image of the iteration history

في بعض الأحيان، يمكن للفحص البصري تحديد الأنماط التي يمكنك تصحيحها بعد ذلك عن طريق إضافة المزيد من بيانات التدريب أو تعديل بيانات التدريب الحالية. على سبيل المثال، قد يصنف مصنف التفاح مقابل الليمون بشكل غير صحيح جميع التفاح الأخضر على أنه ليمون. يمكنك بعد ذلك تصحيح هذه المشكلة عن طريق إضافة وتوفير بيانات التدريب التي تحتوي على صور مميزة للتفاح الأخضر.

الخطوات التالية

في هذا الدليل، تعلمت العديد من التقنيات لجعل نموذج تصنيف الصورة المخصص أو نموذج كاشف العناصر أكثر دقة. بعد ذلك، تعرف على كيفية اختبار الصور برمجياً عن طريق إرسالها إلى Prediction API.

استخدام واجهة برمجة تطبيقات التنبؤ

Share via