تحويل الصورة الأولي

توضح هذه المقالة كيفية استخدام مكون Init Image Transformation في مصمم Azure التعلم الآلي، لتهيئة تحويل الصورة لتحديد الطريقة التي تريد بها تحويل الصورة.

كيفية تكوين تحويل صورة Init

  1. أضف مكون Init Image Transformation إلى خط الأنابيب الخاص بك في المصمم.

  2. لتغيير الحجم، حدد ما إذا كنت تريد تغيير حجم صورة PIL المدخلة إلى الحجم المحدد. إذا اخترت "True" ، فيمكنك تحديد حجم صورة الإخراج المطلوب في الحجم ، افتراضيا 256.

  3. بالنسبة إلى الاقتصاص في المركز، حدد ما إذا كنت تريد اقتصاص صورة PIL المعطاة في المنتصف. إذا اخترت "True" ، فيمكنك تحديد حجم صورة الإخراج المطلوب للاقتصاص في حجم الاقتصاص ، افتراضيا 224.

  4. بالنسبة إلى اللوحة، حدد ما إذا كنت تريد وضع صورة PIL المعطاة من جميع الجوانب مع قيمة اللوحة 0. إذا اخترت "True" ، فيمكنك تحديد الحشو (عدد وحدات البكسل المراد إضافتها) على كل حد في الحشو.

  5. بالنسبة لاهتزاز اللون، حدد ما إذا كنت تريد تغيير سطوع الصورة وتباينها وتشبعها بشكل عشوائي.

  6. بالنسبة إلى تدرج الرمادي، حدد ما إذا كنت تريد تحويل الصورة إلى درجات رمادية.

  7. بالنسبة إلى الاقتصاص العشوائي الذي تم تغيير حجمه، حدد ما إذا كنت تريد اقتصاص صورة PIL المعينة إلى الحجم العشوائي ونسبة العرض إلى الارتفاع. يتم إجراء اقتصاص بحجم عشوائي (يتراوح من 0.08 إلى 1.0) من الحجم الأصلي ونسبة عرض إلى ارتفاع عشوائية (تتراوح من 3/4 إلى 4/3) من نسبة العرض إلى الارتفاع الأصلية. يتم أخيرا تغيير حجم هذا المحصول إلى حجم معين. يستخدم هذا عادة في تدريب شبكات Inception. إذا اخترت "True" ، فيمكنك تحديد حجم الإخراج المتوقع لكل حافة في الحجم العشوائي ، افتراضيا 256.

  8. بالنسبة للاقتصاص العشوائي، حدد ما إذا كنت تريد اقتصاص صورة PIL معينة في موقع عشوائي. إذا اخترت "True" ، فيمكنك تحديد حجم الإخراج المطلوب للاقتصاص في حجم الاقتصاص العشوائي ، افتراضيا 224.

  9. بالنسبة للقلب الأفقي العشوائي، حدد ما إذا كنت تريد قلب صورة PIL المعطاة أفقيا بشكل عشوائي مع احتمال 0.5.

  10. بالنسبة للقلب الرأسي العشوائي، حدد ما إذا كنت تريد قلب صورة PIL المعطاة عموديا بشكل عشوائي مع احتمال 0.5.

  11. بالنسبة للتدوير العشوائي، حدد ما إذا كنت تريد تدوير الصورة بزاوية. إذا اخترت "True" ، فيمكنك التحديد في نطاق الدرجات عن طريق تعيين درجات دوران عشوائية ، مما يعني (-degrees ، +degrees) ، افتراضيا 0.

  12. بالنسبة إلى Random affine، حدد ما إذا كنت تريد تحويل affine عشوائي لثابت مركز حفظ الصورة. إذا اخترت "True" ، فيمكنك التحديد في نطاق الدرجات للتحديد منها في درجات affine العشوائية ، مما يعني (-degrees ، + degrees) ، افتراضيا 0.

  13. بالنسبة للتدرج الرمادي العشوائي، حدد ما إذا كنت تريد تحويل الصورة عشوائيا إلى تدرج رمادي مع احتمال 0.1.

  14. بالنسبة للمنظور العشوائي، حدد ما إذا كنت تريد إجراء تحويل المنظور لصورة PIL المعطاة بشكل عشوائي مع احتمال 0.5.

  15. الاتصال إلى تطبيق مكون تحويل الصورة، لتطبيق التحويل المحدد أعلاه على مجموعة بيانات صورة الإدخال.

  16. إرسال المسار.

النتائج

بعد اكتمال التحويل، يمكنك العثور على الصور المحولة في مخرجات مكون تطبيق تحويل الصورة .

ملاحظات فنية

ارجع إلى https://pytorch.org/vision/stable/transforms.html لمزيد من المعلومات حول تحويل الصورة.

معلمات المكونات

الاسم النطاق النوع افتراضي الوصف
تغيير حجم أي منطقي صواب تغيير حجم صورة PIL المدخلة إلى الحجم المحدد
الحجم >=1 عدد صحيح 256 تحديد حجم الإخراج المطلوب
مركز المحاصيل أي منطقي صواب يقص صورة PIL المعطاة في الوسط
حجم المحاصيل >=1 عدد صحيح 224 تحديد حجم الإخراج المطلوب للمحصول
لوحه أي منطقي خطأ لوحة صورة PIL المعطاة من جميع الجوانب مع قيمة "اللوحة" المعطاة
الحشو >=0 عدد صحيح 0 الحشو على كل حدود
توتر اللون أي منطقي خطأ تغيير سطوع الصورة وتباينها وتشبعها بشكل عشوائي
تدرج الرمادي أي منطقي خطأ تحويل الصورة إلى تدرج رمادي
محصول عشوائي تم تغيير حجمه أي منطقي خطأ اقتصاص صورة PIL المعطاة إلى الحجم العشوائي ونسبة العرض إلى الارتفاع
حجم عشوائي >=1 عدد صحيح 256 حجم الإخراج المتوقع لكل حافة
محصول عشوائي أي منطقي خطأ اقتصاص صورة PIL المعطاة في موقع عشوائي
حجم المحاصيل العشوائية >=1 عدد صحيح 224 حجم الناتج المطلوب للمحصول
الوجه الأفقي العشوائي أي منطقي صواب اقلب صورة PIL المعطاة أفقيا بشكل عشوائي مع احتمال معين
الوجه العمودي العشوائي أي منطقي خطأ اقلب صورة PIL المعطاة عموديا بشكل عشوائي مع احتمال معين
الدوران العشوائي أي منطقي خطأ تدوير الصورة بزاوية
درجات الدوران العشوائي [0,180] عدد صحيح 0 نطاق الدرجات للاختيار من بينها
أفين عشوائي أي منطقي خطأ تحويل عشوائي affine للصورة الحفاظ على مركز ثابت
درجات أففين عشوائية [0,180] عدد صحيح 0 نطاق الدرجات للاختيار من بينها
تدرج رمادي عشوائي أي منطقي خطأ تحويل الصورة عشوائيا إلى تدرج رمادي مع احتمال 0.1
منظور عشوائي أي منطقي خطأ ينفذ تحويل المنظور لصورة PIL المعطاة بشكل عشوائي مع احتمال 0.5
محو عشوائي أي منطقي خطأ يختار عشوائيا منطقة مستطيلة في صورة ويمحو بيكسلات الاحتمال 0.5

المخرجات

الاسم النوع الوصف
تحويل صورة الإخراج دليل التحول تحويل صورة الإخراج التي يمكن توصيلها بمكون تطبيق تحويل الصورة .

الخطوات التالية

راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.