الكشف عن الوجه والسمات وبيانات الإدخال

مقالة
04/30/2024

تنبيه

الوصول إلى خدمة Face محدود استنادا إلى معايير الأهلية والاستخدام من أجل دعم مبادئنا الذكاء الاصطناعي المسؤولة. تتوفر خدمة Face فقط للعملاء والشركاء المدارين من Microsoft. استخدم نموذج إدخال التعرف على الوجوه لتقديم طلب للوصول. لمزيد من المعلومات، راجع صفحة Face ذات الوصول المحدود.

هام

يتم التنبؤ بسمات الوجه مـن خلال استخدام الخوارزميات الإحصائية. قد لا تكون دائمًا دقيقة. توخي الحذر عند اتخاذ قرارات استنادًا إلى بيانات السمة. يرجى الامتناع عن استخدام هذه السمات لمكافحة تزييف هوية. بدلا من ذلك، نوصي باستخدام الكشف عن Face Liveness. لمزيد من المعلومات، يرجى الرجوع إلى البرنامج التعليمي: الكشف عن الحياة في الوجوه.

تشرح هذه المقالة مفاهيم الكشف عـن الوجوه وبيانات سمة الوجه. الكشف عن الوجوه هو عملية تحديد موقع الوجوه البشرية في صورة وإرجاع أنواع مختلفة من البيانات المتعلقة بالوجه اختياريًا.

يمكنك استخدام واجهة برمجة التطبيقات Detect للكشف عن الوجوه في صورة. للبدء فـي استخدام واجهة برمجة تطبيقات REST أو SDK للعميل، اتبع التشغيل السريع. أو للحصول على دليل أكثر تعمقًا، راجع استدعاء واجهة برمجة تطبيقات الكشف.

مستطيل الوجه

يتوافق كل وجه تـم اكتشافه مع حقل faceRectangle في الاستجابة. هذه مجموعة مـن إحداثيات البكسل للوجه المكتشف اليسرى والأعلى والعرض والارتفاع. باستخدام هذه الإحداثيات، يمكنك الحصول على موقع الوجه وحجمه. في استجابة واجهة برمجة التطبيقات، يتم سرد الوجوه بترتيب الحجم مـن الأكبر إلى الأصغر.

جرب قدرات الكشف عـن الوجه بسرعة وسهولة باستخدام Vision Studio.

جرب Vision Studio

مُعرف الوجه

مُعرّف الوجه هو سلسلة معرّف فريدة لكل وجه تم اكتشافه في صورة. يتطلب Face ID موافقة وصول محدودة، والتي يمكنك التقدم بطلب للحصول عليها عن طريق ملء نموذج الاستيعاب. لمزيد من المعلومات، راجع صفحة Face ذات الوصول المحدود. يمكنك طلب معرف الوجه في استدعاء Detect API.

معالم الوجه

معالم الوجه هي مجموعة من النقاط التي يسهل العثور عليها على الوجه، مثل حدقة العين أو طرف الأنف. بشكل افتراضي، توجد 27 نقطة معلمة معرفة مسبقًا. يوضح الشكل التالي جميع النقاط الـ 27:

رسم تخطيطي للوجه مع تسمية جميع المعالم الـ 27

يتم إرجاع إحداثيات النقاط بوحدات بكسل.

يحتوي نموذج Detection_03 حاليًا على الكشف عن المعالم الأكثر دقة. معلمات العين والبؤبؤ التي ترجعها دقيقة بما يكفي لتمكين تتبع النظرات للوجه.

السمات

تنبيه

قامت Microsoft بإيقاف قدرات التعرف على الوجه التي يمكن استخدامها لمحاولة استنتاج الحالات العاطفية وسمات الهوية التي، إذا تمت إساءة استخدامها، يمكن أن تخضع الأشخاص للقوالب النمطية أو التمييز أو الحرمان غير العادل من الخدمات. ويشمل ذلك القدرات التي تتنبأ بالعاطفة والجنس والعمر والابتسامة وشعر الوجه والشعر والمكياج. اقرأ المزيد حول هذا القرار هنا .

السمات هي مجموعة من الميزات التي يمكن اكتشافها اختياريا بواسطة Detect API. يمكن الكشف عن السمات التالية:

الملحقات. يشير إلى ما إذا كان الوجه المعطى يحتوي على ملحقات. تعرض هذه السمة الملحقات الممكنة بما في ذلك أغطية الرأس والنظارات والقناع، مع درجة ثقة بين صفر وواحد لكل ملحق.
ضبابية. ضبابية الوجه في الصورة. ترجع هـذه السمة قيمة بين صفر وواحد وتقييم غير رسمي منخفض أو متوسط أو مرتفع.
التعرض. تعرض الوجه فـي الصورة. ترجع هذه السمة قيمة بين صفر وواحد وتقييم غير رسمي لـ underExposure أو goodExposure أو overExposure.
نظارات. في حال كان الوجه المحدد يحتوي على النظارات. القيم المحتملة هي NoGlasses وReadingGlasses وSunglasses وSwimming Goggles.
وضعية الرأس. اتجاه الوجه في مساحة ثلاثية الأبعاد. يتم وصف هذه السمة من خلال زوايا التدحرج والانعراج والميل بالدرجات، والتي يتم تعريفها وفقًا لقاعدة اليد اليمنى. ترتيب ثلاث زوايا هو التدحرج والانعراج والميل، ونطاق قيمة كل زاوية مـن -180 درجة إلى 180 درجة. يتم تقدير الاتجاه ثلاثي الأبعاد للوجه من خلال زوايا التدحرج والانعراج والميل بالترتيب. راجع الرسم التخطيطي التالي لتعيينات الزاوية:

لمزيد من المعلومات حول كيفية استخدام هذه القيم، راجع دليل كيفية وضع الرأس.
قناع. يشير إلى ما إذا كان الوجه يرتدي قناعا. ترجع هذه السمة نوع قناع محتمل وقيمة منطقية للإشارة إلى إذا كان الأنف والفم مشمولين أم لا.
التشويش. التشويش المرئي الذي تم الكشف عنه في صورة الوجه. ترجع هـذه السمة قيمة بين صفر وواحد وتقييم غير رسمي منخفض أو متوسط أو مرتفع.
الانسداد. يشير إلى ما إذا كانت هناك كائنات تمنع أجزاء من الوجه. ترجع هذه السمة قيمة منطقية للعين المغطاة والجبهة المغطاة والفم المسدود.
QualityForRecognition جودة الصورة العامة فيما يتعلق بما إذا كانت الصورة المستخدمة في الكشف ذات جودة كافية لمحاولة التعرف على الوجوه. القيمة هي تصنيف غير رسمي من منخفضة أو متوسطة أو عالية. يوصى بصور "عالية الجودة" فحسب لتسجيل الشخص، ويوصى بجودة "متوسطة" أو أعلى لسيناريوهات تحديد الهوية.

إشعار

يعتمد توفر كل سمة على نموذج الكشف المحدد. تعتمد سمة QualityForRecognition أيضًا على نموذج التعرف، إذ إنه متوفر حاليًا عند استخدام مجموعة من نموذج الكشف detection_01 أو detection_03 فحسب، ونموذج التعرف recognition_03 أو recognition_04.

متطلبات الإدخال

استخدم التلميحات التالية للتأكد من أن صور الإدخال تعطي نتائج الكشف الأكثر دقة:

تنسيقات صورة الإدخال المدعومة هي JPEG وPNG وGIF (الإطار الأول) وBMP.
يجب ألا يزيد حجم ملف الصورة عـن 6 ميغابايت.

الحد الأدنى لحجم الوجه القابل للكشف هو 36 × 36 بكسل فـي صورة لا يزيد حجمها عن 1920 × 1080 بكسل. تحتوي الصور التي يزيد حجمها عن 1920 × 1080 بكسل على حد أدنى لحجم الوجه أكبر نسبيًا. قد يؤدي تقليل حجم الوجه إلى عدم الكشف عن بعض الوجوه، حتى لو كانت أكبر من الحد الأدنى لحجم الوجه القابل للكشف.
الحد الأقصى لحجم الوجه القابل للكشف هـو 4096 × 4096 بكسل.
لن يتم الكشف عن وجوه خارج نطاق الحجم مـن 36 × 36 إلى 4096 × 4096 بكسل.

بيانات الإدخال مع معلومات الاتجاه:

قد تحتوي بعض صور الإدخال بتنسيق JPEG على معلومات الاتجاه في بيانات تعريف تنسيق ملف الصور القابلة للاستبدال (EXIF). إذا كان اتجاه EXIF متوفرا، يتم تدوير الصور تلقائيا إلى الاتجاه الصحيح قبل إرسالها للكشف عن الوجه. يتم تقدير مستطيل الوجه والمعالم ووضع الرأس لكل وجه تم اكتشافه استنادا إلى الصورة التي تم تدويرها.

لعرض مستطيل الوجه والمعالم بشكل صحيح، تحتاج إلى التأكد مـن تدوير الصورة بشكل صحيح. تقوم معظم أدوات تصور الصورة تلقائيا بتدوير الصورة وفقا لاتجاه EXIF الخاص بها بشكل افتراضي. بالنسبة للأدوات الأخرى، قـد تحتاج إلى تطبيق التدوير باستخدام التعليمة البرمجية الخاصة بك. تظهر الأمثلة التالية مستطيل وجه على صورة مستديرة (يسار) وصورة غير مستديرة (يمين).

صورتان للوجه مع دوران وبدونه

إدخال فيديو

إذا كنت تكشف وجوهًا مـن موجز فيديو، فقد تتمكن من تحسين الأداء عن طريق ضبط إعدادات معينة على كاميرا الفيديو:

التجانس: تطبق العديد من كاميرات الفيديو تأثيرًا متجانسًا. يجب إيقاف تشغيل هذا إذا كان بإمكانك ذلك لأنه ينشئ ضبابية بين الإطارات ويقلل مـن الوضوح.
سرعة الغالق: تقلل سرعة الغالق الأسرع من مقدار الحركة بين الإطارات وتجعل كل إطار أكثر وضوحًا. نوصي بسرعات الغالق مـن 1/60 ثانية أو أسرع.
زاوية الغالق: تحدد بعض الكاميرات زاوية الغالق بدلًا من سرعة الغالق. يجب عليك استخدام زاوية غالق أقل إذا كان ذلك ممكنًا. يؤدي هذا إلى إطارات فيديو أكثر وضوحا.

إشعار

ستتلقى الكاميرا ذات زاوية غالق سفلية ضوءًا أقل في كل إطار، لذلك سوف تكون الصورة أغمق. سوف تحتاج إلى تحديد المستوى الصحيح لاستخدامه.

الخطوات التالية

الآن بعد أن أصبحت على دراية بمفاهيم الكشف عـن الوجوه، تعرف على كيفية كتابة برنامج نصي يكشف الوجوه في صورة معينة.

استدعاء واجهة برمجة التطبيقات للكشف

Share via