Yüz algılama ve öznitelikler

Bu makalede yüz algılama ve yüz özniteliği verileri kavramları açıklanmıştır. Yüz algılama, bir görüntüde insan yüzlerini bulma ve isteğe bağlı olarak yüzle ilgili farklı veri türleri döndüren eylemdir.

Bir görüntüde yüzleri algılamak için Yüz - Algılama işlemi kullanırsiniz. Algılanan her yüz en azından yanıtta faceRectangle alanına karşılık gelecektir. Sol, üst, genişlik ve yükseklik için bu piksel koordinatları kümesi, bulunan yüzü işaret eder. Bu koordinatları kullanarak yüzün konumunu ve boyutunu eldeabilirsiniz. API yanıtta yüzler boyut sırasına göre en büyükten en ğe doğru listelenir.

Yüz Kimliği

Yüz Kimliği, bir görüntüde algılanan her yüz için benzersiz bir tanımlayıcı dizesidir. Yüz - Algılama API'si çağrınıza bir yüz kimliği isteğinde bulundurabilirsiniz.

Yüz tanıma yer işaretleri

Yüz yer işaretleri, göz bebekleri veya burun ucu gibi bir yüz üzerinde kolay buluna noktalar kümesidir. Varsayılan olarak önceden tanımlanmış 27 yer işareti noktası vardır. Aşağıdaki şekilde 27 noktanın hepsi gösterir:

27 yer işaretinin de etiketlenmiş olduğu bir yüz diyagramı

Noktaların koordinatları piksel birimleri cinsinden döndürülür.

Öznitelikler

Öznitelikler, Yüz - Algılama API'si tarafından isteğe bağlı olarak algılanabilir bir özellik kümesidir. Aşağıdaki öznitelikler algılanır:

  • Accessories . Verilen yüzün aksesuarlara sahip olup olmadığı. Bu öznitelik, her bir erişimci için sıfır ile bir arasında bir güven puanıyla baş maske, gözlük ve maske gibi olası donatıları döndürür.

  • Yaş . Belirli bir yüzün yaş tahmini yaşı.

  • Gölge . Görüntüde yüzün bulanıklığı. Bu öznitelik sıfır ile bir arasında bir değer ve düşük, orta veya yüksek resmi olmayan bir derecelendirme döndürür.

  • Duygu. Verilen yüz için algılama güveni olan duygu listesi. Güven puanları normalleştirilmiştir ve tüm duygular genelindeki puanlar bire kadar bir puan ekler. Döndürülen duygular mutluluk, hüzün, nötr, nefret, küçümser, iğrenme, sürpriz ve korkudur.

  • Maruz kalma. Görüntüde yüzün açık olduğu. Bu öznitelik sıfır ile bir arasında bir değer ve underExposure, goodExposure veya overExposure derecelendirmesi resmi olmayan bir derecelendirme döndürür.

  • Yüz kılı. Tahmini yüz kılı varlığı ve verilen yüzün uzunluğu.

  • Cinsiyet. Verilen yüzün tahmini cinsiyeti. Olası değerler erkek, kadın ve cinsiyetsiz değerlerdir.

  • Gözlük. Verilen yüzün göz gözlükleri olup olmadığı. Olası değerler No Sunglasses, Reading Sunglasses, Sunglasses ve Yüzerek Geçişler'tir.

  • Kıl . Yüzün kıl türü. Bu öznitelik, kılların görünür olup olmadığını, hangi renklerin algılandığından ve hangi kıl renklerine sahip olduğunu gösterir.

  • Baş pozu. Yüzün 3D alanda yönü. Bu öznitelik, sağ kurala göre tanımlanan derecelerde roll, yaw ve pitch açıları ile açıklanmıştır. Üç açının sırası roll-yaw-pitch'tır ve her açının değer aralığı -180 derece ile 180 derece arasındadır. Yüzün 3D yönü, sırasıyla roll, yaw ve pitch açıları tarafından tahmin edilmektedir. Açı eşlemeleri için aşağıdaki diyagrama bakın:

    Perde, zar ve yaw eksenleri etiketlenmiş bir baş

  • Her zaman için . Yüzün bir şey olup olmadığı. Bu öznitelik, eyeMakeup ve booMakeup için bir Boole değeri döndürür.

  • Maskele. Yüzün maske takıp takmaması. Bu öznitelik olası bir maske türü ve burun ile burunların kaplanmış olup olmadığını belirten bir Boole değeri döndürür.

  • Gürültü. Yüz görüntüsünde algılanan görsel kirliliği. Bu öznitelik sıfır ile bir arasında bir değer ve düşük, orta veya yüksek resmi olmayan bir derecelendirme döndürür.

  • Occlusion. Yüzün parçalarını engelleyen nesneler olup olmadığı. Bu öznitelik eyeOccluded, attributeOccluded ve mouthOccluded için bir Boole değeri döndürür.

  • Gülümseme . Verilen yüzün gülümseme ifadesi. Bu değer, gülümsememek için sıfır ile net bir gülümseme için bir değerdir.

Önemli

Yüz öznitelikleri, istatistiksel algoritmaların kullanımıyla tahmin edilebilir. Bunlar her zaman doğru olmayabilir. Öznitelik verilerine dayalı kararlar aken dikkatli olun.

Giriş verileri

Giriş görüntülerinizi en doğru algılama sonuçlarına sahip olduğundan emin olmak için aşağıdaki ipuçlarını kullanın:

  • Desteklenen giriş görüntüsü biçimleri JPEG, PNG, ilk kare için GIF ve BMP'dir.
  • Görüntü dosyası boyutu 6 MB'den büyük olmalıdır.
  • En küçük algılanabilir yüz boyutu, 1920 x 1080 pikselden büyük bir görüntüde 36 x 36 pikseldir. 1920 x 1080 pikselden büyük görüntülerin yüz boyutu orantılı olarak daha büyüktür. Yüz boyutunun azaltılması, algılanabilir minimum yüz boyutundan büyük olsalar bile bazı yüzlerin algılanmayacak şekilde algılanmayacak şekilde azaltılmasına neden olabilir.
  • Maksimum algılanabilir yüz boyutu 4096 x 4096 pikseldir.
  • 36 x 36 ile 4096 x 4096 piksel boyut aralığının dışındaki yüzler algılanmaz.
  • Teknik zorluklar nedeniyle bazı yüzler algılanamadı. Aşırı yüz açıları (baş pozu) veya yüz tıkanıklığı (güneş gözlüğü veya yüzün bir kısmını engelleyebilecek el gibi nesneler) algılamayı etkileyebilir. Önden ve ön yüzlere yakın yüzler en iyi sonuçları verir.

Yönlendirme bilgileriyle veri girişi:

  • JPEG biçimindeki bazı giriş görüntüleri, Değiştirilebilir görüntü dosyası biçimi (Exif) meta verilerinde yönlendirme bilgileri içerebilir. Exif yönlendirmesi varsa, görüntüler yüz algılama için göndermeden önce otomatik olarak doğru yönlendirmeye döndürülür. Algılanan her yüz için yüz dikdörtgeni, yer işaretleri ve baş pozu, döndürülmüş görüntüye göre tahmin edilir.
  • Yüz dikdörtgenini ve yer simgelerini düzgün bir şekilde görüntülemek için görüntünün doğru döndürülmüş olduğundan emin olun. Görüntü görselleştirme araçlarının çoğu, görüntüyü varsayılan olarak Exif yönüne göre otomatik olarak döndürecek. Diğer araçlar için kendi kodunuzu kullanarak döndürmeyi uygulamanız gerekir. Aşağıdaki örneklerde, döndürülmüş bir görüntüde (sol) bir yüz dikdörtgeni ve döndürülmüş olmayan bir görüntü (sağ) yer alır.

Döndürme/döndürme olmadan iki yüz görüntüleri

Bir video akışından yüz algııyorsanız, video kameranız üzerinde belirli ayarları ayarlayarak performansı geliştirebilirsiniz:

  • Düzgünleştirme: Birçok video kamerası, düzgünleştirme etkisine sahiptir. Çerçeveler arasında bir bulanıklık oluşturduğu ve netliği azaltarak bunu kapatıyorsanız kapatması gerekir.

  • Hız: Daha hızlı bir hız, kareler arasındaki hareket miktarını azaltır ve her kareyi daha net yapar. 1/60 saniye veya daha yüksek hızlar önerilir.

  • Giriş Açısı: Bazı kameralar, hız yerine görüş açısı belirtir. Mümkünse, daha düşük bir perde açısı kullanmanız gerekir. Bu, daha net video çerçevelerine neden olur.

    Not

    Aşağı perde açısı olan bir kamera her karede daha az ışık alır, bu nedenle görüntü daha koyu olur. Kullanılacak doğru düzeyi belirlemeniz gerekir.

Sonraki adımlar

Yüz algılama kavramlarıyla ilgili bilgi sahibi olduğunuza göre, belirli bir görüntüde yüzeyleri algılayan bir komut dosyası yazmayı öğrenin.