Gesichtserkennung und -attributeFace detection and attributes

Dieser Artikel erläutert die Konzepte der Gesichtserkennung und der Attributdaten für Gesichter.This article explains the concepts of face detection and face attribute data. Bei der Gesichtserkennung werden menschliche Gesichter in einem Bild gesucht und optional verschiedene Arten von gesichtsbezogenen Daten zurückgegeben.Face detection is the action of locating human faces in an image and optionally returning different kinds of face-related data.

Sie verwenden den Vorgang Face – Detect, um Gesichter in einem Bild zu erkennen.You use the Face - Detect operation to detect faces in an image. Jedes erkannte Gesicht entspricht mindestens einem faceRectangle-Feld in der Antwort.At a minimum, each detected face corresponds to a faceRectangle field in the response. Dieser Satz von Pixelkoordinaten für links, oben, Breite und Höhe markieren das erkannte Gesicht.This set of pixel coordinates for the left, top, width, and height mark the located face. Mithilfe dieser Koordinaten finden Sie die Position des Gesichts und seine Größe.Using these coordinates, you can get the location of the face and its size. In der API-Antwort werden Gesichter in Reihenfolge nach Größe – vom größten zum kleinsten Gesicht – aufgeführt.In the API response, faces are listed in size order from largest to smallest.

Gesichts-IDFace ID

Die Gesichtserkennungs-ID ist eine Zeichenfolge mit dem eindeutigen Bezeichner für jedes erkannte Gesicht in einem Bild.The face ID is a unique identifier string for each detected face in an image. Sie können eine Gesichtserkennungs-ID in Ihrem API-Aufruf Face – Detect anfordern.You can request a face ID in your Face - Detect API call.

GesichtszügeFace landmarks

Gesichtsmerkmale bestehen aus mehreren einfach zu findenden Punkten im Gesicht. Beispiel sind die Pupillen oder die Nasenspitze.Face landmarks are a set of easy-to-find points on a face, such as the pupils or the tip of the nose. Standardmäßig sind 27 Bezugspunkte vordefiniert.By default, there are 27 predefined landmark points. Die folgende Abbildung zeigt alle 27 Punkte:The following figure shows all 27 points:

Abbildung eines Gesichts mit allen 27 beschrifteten Gesichtsmerkmalpunkten

Die Koordinaten der Punkte werden in Pixel zurückgegeben.The coordinates of the points are returned in units of pixels.

AttributeAttributes

Attribute sind ein Satz von Merkmalen, die optional durch die API Face – Detect erkannt werden können.Attributes are a set of features that can optionally be detected by the Face - Detect API. Die folgenden Attribute können erkannt werden:The following attributes can be detected:

  • Alter:Age. Das geschätzte Alter eines bestimmten Gesichts in Jahren.The estimated age in years of a particular face.

  • Weichzeichnung:Blur. Die Unschärfe des Gesichts im Bild.The blurriness of the face in the image. Dieses Attribut gibt einen Wert zwischen 0 und 1 und eine informelle Bewertung von gering, mittel oder hoch zurück.This attribute returns a value between zero and one and an informal rating of low, medium, or high.

  • Emotionen:Emotion. Eine Liste von Emotionen und deren Erkennungssicherheit für das jeweilige Gesicht.A list of emotions with their detection confidence for the given face. Die Zuverlässigkeitsbewertungen werden normalisiert, und die Bewertungen über alle Emotionen hinweg ergeben eine Summe von eins.Confidence scores are normalized, and the scores across all emotions add up to one. Die zurückgegebenen Emotionen sind Glück, Traurigkeit, Neutralität, Wut, Verachtung, Ekel, Überraschung und Angst.The emotions returned are happiness, sadness, neutral, anger, contempt, disgust, surprise, and fear.

  • Belichtung:Exposure. Die Belichtung des Gesichts im Bild.The exposure of the face in the image. Dieses Attribut gibt einen Wert zwischen 0 und 1 und die informelle Bewertung underExposure, goodExposure oder overExposure zurück.This attribute returns a value between zero and one and an informal rating of underExposure, goodExposure, or overExposure.

  • Gesichtsbehaarung:Facial hair. Das geschätzte Vorhandensein von Gesichtsbehaarung und die Länge für das jeweilige Gesicht.The estimated facial hair presence and the length for the given face.

  • Geschlecht:Gender. Das geschätzte Geschlecht des jeweiligen Gesichts.The estimated gender of the given face. Mögliche Werte sind „male“, „female“ und „genderless“.Possible values are male, female, and genderless.

  • Brille:Glasses. Gibt an, ob das Gesicht eine Brille aufweist.Whether the given face has eyeglasses. Mögliche Werte sind NoGlasses, ReadingGlasses, SunGlasses und SwimmingGoggles.Possible values are NoGlasses, ReadingGlasses, Sunglasses, and Swimming Goggles.

  • Haare:Hair. Die Art der Haare des Gesichts.The hair type of the face. Dieses Attribut zeigt an, ob die Haare sichtbar sind, ob Haarausfall erkannt wurde und welche Farbe die Haare haben.This attribute shows whether the hair is visible, whether baldness is detected, and what hair colors are detected.

  • Kopfhaltung:Head pose. Die Ausrichtung des Gesichts im dreidimensionalen Raum.The face's orientation in 3D space. Dieses Attribut wird durch die Roll-Nick-Gier-Winkel in Grad beschrieben.This attribute is described by the pitch, roll, and yaw angles in degrees. Als Wertebereiche gelten –90 Grad bis 90 Grad, –180 Grad bis 180 Grad bzw. –90 Grad bis 90 Grad.The value ranges are -90 degrees to 90 degrees, -180 degrees to 180 degrees, and -90 degrees to 90 degrees, respectively. Die Winkelzuordnungen sind im folgenden Diagramm dargestellt:See the following diagram for angle mappings:

    Kopf mit Bezeichnungen für Roll-, Nick- und Gierachse

  • Makeup:Makeup. Gibt an, ob das Gesicht Makeup trägt.Whether the face has makeup. Dieses Attribut gibt einen booleschen Wert für eyeMakeup und lipMakeup zurück.This attribute returns a Boolean value for eyeMakeup and lipMakeup.

  • Rauschen:Noise. Visuelle Störungen, die im Gesicht erkannt wurden.The visual noise detected in the face image. Dieses Attribut gibt einen Wert zwischen 0 und 1 und eine informelle Bewertung von gering, mittel oder hoch zurück.This attribute returns a value between zero and one and an informal rating of low, medium, or high.

  • Okklusion:Occlusion. Gibt an, ob Objekte Teile des Gesichts verdecken.Whether there are objects blocking parts of the face. Dieses Attribut gibt einen booleschen Wert für die eyeOccluded, foreheadOccluded und mouthOccluded zurück.This attribute returns a Boolean value for eyeOccluded, foreheadOccluded, and mouthOccluded.

  • Lächeln:Smile. Gibt die Stärke des Lächelns des jeweiligen Gesichts an.The smile expression of the given face. Dieser Wert liegt zwischen 0 (kein Lächeln) und 1 (deutliches Lächeln).This value is between zero for no smile and one for a clear smile.

Wichtig

Gesichtsattribute werden mithilfe statistischer Algorithmen vorhergesagt.Face attributes are predicted through the use of statistical algorithms. Sie sind möglicherweise nicht immer genau.They might not always be accurate. Treffen Sie Entscheidungen auf Grundlage von Attributdaten mit Umsicht.Use caution when you make decisions based on attribute data.

EingabedatenInput data

Anhand der folgenden Tipps können Sie sicherstellen, dass Ihre Eingabebilder möglichst genaue Erkennungsergebnisse liefern:Use the following tips to make sure that your input images give the most accurate detection results:

  • Als Eingabebildformate werden JPEG, PNG, GIF (der erste Frame) und BMP unterstützt.The supported input image formats are JPEG, PNG, GIF for the first frame, and BMP.
  • Die Bilddateien dürfen maximal 4 MB groß sein.The image file size should be no larger than 4 MB.
  • Die erkennbare Gesichtsgröße reicht von 36 x 36 bis 4.096 x 4.096 Pixel.The detectable face size range is 36 x 36 to 4096 x 4096 pixels. Außerhalb dieses Bereichs liegende Gesichter werden nicht erkannt.Faces outside of this range won't be detected.
  • Einige Gesichter können möglicherweise aufgrund technischer Probleme nicht erkannt werden.Some faces might not be detected because of technical challenges. Extreme Gesichtswinkel (Kopfhaltung) oder verdeckte Gesichter (Objekte wie Sonnenbrille oder Hände bedecken Teile des Gesichts) können die Erkennung beeinträchtigen.Extreme face angles (head pose) or face occlusion (objects such as sunglasses or hands that block part of the face) can affect detection. Frontalansichten und nahezu der Frontalansicht entsprechende Ansichten von Gesichtern führen zu den besten Ergebnissen.Frontal and near-frontal faces give the best results.

Wenn Sie Gesichter in einem Videofeed ermitteln möchten, können Sie die Leistung verbessern, indem Sie bestimmte Einstellungen an Ihrer Videokamera anpassen:If you're detecting faces from a video feed, you may be able to improve performance by adjusting certain settings on your video camera:

  • Glättung: Viele Videokameras wenden einen glättenden Effekt an.Smoothing: Many video cameras apply a smoothing effect. Sie sollten diesen deaktivieren, da er einen Weichzeichnungseffekt zwischen den Frames einfügt und damit die Schärfe reduziert.You should turn this off if you can because it creates a blur between frames and reduces clarity.

  • Belichtungszeit: Eine kürzere Belichtungszeit verringert die Anzahl der Bewegungen zwischen den Frames und macht damit die einzelnen Frame deutlicher.Shutter Speed: A faster shutter speed reduces the amount of motion between frames and makes each frame clearer. Es werden Belichtungszeiten von 1/60 Sekunde oder kürzer empfohlen.We recommend shutter speeds of 1/60 second or faster.

  • Verschlusswinkel: Einige Kameras geben anstelle der Belichtungszeit den Verschlusswinkel an.Shutter Angle: Some cameras specify shutter angle instead of shutter speed. Sie sollten nach Möglichkeit einen niedrigeren Verschlusswinkel verwenden.You should use a lower shutter angle if possible. Dies führt zu deutlicheren Videoframes.This will result in clearer video frames.

    Hinweis

    Eine Kamera mit einem niedrigeren Verschlusswinkel nimmt pro Frame weniger Licht auf, sodass das Bild dunkler wird.A camera with a lower shutter angle will receive less light in each frame, so the image will be darker. Sie müssen die beste Einstellung selbst bestimmen.You'll need to determine the right level to use.

Nächste SchritteNext steps

Nachdem Sie nun mit den Konzepten der Gesichtserkennung vertraut sind, erfahren Sie, wie Sie ein Skript schreiben, das Gesichter in einem vorgegebenen Bild erkennt.Now that you're familiar with face detection concepts, learn how to write a script that detects faces in a given image.