Ansiktsavkänning och attribut
I den här artikeln förklaras begreppen ansiktsavkänning och ansiktsattribut. Ansiktsigenkänning är en åtgärd för att hitta ansikten i en bild och eventuellt returnera olika typer av ansiktsrelaterade data.
Du kan använda åtgärden Ansikts – Identifiera för att identifiera ansikten i en bild. Varje identifierat ansikte motsvarar minst ett faceRectangle-fält i svaret. Den här uppsättningen pixelkoordinater för vänster, överkanten, bredden och höjden markerar det placerade ansiktet. Med hjälp av dessa koordinater kan du hämta ansiktets plats och dess storlek. I API-svaret visas ansikten i storleksordning från största till minsta.
Ansikts-ID
Ansikts-ID:t är en unik identifierarsträng för varje identifierat ansikte i en bild. Du kan begära ett ansikts-ID i ditt ansikts-ID – identifiera API-anrop.
Ansiktslandmärken
Ansiktsmärken är en uppsättning lätt att hitta punkter i ett ansikte, till exempel pupiller eller näsa. Som standard finns 27 fördefinierade landmärkespunkter. Följande bild visar alla 27 punkter:

Koordinaterna för punkterna returneras i enheter med bildpunkter.
Den Detection_03 modellen har för närvarande den mest exakta identifieringen av landmärken. Ögon- och elevmärken som returneras är tillräckligt exakta för att aktivera blickspårning av ansiktet.
Attribut
Attribut är en uppsättning funktioner som kan identifieras av API:et Ansikts- och identifiering. Följande attribut kan identifieras:
Tillbehör. Om det givna ansiktet har tillbehör. Det här attributet returnerar möjliga tillbehör, inklusive huvuddräkter, glasögon och mask, med konfidenspoäng mellan noll och ett för varje tillbehör.
Ålder. Beräknad ålder i år för ett visst ansikte.
Oskärpa. Ansiktets suddighet i bilden. Det här attributet returnerar ett värde mellan noll och ett och ett informella omdöme om låg, medel eller hög.
Känslo -. En lista över känslor med deras identifieringsförtroende för det givna ansiktet. Förtroendepoäng normaliseras och poängen för alla känslor är ett. Känslorna som returneras är lycka, sorg, neutral, anger, förakt, avsky, överraskning och rädsla.
Exponering. Ansiktets exponering i bilden. Det här attributet returnerar ett värde mellan noll och ett och en informell klassificering av underExposure, goodExposure eller overExposure.
Ansiktshår. Beräknad ansiktshårsnärvaro och längden för det givna ansiktet.
Kön. Det uppskattade könet för det givna ansiktet. Möjliga värden är män, kvinnor och könlösa.
Glasögon. Om det givna ansiktet har glasögon. Möjliga värden är NoGlasses, ReadingGlasses, Solglasögon och Swimming Goggles.
Behåring. Ansiktets behåringstyp. Det här attributet visar om behåring är synligt, huruvida lösenfärg har identifierats och vilka färger som har identifierats.
Huvudställning. Ansiktets orientering i 3D-utrymme. Det här attributet beskrivs av roll-, yaw- och pitch-vinklarna i grader, som definieras enligt den högra regeln. Ordningen på tre vinklar är roll-yaw-pitch och varje vinkels värdeintervall är från -180 grader till 180 grader. Ansiktets 3D-orientering beräknas av tärnings-, yaw- och pitch-vinklarna i ordning. Se följande diagram för vinkelmappningar:

Iaaa. Om ansiktet har smask. Det här attributet returnerar ett booleskt värde för eyeMakeup ochgatMakeup.
Maskera. Om ansiktet bär en mask. Det här attributet returnerar en möjlig masktyp och ett booleskt värde för att ange om näsa och näsa omfattas.
Brus. Visuellt brus som identifierats i ansiktsbilden. Det här attributet returnerar ett värde mellan noll och ett och ett informella omdöme om låg, medel eller hög.
Ocklusion. Om det finns objekt som blockerar delar av ansiktet. Det här attributet returnerar ett booleskt värde för eyeOccluded,cluded och mouthOccluded.
Leende. Leendeuttrycket för det givna ansiktet. Det här värdet är mellan noll för inget leende och ett för ett tydligt leende.
QualityForRecognition Den övergripande bildkvaliteten angående huruvida bilden som används i identifieringen är av tillräcklig kvalitet för att försöka identifiera ansikten. Värdet är ett informella omdöme om låg, medel eller hög. Endast bilder av "hög" kvalitet rekommenderas för personregistrering, och kvalitet på eller över "medel" rekommenderas för identifieringsscenarier.
Anteckning
Tillgängligheten för varje attribut beror på den angivna identifieringsmodellen. Attributet QualityForRecognition beror också på igenkänningsmodellen, eftersom det för närvarande endast är tillgängligt när du använder en kombination av identifieringsmodell detection_01 eller detection_03 samt recognition_03 eller recognition_04.
Viktigt
Ansiktsattribut förutsägs med hjälp av statistiska algoritmer. De kanske inte alltid är korrekta. Var försiktig när du fattar beslut baserat på attributdata.
Indata
Använd följande tips för att se till att dina indatabilder ger bäst identifieringsresultat:
- De indatabildformat som stöds är JPEG, PNG, GIF (den första bilden), BMP.
- Bildfilens storlek får inte vara större än 6 MB.
- Den minsta detektbara ansiktsstorleken är 36 x 36 bildpunkter i en bild som inte är större än 1 920 x 1 080 bildpunkter. Bilder som är större än 1 920 x 1 080 bildpunkter har en proportionellt större minsta ansiktsstorlek. Om ansiktsstorleken minskar kan det leda till att vissa ansikten inte identifieras, även om de är större än den minsta detektbara ansiktsstorleken.
- Den maximala detektbara ansiktsstorleken är 4 096 x 4 096 bildpunkter.
- Ansikten utanför storleksintervallet 36 x 36 till 4 096 x 4 096 bildpunkter identifieras inte.
- Vissa ansikten kanske inte känns igen på grund av tekniska utmaningar, till exempel:
- Bilder med extrem belysning, till exempel allvarlig bakgrundsbelysning.
- Det finns hinder som blockerar en eller båda ögonen.
- Skillnader i behåringstyp eller ansiktshår.
- Ändringar i ansiktsutseende på grund av ålder.
- Extrema ansiktsuttryck.
Indata med orienteringsinformation:
Vissa indatabilder med JPEG-format kan innehålla orienteringsinformation i exif-metadata (Exchangeable image file format). Om exif-orientering är tillgängligt roteras bilder automatiskt till rätt orientering innan de skickas för ansiktsavkänning. Ansiktsrektangeln, landmärken och huvudställningen för varje identifierat ansikte beräknas baserat på den roterade bilden.
Om du vill visa ansiktsrektangeln och landmärken korrekt måste du se till att bilden roteras korrekt. De flesta bildvisualiseringsverktyg roterar bilden automatiskt enligt exif-orienteringen som standard. För andra verktyg kan du behöva tillämpa rotationen med din egen kod. I följande exempel visas en ansiktsrektangel på en roterad bild (vänster) och en icke-roterad bild (höger).

Videoindata
Om du identifierar ansikten från ett videoflöde kanske du kan förbättra prestandan genom att justera vissa inställningar på videokameran:
Utjämning: Många videokameror har en utjämnande effekt. Du bör inaktivera detta om det går eftersom det skapar en sudd mellan bildrutor och minskar tydligheten.
Speed (Hastighet): En snabbare hastighet på slutaren minskar mängden rörelse mellan bildrutor och gör varje bildruta tydligare. Vi rekommenderar en hastighet på 1/60 sekunder eller snabbare.
Vinkelvinnad: Vissa kameror anger vinkelvinklar i stället för vinkelhastighet. Du bör använda en lägre vinkel om det är möjligt. Detta resulterar i tydligare bildrutor.
Anteckning
En kamera med en lägre vinkel får mindre ljus i varje bildruta, så bilden blir mörkare. Du måste bestämma vilken nivå du ska använda.
Nästa steg
Nu när du är bekant med begreppen för ansiktsavkänning kan du lära dig hur du skriver ett skript som identifierar ansikten i en viss bild.