Objektumészlelés
Az objektumészlelés hasonló a címkézéshez, de az API a képen található minden objektumhoz visszaadja a határolókeret koordinátáit (képpontban). Ha például egy kép egy kutyát, macskát és személyt tartalmaz, az objektumészlelési művelet felsorolja ezeket az objektumokat a képen lévő koordinátákkal. Ezzel a funkcióval feldolgozhatja a képek objektumai közötti kapcsolatokat. Azt is meghatározhatja, hogy ugyanazon objektumnak több példánya van-e egy képen.
Az objektumészlelési függvény címkéket alkalmaz a képen azonosított objektumok vagy élőlények alapján. Nincs formális kapcsolat a címkézési osztályozás és az objektumészlelési osztályozás között. Fogalmi szinten az objektumészlelési függvény csak objektumokat és élőlényeket keres, míg a címkefüggvény olyan környezetfüggő kifejezéseket is tartalmazhat, mint a "beltéri", amely nem honosítható határolókeretekkel.
A Vision Studióval gyorsan és egyszerűen kipróbálhatja az objektumészlelés képességeit a böngészőben.
Objektumészlelési példa
Az alábbi JSON-válasz bemutatja, mit ad vissza az Analyze API a példakép objektumainak észlelésekor.
{
"objects":[
{
"rectangle":{
"x":730,
"y":66,
"w":135,
"h":85
},
"object":"kitchen appliance",
"confidence":0.501
},
{
"rectangle":{
"x":523,
"y":377,
"w":185,
"h":46
},
"object":"computer keyboard",
"confidence":0.51
},
{
"rectangle":{
"x":471,
"y":218,
"w":289,
"h":226
},
"object":"Laptop",
"confidence":0.85,
"parent":{
"object":"computer",
"confidence":0.851
}
},
{
"rectangle":{
"x":654,
"y":0,
"w":584,
"h":473
},
"object":"person",
"confidence":0.855
}
],
"requestId":"25018882-a494-4e64-8196-f627a35c1135",
"metadata":{
"height":473,
"width":1260,
"format":"Jpeg"
},
"modelVersion":"2021-05-01"
}
Korlátozások
Fontos megjegyezni az objektumészlelés korlátait, hogy elkerülhesse vagy enyhíthesse a hamis negatív hatások (kihagyott objektumok) és a korlátozott részletek hatását.
- Az objektumok általában nem észlelhetők, ha kicsik (a kép kevesebb mint 5%-a).
- Az objektumok általában nem észlelhetők, ha szorosan egymáshoz vannak rendezve (például egy lemezköteg).
- Az objektumok nincsenek megkülönböztetve egymástól márka vagy terméknév szerint (például a bolti polcon lévő különböző üdítőital-típusok). A márkainformációkat azonban lekérheti egy képről a Márkaészlelés funkcióval.
Az API használata
Az objektumészlelési funkció az Analyze Image API része. Ezt az API-t natív SDK-n vagy REST-hívásokon keresztül hívhatja meg. Szerepeljen Objects
a visualFeatures lekérdezési paraméterben. Ezután, amikor megkapja a teljes JSON-választ, elemezheti a szakasz tartalmához tartozó sztringet "objects"
.