Objektumészlelés

Az objektumészlelés hasonló a címkézéshez, de az API a képen található minden objektumhoz visszaadja a határolókeret koordinátáit (képpontban). Ha például egy kép egy kutyát, macskát és személyt tartalmaz, az objektumészlelési művelet felsorolja ezeket az objektumokat a képen lévő koordinátákkal. Ezzel a funkcióval feldolgozhatja a képek objektumai közötti kapcsolatokat. Azt is meghatározhatja, hogy ugyanazon objektumnak több példánya van-e egy képen.

Az objektumészlelési függvény címkéket alkalmaz a képen azonosított objektumok vagy élőlények alapján. Nincs formális kapcsolat a címkézési osztályozás és az objektumészlelési osztályozás között. Fogalmi szinten az objektumészlelési függvény csak objektumokat és élőlényeket keres, míg a címkefüggvény olyan környezetfüggő kifejezéseket is tartalmazhat, mint a "beltéri", amely nem honosítható határolókeretekkel.

A Vision Studióval gyorsan és egyszerűen kipróbálhatja az objektumészlelés képességeit a böngészőben.

Objektumészlelési példa

Az alábbi JSON-válasz bemutatja, mit ad vissza az Analyze API a példakép objektumainak észlelésekor.

A woman using a Microsoft Surface device in a kitchen

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Korlátozások

Fontos megjegyezni az objektumészlelés korlátait, hogy elkerülhesse vagy enyhíthesse a hamis negatív hatások (kihagyott objektumok) és a korlátozott részletek hatását.

  • Az objektumok általában nem észlelhetők, ha kicsik (a kép kevesebb mint 5%-a).
  • Az objektumok általában nem észlelhetők, ha szorosan egymáshoz vannak rendezve (például egy lemezköteg).
  • Az objektumok nincsenek megkülönböztetve egymástól márka vagy terméknév szerint (például a bolti polcon lévő különböző üdítőital-típusok). A márkainformációkat azonban lekérheti egy képről a Márkaészlelés funkcióval.

Az API használata

Az objektumészlelési funkció az Analyze Image API része. Ezt az API-t natív SDK-n vagy REST-hívásokon keresztül hívhatja meg. Szerepeljen Objects a visualFeatures lekérdezési paraméterben. Ezután, amikor megkapja a teljes JSON-választ, elemezheti a szakasz tartalmához tartozó sztringet "objects" .