Gyakori objektumok észlelése képekbenDetect common objects in images

Az objektum észlelése hasonló a címkézéshez, de az API a megtalált objektumok koordinátáit (képpontban) adja vissza.Object detection is similar to tagging, but the API returns the bounding box coordinates (in pixels) for each object found. Ha például egy rendszerkép kutyát, macskát és személyt tartalmaz, az észlelési művelet a képen látható koordinátákkal együtt listázza ezeket az objektumokat.For example, if an image contains a dog, cat and person, the Detect operation will list those objects together with their coordinates in the image. Ezzel a funkcióval feldolgozhatja a képek objektumai közötti kapcsolatokat.You can use this functionality to process the relationships between the objects in an image. Azt is megadhatja, hogy egy adott címkén belül több példány is van-e a képen.It also lets you determine whether there are multiple instances of the same tag in an image.

Az észlelési API az objektumokon vagy a képen azonosított dolgokon alapuló címkéket alkalmaz.The Detect API applies tags based on the objects or living things identified in the image. Jelenleg nincs formális kapcsolat a címkézési besorolás és az objektum-észlelési besorolás között.There is currently no formal relationship between the tagging taxonomy and the object detection taxonomy. Elméleti szinten az észlelési API csak az objektumokat és az élő dolgokat észleli, míg a címke API olyan környezetfüggő kifejezéseket is tartalmazhat, mint például a "beltéri", amely nem honosítható meg a határolókeret használatával.At a conceptual level, the Detect API only finds objects and living things, while the Tag API can also include contextual terms like "indoor", which can't be localized with bounding boxes.

Objektum-észlelési példaObject detection example

A következő JSON-válasz azt szemlélteti, hogy milyen Computer Vision ad vissza, amikor a példában szereplő objektumokat észleli.The following JSON response illustrates what Computer Vision returns when detecting objects in the example image.

Egy Microsoft Surface-eszközt használó nő egy konyhában

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"a7fde8fd-cc18-4f5f-99d3-897dcd07b308",
   "metadata":{
      "width":1260,
      "height":473,
      "format":"Jpeg"
   }
}

KorlátozásokLimitations

Fontos megjegyezni az objektumok észlelésének korlátozásait, így elkerülhető vagy enyhíthető a hamis negatív (kihagyott objektumok) és a korlátozott részletesség hatása.It's important to note the limitations of object detection so you can avoid or mitigate the effects of false negatives (missed objects) and limited detail.

  • Az objektumok általában nem észlelhetők, ha kicsik (a rendszerkép kevesebb, mint 5%-a).Objects are generally not detected if they're small (less than 5% of the image).
  • A rendszer általában nem észleli az objektumokat, ha azok egymással szorosan vannak rendezve (például egy halom lemez).Objects are generally not detected if they're arranged closely together (a stack of plates, for example).
  • Az objektumokat nem különbözteti meg a márka vagy a Terméknév (például a különböző típusú üdítőitalok egy tárolási polcon).Objects are not differentiated by brand or product names (different types of sodas on a store shelf, for example). A arculatot azonban a márka észlelési funkciója segítségével kérheti le.However, you can get brand information from an image by using the Brand detection feature.

Az API használataUse the API

Az objektum-észlelési funkció a rendszerkép elemzése API részét képezi.The object detection feature is part of the Analyze Image API. Ezt az API-t natív SDK-n vagy REST-hívásokon keresztül hívhatja.You can call this API through a native SDK or through REST calls. Belefoglalás Objects a visualFeatures lekérdezési paraméterbe.Include Objects in the visualFeatures query parameter. Ezután, amikor megkapja a teljes JSON-választ, egyszerűen elemezze a "objects" szakasz tartalmának karakterláncát.Then, when you get the full JSON response, simply parse the string for the contents of the "objects" section.