物件偵測

對象偵測類似於 標記,但 API 會針對影像中找到的每個物件傳回周框方塊座標(以像素為單位)。 例如,如果影像包含狗、貓和人員,對象偵測作業將會列出影像中具有其座標的物件。 您可以使用此功能來處理影像中物件之間的關聯性。 它也可讓您判斷影像中是否有多個相同對象的實例。

物件偵測函式會根據影像中所識別的物件或活體專案套用標記。 標記分類法與物件偵測分類之間沒有正式關聯性。 在概念層級,物件偵測函式只會尋找物件和生活專案,而標籤式也可以包含內容詞彙,例如「室內」,而此詞彙無法以周框方塊當地語系化。

使用 Vision Studio 快速且輕鬆地在瀏覽器中試用物件偵測的功能。

對象偵測範例

下列 JSON 回應說明分析 API 在偵測範例影像中物件時所傳回的內容。

A woman using a Microsoft Surface device in a kitchen

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

限制

請務必注意對象偵測的限制,以便避免或減輕誤判(遺漏的物件)和有限詳細數據的影響。

  • 如果物件很小(小於 5% 的影像),通常不會偵測到它們。
  • 如果對象被緊密排列在一起,通常不會偵測到它們(例如,盤子堆棧)。
  • 無法依品牌或產品名稱區分物件 (例如貨架上有不同種類的汽水)。 不過,您可以使用品牌偵測功能,從影像取得品牌資訊。

使用 API

對象偵測功能是分析影像 API 的一部分。 您可以透過原生 SDK 或 REST 呼叫來呼叫此 API。 包含在 Objects visualFeatures查詢參數中。 然後,當您取得完整的 JSON 回應時,剖析區段內容的 "objects" 字串。