개체 감지

개체 검색은 태깅과 유사하지만, API는 이미지에서 검색된 각 개체에 대해 경계 상자 좌표(픽셀 단위)를 반환합니다. 예를 들어 이미지에 개, 고양이, 사람이 포함된 경우 개체 감지 작업에서는 해당 개체를 이미지의 좌표와 함께 나열합니다. 이 기능을 사용하여 이미지의 개체 간 관계를 처리할 수 있습니다. 또한 이미지에 동일한 개체의 인스턴스가 여러 개 있는지 여부도 확인할 수 있습니다.

개체 검색 함수는 이미지에서 식별되는 개체 또는 생물을 기준으로 태그를 적용합니다. 태깅 분류와 개체 감지 분류 간에는 공식적 관계가 없습니다. 개념 수준에서 개체 검색 함수는 개체 및 생물만 검색하지만, 태그 함수는 경계 상자로 지역화할 수 없는 “실내” 같은 상황별 용어를 포함할 수도 있습니다.

Vision Studio를 사용하여 브라우저에서 빠르고 쉽게 개체 감지 기능을 사용해 보세요.

개체 검색 예제

다음 JSON 응답은 이미지 예에서 개체를 검색할 때 Analyze API가 반환하는 내용을 보여 줍니다.

A woman using a Microsoft Surface device in a kitchen

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

제한 사항

거짓 부정(누락된 개체) 및 제한된 세부 정보의 영향을 방지하거나 완화할 수 있도록 개체 검색 기능의 제한 사항에 유의해야 합니다.

  • 일반적으로 개체는 작으면 검색되지 않습니다(이미지의 5% 미만).
  • 일반적으로 개체는 근접하게 배열되어 있으면 검색되지 않습니다(예: 접시 더미).
  • 개체는 브랜드 또는 제품 이름으로 구분되지 않습니다(예: 상점 선반에 있는 다양한 유형의 탄산 음료). 그러나 브랜드 검색 기능을 사용하여 이미지에서 브랜드 정보를 가져올 수 있습니다.

API 사용

개체 검색 기능은 이미지 분석 API의 일부입니다. 이 API는 네이티브 SDK 또는 REST 호출을 통해 호출할 수 있습니다. visualFeatures 쿼리 매개 변수에 Objects를 포함합니다. 그런 다음, 전체 JSON 응답을 받으면 "objects" 섹션의 콘텐츠에 대한 문자열을 구문 분석합니다.