Распознавание продуктов (предварительная версия 4.0)

Статья
02/14/2024

API распознавания продуктов позволяют анализировать фотографии полков в розничном магазине. Вы можете определить наличие продуктов и получить координаты ограничивающего прямоугольна. Используйте его в сочетании с настройкой модели для обучения модели для идентификации конкретных продуктов. Вы также можете сравнить результаты распознавания продуктов с документом планограммы магазина.

Попробуйте возможности распознавания продуктов быстро и легко в браузере с помощью Vision Studio.

Попробовать Vision Studio

Photo of a shelf with products and gaps outlined in rectangles.

Примечание.

Бренды, отображаемые на изображениях, не связаны с корпорацией Майкрософт и не указывают ни одну форму подтверждения продуктов Майкрософт или Майкрософт владельцами бренда, или одобрение владельцев бренда или их продуктов корпорацией Майкрософт.

Важно!

Вы можете обучить пользовательскую модель для распознавания продуктов с помощью Пользовательское визуальное распознавание службы или API распознавания продуктов 4.0. В следующей таблице сравниваются две службы.

Области

Продукты на полках — Пользовательское визуальное распознавание

Распознавание продуктов — API анализа изображений и настройка

Функции

Пользовательское понимание продуктов

Стежка изображений и исправление, предварительно обученное понимание продукта,
пользовательское понимание продуктов,

сопоставление планограммы

Базовая модель

CNN

Модель преобразователя Флоренции

Добавление меток

Customvision.ai

AML Studio

Веб-портал

Customvision.ai

Vision Studio

Библиотеки

REST, SDK

REST, пример Python

Минимальные необходимые данные для обучения

15 изображений на категорию

2–5 изображений на категорию

Хранилище данных обучения

Отправлено в службу

Учетная запись хранения BLOB-объектов клиента

Размещение моделей

Облако и edge

Только облачное размещение, размещение пограничных контейнеров для получения

Качество ИИ

контекстные	Максимальная точность 1, 14 наборов данных
1 выстрел (каталог)	29,4
2 выстрела	57,1
3 выстрела	66,7
5 выстрел	80.8
10 выстрел	86.4
full	94.9

контекстные	Максимальная точность 1, 14 наборов данных
1 выстрел (каталог)	86.9
2 выстрела	88.8
3 выстрела	89.8
5 выстрел	90,3 %
10 выстрел	91.0
full	95,4

Цены

Цены на Пользовательское визуальное распознавание

Цены на анализ изображений

Функции распознавания продуктов

Композиция изображения полки

API-интерфейсы стежки и исправления позволяют изменять изображения, чтобы повысить точность результатов распознавания продуктов. Эти API можно использовать для:

Создайте один образ вместе с несколькими изображениями полки.
Исправление изображения для удаления искажений перспективы.

Распознавание готовых продуктов (предварительно обученная модель)

API распознавания продуктов позволяет анализировать изображение полки с помощью предварительно обученной модели. Эта операция обнаруживает продукты и пробелы в изображении полки и возвращает ограничивающие координаты каждого продукта и пробела, а также оценку достоверности для каждого из них.

В следующем ответе JSON показано, что возвращает API распознавания продуктов.

{
  "imageMetadata": {
    "width": 2000,
    "height": 1500
  },
  "products": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 12,
        "h": 12
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "string"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 123,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "string"
        }
      ]
    }
  ]
}

Распознавание продуктов по полке (настраиваемая модель)

API распознавания продуктов также можно использовать с пользовательской обученной моделью для обнаружения конкретных продуктов. Эта операция возвращает координаты ограничивающего прямоугольника каждого продукта и пробела вместе с меткой каждого продукта.

В следующем ответе JSON показано, что API распознавания продуктов возвращается при использовании с пользовательской моделью.

"detectedProducts": {
  "imageMetadata": {
    "width": 21,
    "height": 25
  },
  "products": [
    {
      "id": "01",
      "boundingBox": {
        "x": 123,
        "y": 234,
        "w": 34,
        "h": 45
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "Product1"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "02",
      "boundingBox": {
        "x": 12,
        "y": 123,
        "w": 1234,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "Product1"
        }
      ]
    }
  ]
}

Соответствие планограммы полки

API сопоставления планограмм позволяет сравнить результаты API распознавания продуктов с документом планограммы. Эта операция сопоставляет каждый обнаруженный продукт и разрыв с соответствующим положением в документе планограммы.

Он возвращает ответ JSON, который учитывает каждую позицию в документе планограммы, занятую продуктом или разрывом.

{
  "matchedResultsPerPosition": [
    {
      "positionId": "01",
      "detectedObject": {
        "id": "01",
        "boundingBox": {
          "x": 12,
          "y": 1234,
          "w": 123,
          "h": 12345
        },
        "classifications": [
          {
            "confidence": 0.9,
            "label": "Product1"
          }
        ]
      }
    }
  ]
}

Ограничения

Распознавание продуктов доступно только в регионах Azure "Восточная часть США" и "Западная часть США 2".
Размер готовых изображений может составлять до 20 МБ. Рекомендуемый размер составляет 4 МБ.
Перед отправкой их для анализа рекомендуется выполнять стежку и исправление на полках.
Использование пользовательской модели является необязательным в распознавании продуктов, но оно требуется для функции сопоставления планограммы.

Следующие шаги

Начало работы с распознаванием продуктов, пробуя api стежки и исправления. Затем выполните базовый анализ с помощью API распознавания продуктов.