Распознавание продуктов (предварительная версия 4.0)

API распознавания продуктов позволяют анализировать фотографии полков в розничном магазине. Вы можете определить наличие продуктов и получить координаты ограничивающего прямоугольна. Используйте его в сочетании с настройкой модели для обучения модели для идентификации конкретных продуктов. Вы также можете сравнить результаты распознавания продуктов с документом планограммы магазина.

Попробуйте возможности распознавания продуктов быстро и легко в браузере с помощью Vision Studio.

Photo of a shelf with products and gaps outlined in rectangles.

Примечание.

Бренды, отображаемые на изображениях, не связаны с корпорацией Майкрософт и не указывают ни одну форму подтверждения продуктов Майкрософт или Майкрософт владельцами бренда, или одобрение владельцев бренда или их продуктов корпорацией Майкрософт.

Важно!

Вы можете обучить пользовательскую модель для распознавания продуктов с помощью Пользовательское визуальное распознавание службы или API распознавания продуктов 4.0. В следующей таблице сравниваются две службы.

Области Продукты на полках — Пользовательское визуальное распознавание Распознавание продуктов — API анализа изображений и настройка
Функции Пользовательское понимание продуктов Стежка изображений и исправление, предварительно обученное понимание продукта,
пользовательское понимание продуктов,

сопоставление планограммы
Базовая модель CNN Модель преобразователя Флоренции
Добавление меток Customvision.ai AML Studio
Веб-портал Customvision.ai Vision Studio
Библиотеки REST, SDK REST, пример Python
Минимальные необходимые данные для обучения 15 изображений на категорию 2–5 изображений на категорию
Хранилище данных обучения Отправлено в службу Учетная запись хранения BLOB-объектов клиента
Размещение моделей Облако и edge Только облачное размещение, размещение пограничных контейнеров для получения
Качество ИИ
контекстныеМаксимальная точность 1, 14 наборов данных
1 выстрел (каталог)29,4
2 выстрела57,1
3 выстрела66,7
5 выстрел80.8
10 выстрел86.4
full94.9
контекстныеМаксимальная точность 1, 14 наборов данных
1 выстрел (каталог)86.9
2 выстрела88.8
3 выстрела89.8
5 выстрел90,3 %
10 выстрел91.0
full95,4
Цены Цены на Пользовательское визуальное распознавание Цены на анализ изображений

Функции распознавания продуктов

Композиция изображения полки

API-интерфейсы стежки и исправления позволяют изменять изображения, чтобы повысить точность результатов распознавания продуктов. Эти API можно использовать для:

  • Создайте один образ вместе с несколькими изображениями полки.
  • Исправление изображения для удаления искажений перспективы.

Распознавание готовых продуктов (предварительно обученная модель)

API распознавания продуктов позволяет анализировать изображение полки с помощью предварительно обученной модели. Эта операция обнаруживает продукты и пробелы в изображении полки и возвращает ограничивающие координаты каждого продукта и пробела, а также оценку достоверности для каждого из них.

В следующем ответе JSON показано, что возвращает API распознавания продуктов.

{
  "imageMetadata": {
    "width": 2000,
    "height": 1500
  },
  "products": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 12,
        "h": 12
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "string"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 123,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "string"
        }
      ]
    }
  ]
}

Распознавание продуктов по полке (настраиваемая модель)

API распознавания продуктов также можно использовать с пользовательской обученной моделью для обнаружения конкретных продуктов. Эта операция возвращает координаты ограничивающего прямоугольника каждого продукта и пробела вместе с меткой каждого продукта.

В следующем ответе JSON показано, что API распознавания продуктов возвращается при использовании с пользовательской моделью.

"detectedProducts": {
  "imageMetadata": {
    "width": 21,
    "height": 25
  },
  "products": [
    {
      "id": "01",
      "boundingBox": {
        "x": 123,
        "y": 234,
        "w": 34,
        "h": 45
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "Product1"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "02",
      "boundingBox": {
        "x": 12,
        "y": 123,
        "w": 1234,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "Product1"
        }
      ]
    }
  ]
}

Соответствие планограммы полки

API сопоставления планограмм позволяет сравнить результаты API распознавания продуктов с документом планограммы. Эта операция сопоставляет каждый обнаруженный продукт и разрыв с соответствующим положением в документе планограммы.

Он возвращает ответ JSON, который учитывает каждую позицию в документе планограммы, занятую продуктом или разрывом.

{
  "matchedResultsPerPosition": [
    {
      "positionId": "01",
      "detectedObject": {
        "id": "01",
        "boundingBox": {
          "x": 12,
          "y": 1234,
          "w": 123,
          "h": 12345
        },
        "classifications": [
          {
            "confidence": 0.9,
            "label": "Product1"
          }
        ]
      }
    }
  ]
}

Ограничения

  • Распознавание продуктов доступно только в регионах Azure "Восточная часть США" и "Западная часть США 2".
  • Размер готовых изображений может составлять до 20 МБ. Рекомендуемый размер составляет 4 МБ.
  • Перед отправкой их для анализа рекомендуется выполнять стежку и исправление на полках.
  • Использование пользовательской модели является необязательным в распознавании продуктов, но оно требуется для функции сопоставления планограммы.

Следующие шаги

Начало работы с распознаванием продуктов, пробуя api стежки и исправления. Затем выполните базовый анализ с помощью API распознавания продуктов.