Распознавание готовых продуктов (предварительная версия): анализ изображений полки с помощью предварительно обученной модели
Самый быстрый способ начать использование распознавания продуктов — использовать встроенные предварительно обученные модели ИИ. С помощью API распознавания продуктов можно отправить изображение полки и получить расположения продуктов и пробелов.
Примечание.
Бренды, отображаемые на изображениях, не связаны с корпорацией Майкрософт и не указывают ни одну форму подтверждения продуктов Майкрософт или Майкрософт владельцами бренда, или одобрение владельцев бренда или их продуктов корпорацией Майкрософт.
Необходимые компоненты
- подписка Azure — создайте бесплатную учетную запись.
- После получения подписки Azure создайте ресурс Визуального зрения в портал Azure. Его необходимо развернуть в регионе "Восточная часть США" или "Западная часть США 2". После развертывания ресурса выберите элемент Перейти к ресурсу.
- Вам потребуется ключ и конечная точка из ресурса, создаваемого для подключения приложения к службе распознавания искусственного интеллекта Azure. Вы вставьте ключ и конечную точку в приведенный ниже код далее в руководстве.
- Ресурс служба хранилища Azure с контейнером хранилища BLOB-объектов. Создание
- Установленная программа cURL. Кроме того, можно использовать другую платформу REST, например Swagger или расширение REST Client для VS Code.
- Изображение полки. Вы можете скачать образец или принести собственные изображения. Максимальный размер файла на изображение составляет 20 МБ.
Анализ образов полки
Чтобы проанализировать изображение полки, сделайте следующее:
Отправьте изображения, которые вы хотите проанализировать в контейнер хранилища BLOB-объектов, и получите абсолютный URL-адрес.
Скопируйте следующую
curl
команду в текстовый редактор.curl -X PUT -H "Ocp-Apim-Subscription-Key: <subscriptionKey>" -H "Content-Type: application/json" "<endpoint>/computervision/productrecognition/ms-pretrained-product-detection/runs/<your_run_name>?api-version=2023-04-01-preview" -d "{ 'url':'<your_url_string>' }"
При необходимости внесите следующие изменения в команду.
- Замените ключ ресурса Визуального
<subscriptionKey>
зрения. - Замените конечную точку ресурса Визуального
<endpoint>
зрения. Например:https://YourResourceName.cognitiveservices.azure.com
. - Замените уникальное
<your_run_name>
имя тестового запуска для очереди задач. Это асинхронное имя очереди задач API, чтобы получить ответ API позже. Например:.../runs/test1?api-version...
- Замените содержимое
<your_url_string>
URL-адресом большого двоичного объекта изображения
- Замените ключ ресурса Визуального
Откройте окно командной строки.
Вставьте измененную
curl
команду из текстового редактора в окно командной строки и выполните команду.
Изучите ответ.
Успешный ответ будет возвращен в формате JSON. Результаты API распознавания продуктов возвращаются в ProductUnderstandingResultApiModel
поле JSON:
{
"imageMetadata": {
"width": 2000,
"height": 1500
},
"products": [
{
"id": "string",
"boundingBox": {
"x": 1234,
"y": 1234,
"w": 12,
"h": 12
},
"classifications": [
{
"confidence": 0.9,
"label": "string"
}
]
}
],
"gaps": [
{
"id": "string",
"boundingBox": {
"x": 1234,
"y": 1234,
"w": 123,
"h": 123
},
"classifications": [
{
"confidence": 0.8,
"label": "string"
}
]
}
]
}
Дополнительные сведения об определениях каждого поля JSON см. в следующих разделах.
Модель API результатов распознавания продуктов
Результаты операции понимания продукта.
Имя. | Тип | Описание | Обязательное поле |
---|---|---|---|
imageMetadata |
ImageMetadataApiModel | Сведения о метаданных изображения, такие как высота, ширина и формат. | Да |
products |
DetectedObjectApiModel | Продукты, обнаруженные на изображении. | Да |
gaps |
DetectedObjectApiModel | Пробелы, обнаруженные на изображении. | Да |
Модель API метаданных изображения
Сведения о метаданных изображения, такие как высота, ширина и формат.
Имя. | Тип | Описание | Обязательное поле |
---|---|---|---|
width |
integer | Ширина изображения в пикселях. | Да |
height |
integer | Высота изображения в пикселях. | Да |
Обнаруженная модель объектного API
Описывает обнаруженный объект на изображении.
Имя. | Тип | Описание | Обязательное поле |
---|---|---|---|
id |
строка | Идентификатор обнаруженного объекта. | No |
boundingBox |
BoundingBoxApiModel | Ограничивающий прямоугольник для области внутри изображения. | Да |
classifications |
ImageClassificationApiModel | Достоверность классификации обнаруженного объекта. | Да |
Ограничивающая модель API Box
Ограничивающий прямоугольник для области внутри изображения.
Имя. | Тип | Описание | Обязательное поле |
---|---|---|---|
x |
integer | Левая координата левой верхней левой точки области в пикселях. | Да |
y |
integer | Верхняя координата левой верхней точки области в пикселях. | Да |
w |
integer | Ширина, измеряемая из левой верхней точки области в пикселях. | Да |
h |
integer | Высота, измеряемая от левой верхней точки области в пикселях. | Да |
Модель API классификации изображений
Описывает достоверность классификации изображений метки.
Имя. | Тип | Описание | Обязательное поле |
---|---|---|---|
confidence |
с плавающей запятой | Достоверность прогноза классификации. | Да |
label |
строка | Метка прогнозирования классификации. | Да |
Следующие шаги
В этом руководстве вы узнали, как выполнить базовый вызов анализа с помощью предварительно обученного REST API распознавания продуктов. Далее вы узнаете, как использовать пользовательскую модель распознавания продуктов для улучшения бизнес-потребностей.