Produkterkennung (Vorschauversion 4.0)

Mit den Produkterkennungs-APIs können Sie Fotos von Regalen in einem Einzelhandelsgeschäft analysieren. Sie können das Vorhandensein von Produkten erkennen und deren Begrenzungsrahmenkoordinaten abrufen. Verwenden Sie sie in Kombination mit der Modellanpassung, um ein Modell zur Identifizierung Ihrer Produkte zu trainieren. Sie können die Ergebnisse der Produkterkennung auch mit dem Planogrammdokument Ihres Stores vergleichen.

Testen Sie mithilfe von Vision Studio die Features zur Produkterkennung ganz schnell und einfach in Ihrem Browser.

Photo of a shelf with products and gaps outlined in rectangles.

Hinweis

Die in den Bildern gezeigten Marken sind nicht mit Microsoft verbunden und stellen keine Form der Unterstützung von Microsoft oder Microsoft-Produkten durch die Markeninhaber oder eine Unterstützung der Markeninhaber oder ihrer Produkte durch Microsoft dar.

Wichtig

Sie können ein benutzerdefiniertes Modell entweder mit dem Custom Vision-Dienst oder den Bildanalyse 4.0 Produkterkennungs-APIs trainieren. In der folgenden Tabelle werden die zwei Dienste miteinander verglichen.

Bereiche Produkte in Regalen – Custom Vision Produkterkennung – Bildanalyse-API/Anpassung
Features Benutzerdefiniertes Produktverständnis Zusammenfügen und Berichtigen von Bildern,
vortrainiertes Produktverständnis,
benutzerdefiniertes Produktverständnis,
Planogrammabgleich
Basismodell CNN Florence-Transformatormodell
Bezeichnungen Customvision.ai AML Studio
Web Portal (Webportal) Customvision.ai Vision Studio
Libraries REST, SDK REST, Python-Beispiel
Mindestens erforderliche Trainingsdaten 15 Bilder pro Kategorie 2-5 Bilder pro Kategorie
Speicherung von Trainingsdaten Hochgeladen in den Dienst Blob Storage-Kundenkonto
Modellhosting Cloud und Edge Nur Cloudhosting, Edgecontainerhosting bald verfügbar
KI-Qualität
contextTop-1-Genauigkeit, 14 Datasets
1 Shot (Katalog)29.4
2 Shot57,1
3 Shot66,7
5 Shot80,8
10 Shot86,4
Voll94,9
contextTop-1-Genauigkeit, 14 Datasets
1 Shot (Katalog)86,9
2 Shot88,8
3 Shot89,8
5 Shot90,3
10 Shot91,0
Voll95,4
Preise Custom Vision-Preise Bildanalyse: Preise

Produkterkennungsfeatures

Regalbildkomposition

Mit den APIs zum Zusammenfügen und Berichtigen können Sie Bilder ändern, um die Genauigkeit der Ergebnisse zum Produktverständnis zu verbessern. Sie können diese APIs für Folgendes verwenden:

  • Fügen Sie mehrere Bilder eines Regals zusammen, um ein einziges Bild zu erstellen.
  • Berichtigen Sie ein Bild, um perspektivische Verzerrungen zu entfernen.

Regalprodukterkennung (vortrainiertes Modell)

Die API zum Produktverständnis ermöglicht die Analyse eines Bildes von einem Regal mithilfe eines vorgefertigten vortrainierten Modells. Bei diesem Vorgang werden Produkte und Lücken im Bild eines Regals erkannt und die Begrenzungsrahmenkoordinaten der einzelnen Produkte und Lücken jeweils zusammen mit einer Zuverlässigkeitsbewertung zurückgegeben.

Die folgende JSON-Antwort zeigt, was die API zum Produktverständnis zurückgibt.

{
  "imageMetadata": {
    "width": 2000,
    "height": 1500
  },
  "products": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 12,
        "h": 12
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "string"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 123,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "string"
        }
      ]
    }
  ]
}

Regalprodukterkennung (angepasstes Modell)

Die API zum Produktverständnis kann auch mit einem vom Benutzer trainierten Modell verwendet werden, um individuelle Produkte zu erkennen. Bei diesem Vorgang werden die Begrenzungsrahmenkoordinaten der einzelnen Produkte und Lücken zusammen mit der Bezeichnung der einzelnen Produkte zurückgegeben.

Die folgende JSON-Antwort zeigt, was die API bei Verwendung eines benutzerdefinierten Modells zum Produktverständnis zurückgibt.

"detectedProducts": {
  "imageMetadata": {
    "width": 21,
    "height": 25
  },
  "products": [
    {
      "id": "01",
      "boundingBox": {
        "x": 123,
        "y": 234,
        "w": 34,
        "h": 45
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "Product1"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "02",
      "boundingBox": {
        "x": 12,
        "y": 123,
        "w": 1234,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "Product1"
        }
      ]
    }
  ]
}

Regalplanogrammkonformität

Mit der API für den Planogrammabgleich können Sie die Ergebnisse der API zum Produktverständnis mit einem Planogrammdokument vergleichen. Bei diesem Vorgang werden alle erkannten Produkte und Lücken mit der entsprechenden Position im Planogrammdokument abgeglichen.

Dabei wird eine JSON-Antwort zurückgegeben, in der alle Positionen im Planogrammdokument erfasst sind, ganz gleich, ob sie von einem Produkt oder einer Lücke belegt sind.

{
  "matchedResultsPerPosition": [
    {
      "positionId": "01",
      "detectedObject": {
        "id": "01",
        "boundingBox": {
          "x": 12,
          "y": 1234,
          "w": 123,
          "h": 12345
        },
        "classifications": [
          {
            "confidence": 0.9,
            "label": "Product1"
          }
        ]
      }
    }
  ]
}

Einschränkungen

  • Die API zur Produkterkennung ist nur in den Azure-Regionen USA, Osten und USA, Westen 2 verfügbar.
  • Regalbilder können bis zu 20 MB groß sein. Empfohlen wird eine Größe von 4 MB.
  • Es wird empfohlen, Bilder von Regalen vor dem Hochladen zur Analyse zusammenzufügen und zu berichtigen.
  • Die Verwendung eines benutzerdefinierten Modells ist bei der Produkterkennung optional, für die Funktion zum Planogrammabgleich jedoch erforderlich.

Nächste Schritte

Beginnen Sie mit der Produkterkennung, indem Sie die APIs zum Zusammenfügen und Berichtigen ausprobieren. Führen Sie anschließen mit der API zum Produktverständnis einfache Analysen durch.