Erkennung bereichsspezifischer Inhalte

Artikel
01/29/2024

Zusätzlich zur Markierung und allgemeinen Kategorisierung unterstützt Azure KI Vision auch die weiter gehende domänenspezifische Analyse. Hierfür werden Modelle verwendet, die anhand spezieller Daten trainiert wurden.

Es gibt zwei Möglichkeiten für die Verwendung von domänenspezifischen Modellen: allein (bereichsbezogene Analyse) oder als Erweiterung des Kategorisierungsfeatures.

Bereichsbezogene Analyse

Sie können ein Bild analysieren, indem Sie nur das domänenspezifische Modell nutzen. Rufen Sie hierfür die API Models/<model>/Analyze auf.

Hier ist eine JSON-Beispielantwort angegeben, die von der API models/celebrities/analyze für das jeweilige Bild zurückgegeben wird:

Satya Nadella standing, smiling

{
  "result": {
    "celebrities": [{
      "faceRectangle": {
        "top": 391,
        "left": 318,
        "width": 184,
        "height": 184
      },
      "name": "Satya Nadella",
      "confidence": 0.99999856948852539
    }]
  },
  "requestId": "8217262a-1a90-4498-a242-68376a4b956b",
  "metadata": {
    "width": 800,
    "height": 1200,
    "format": "Jpeg"
  }
}

Verbesserte Kategorisierungsanalyse

Sie können domänenspezifische Modelle auch verwenden, um die allgemeine Bildanalyse zu erweitern. Dies ist im Rahmen der allgemeinen Kategorisierung möglich, indem domänenspezifische Modelle im Parameter details des Analyze-API-Aufrufs angegeben werden.

In diesem Fall wird zuerst die Klassifizierung der 86-Kategorien-Taxonomie aufgerufen. Wenn erkannte Kategorien über ein passendes domänenspezifisches Modell verfügen, wird das Bild auch über dieses Modell übergeben, und die Ergebnisse werden hinzugefügt.

Mit der folgenden JSON-Antwort wird veranschaulicht, wie die domänenspezifische Analyse als detail-Knoten in eine umfassendere Kategorisierungsanalyse eingebunden werden kann.

"categories":[
  {
    "name":"abstract_",
    "score":0.00390625
  },
  {
    "name":"people_",
    "score":0.83984375,
    "detail":{
      "celebrities":[
        {
          "name":"Satya Nadella",
          "faceRectangle":{
            "left":597,
            "top":162,
            "width":248,
            "height":248
          },
          "confidence":0.999028444
        }
      ],
      "landmarks":[
        {
          "name":"Forbidden City",
          "confidence":0.9978346
        }
      ]
    }
  }
]

Auflisten der domänenspezifischen Modelle

Derzeit unterstützt Azure KI Vision die folgenden domänenspezifischen Modelle:

Name	BESCHREIBUNG
Prominente	Erkennung berühmter Personen, die für Bilder unterstützt wird, die in die Kategorie `people_` klassifiziert werden
Wahrzeichen	Erkennung von Wahrzeichen, die für Bilder unterstützt wird, die in die Kategorien `outdoor_` oder `building_` klassifiziert werden

Durch das Aufrufen der Models-API werden diese Informationen zusammen mit den Kategorien zurückgegeben, für die die einzelnen Modelle gelten können:

{
  "models":[
    {
      "name":"celebrities",
      "categories":[
        "people_",
        "人_",
        "pessoas_",
        "gente_"
      ]
    },
    {
      "name":"landmarks",
      "categories":[
        "outdoor_",
        "户外_",
        "屋外_",
        "aoarlivre_",
        "alairelibre_",
        "building_",
        "建筑_",
        "建物_",
        "edifício_"
      ]
    }
  ]
}

Verwenden der API

Dieses Feature ist über die Bildanalyse 3.2-API verfügbar. Sie können diese API über ein natives SDK oder REST-Aufrufe aufrufen. Fügen Sie Celebrities oder Landmarks in den Abfrageparameter details ein. Nachdem Sie die vollständige JSON-Antwort erhalten haben, analysieren Sie einfach die Zeichenfolge auf den Inhalt im Abschnitt "details".

Schnellstart: Vision-REST-API oder Clientbibliotheken

Erkennung bereichsspezifischer Inhalte

Bereichsbezogene Analyse

Verbesserte Kategorisierungsanalyse

Auflisten der domänenspezifischen Modelle

Verwenden der API

Zusätzliche Ressourcen