Képleírások

Az Azure AI Vision képes elemezni egy képet, és létrehozni egy emberi olvasásra alkalmas kifejezést, amely leírja annak tartalmát. Az algoritmus több leírást ad vissza a különböző vizuális funkciók alapján, és mindegyik leírás megbízhatósági pontszámot kap. A végső kimenet a legmagasabbtól a legalacsonyabb megbízhatóságig rendezett leírások listája.

Jelenleg az angol az egyetlen támogatott nyelv a képleíráshoz.

A Vision Studióval gyorsan és egyszerűen kipróbálhatja a képfeliratozási funkciókat a böngészőben.

Példa képleírásra

Az alábbi JSON-válasz bemutatja, hogy mit ad vissza az Analyze API a példakép vizuális funkciói alapján történő leírásakor.

Egy fekete-fehér kép manhattani épületekről

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

Az API használata

A képleírási funkció az Analyze Image API része. Ezt az API-t natív SDK-n vagy REST-hívásokon keresztül hívhatja meg. Szerepeljen Description a visualFeatures lekérdezési paraméterben. Ezután, amikor megkapja a teljes JSON-választ, elemezheti a szakasz tartalmához tartozó sztringet "description" .

Következő lépések

Ismerje meg a képek címkézésének és a képek kategorizálásának kapcsolódó fogalmait.