Képek leírása emberi olvasásra alkalmas nyelvvelDescribe images with human-readable language

Computer Vision elemezheti a rendszerképet, és létrehozhat egy olyan, emberi olvasásra alkalmas mondatot, amely leírja annak tartalmát.Computer Vision can analyze an image and generate a human-readable sentence that describes its contents. Az algoritmus a különböző vizualizációs funkciók alapján több leírást ad vissza, és mindegyik Leírás megbízhatósági pontszámot kap.The algorithm actually returns several descriptions based on different visual features, and each description is given a confidence score. A végső kimenet a legmagasabbtól a legalacsonyabb megbízhatóságig rendezett leírások listája.The final output is a list of descriptions ordered from highest to lowest confidence.

Példa a képek leírásáraImage description example

A következő JSON-válasz azt szemlélteti, hogy milyen Computer Vision ad vissza, amikor leírja a képet a vizualizáció funkciói alapján.The following JSON response illustrates what Computer Vision returns when describing the example image based on its visual features.

A Manhattanben található épületek fekete-fehér képe

{
  "description": {
    "tags": ["outdoor", "building", "photo", "city", "white", "black", "large", "sitting", "old", "water", "skyscraper", "many", "boat", "river", "group", "street", "people", "field", "tall", "bird", "standing"],
    "captions": [
      {
        "text": "a black and white photo of a city",
        "confidence": 0.95301952483304808
      },
      {
        "text": "a black and white photo of a large city",
        "confidence": 0.94085190563213816
      },
      {
        "text": "a large white building in a city",
        "confidence": 0.93108362931954824
      }
    ]
  },
  "requestId": "b20bfc83-fb25-4b8d-a3f8-b2a1f084b159",
  "metadata": {
    "height": 300,
    "width": 239,
    "format": "Jpeg"
  }
}

További lépésekNext steps

A képek címkézésével és a képek kategorizálásávalkapcsolatos fogalmak megismerése.Learn concepts about tagging images and categorizing images.