Beskriva bilder med läsbart språk
Visuellt innehåll kan analysera en bild och generera en läsbar mening som beskriver dess innehåll. Algoritmen returnerar faktiskt flera beskrivningar baserat på olika visuella funktioner, och varje beskrivning får en förtroendepoäng. De slutliga utdata är en lista med beskrivningar sorterade från högsta till lägsta konfidens.
Exempel på bildbeskrivning
Följande JSON-svar illustrerar vad Visuellt innehåll returnerar när du beskriver exempelbilden baserat på dess visuella funktioner.

{
"description": {
"tags": ["outdoor", "building", "photo", "city", "white", "black", "large", "sitting", "old", "water", "skyscraper", "many", "boat", "river", "group", "street", "people", "field", "tall", "bird", "standing"],
"captions": [
{
"text": "a black and white photo of a city",
"confidence": 0.95301952483304808
},
{
"text": "a black and white photo of a large city",
"confidence": 0.94085190563213816
},
{
"text": "a large white building in a city",
"confidence": 0.93108362931954824
}
]
},
"requestId": "b20bfc83-fb25-4b8d-a3f8-b2a1f084b159",
"metadata": {
"height": 300,
"width": 239,
"format": "Jpeg"
}
}
Använda API:et
Bildbeskrivningsfunktionen är en del av Analysera bild API. Du kan anropa det här API:et via en intern SDK eller via REST-anrop. Inkludera Description i frågeparametern visualFeatures. När du sedan får det fullständiga JSON-svaret parsar du helt enkelt strängen för innehållet i "description" avsnittet.
Nästa steg
Lär dig mer om relaterade begrepp för att tagga bilder och kategorisera bilder.