Bildbeskrivningar

Azure AI Vision kan analysera en bild och generera en mänsklig läsbar fras som beskriver dess innehåll. Algoritmen returnerar flera beskrivningar baserat på olika visuella funktioner och varje beskrivning får en konfidenspoäng. De slutliga utdata är en lista med beskrivningar ordnade från högsta till lägsta konfidens.

För närvarande är engelska det enda språk som stöds för bildbeskrivning.

Prova funktionerna för bildtexter snabbt och enkelt i webbläsaren med hjälp av Vision Studio.

Exempel på bildbeskrivning

Följande JSON-svar illustrerar vad ANALYS-API:et returnerar när du beskriver exempelbilden baserat på dess visuella funktioner.

En svartvit bild av byggnader på Manhattan

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

Använda API:et

Bildbeskrivningsfunktionen är en del av API:et Analysera bild . Du kan anropa det här API:et via en intern SDK eller via REST-anrop. Inkludera Description i frågeparametern visualFeatures . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "description" avsnittet.

Nästa steg

Lär dig om relaterade begrepp för att tagga bilder och kategorisera bilder.