Bildkategorisering

Förutom taggar och en beskrivning kan bildanalys 3.2 returnera de taxonomibaserade kategorier som identifierats i en bild. Till skillnad från taggar ordnas kategorier i en överordnad/underordnad hierarki och det finns färre av dem (86, till skillnad från tusentals taggar). Alla kategorinamn är på engelska. Kategorisering kan göras av sig själv eller tillsammans med modellen med nyare taggar.

Taxonomi med 86 kategorier

Azure AI Vision kan kategorisera en bild brett eller specifikt med hjälp av listan med 86 kategorier i följande diagram. Läs den fullständiga taxonomin i textformat i Kategoritaxonomi.

Grouped lists of all the categories in the category taxonomy

Exempel på bildkategorisering

Följande JSON-svar illustrerar vad Azure AI Vision returnerar när du kategoriserar exempelbilden baserat på dess visuella funktioner.

A woman on the roof of an apartment building

{
    "categories": [
        {
            "name": "people_",
            "score": 0.81640625
        }
    ],
    "requestId": "bae7f76a-1cc7-4479-8d29-48a694974705",
    "metadata": {
        "height": 200,
        "width": 300,
        "format": "Jpeg"
    }
}

I följande tabell visas en typisk bilduppsättning och kategorin som returneras av Azure AI Vision för varje bild.

Bild Kategori
Four people posed together as a family people_group
A puppy sitting in a grassy field animal_dog
A person standing on a mountain rock at sunset outdoor_mountain
A pile of bread roles on a table food_bread

Använda API:et

Kategoriseringsfunktionen är en del av API:et Analysera bild 3.2 . Du kan anropa det här API:et via ett inbyggt SDK eller via REST-anrop. Inkludera Categories i frågeparametern visualFeatures . När du sedan får det fullständiga JSON-svaret parsar du bara strängen för innehållet i "categories" avsnittet.

Nästa steg

Lär dig om relaterade begrepp för att tagga bilder och beskriva bilder.