Bildkategorisering

Artikel
01/23/2024

Förutom taggar och en beskrivning kan bildanalys 3.2 returnera de taxonomibaserade kategorier som identifierats i en bild. Till skillnad från taggar ordnas kategorier i en överordnad/underordnad hierarki och det finns färre av dem (86, till skillnad från tusentals taggar). Alla kategorinamn är på engelska. Kategorisering kan göras av sig själv eller tillsammans med modellen med nyare taggar.

Taxonomi med 86 kategorier

Azure AI Vision kan kategorisera en bild brett eller specifikt med hjälp av listan med 86 kategorier i följande diagram. Läs den fullständiga taxonomin i textformat i Kategoritaxonomi.

Grouped lists of all the categories in the category taxonomy

Exempel på bildkategorisering

Följande JSON-svar illustrerar vad Azure AI Vision returnerar när du kategoriserar exempelbilden baserat på dess visuella funktioner.

A woman on the roof of an apartment building

{
    "categories": [
        {
            "name": "people_",
            "score": 0.81640625
        }
    ],
    "requestId": "bae7f76a-1cc7-4479-8d29-48a694974705",
    "metadata": {
        "height": 200,
        "width": 300,
        "format": "Jpeg"
    }
}

I följande tabell visas en typisk bilduppsättning och kategorin som returneras av Azure AI Vision för varje bild.

Bild	Kategori
	people_group
	animal_dog
	outdoor_mountain
	food_bread

Använda API:et

Kategoriseringsfunktionen är en del av API:et Analysera bild 3.2 . Du kan anropa det här API:et via ett inbyggt SDK eller via REST-anrop. Inkludera Categories i frågeparametern visualFeatures . När du sedan får det fullständiga JSON-svaret parsar du bara strängen för innehållet i "categories" avsnittet.

Snabbstart: VISION REST API eller klientbibliotek

Nästa steg

Lär dig om relaterade begrepp för att tagga bilder och beskriva bilder.

Bildkategorisering

Taxonomi med 86 kategorier

Exempel på bildkategorisering

Använda API:et

Nästa steg

Ytterligare resurser