Vad är bildanalys?

Tjänsten Visuellt innehåll Image Analysis kan extrahera en mängd olika visuella funktioner från dina bilder. Den kan till exempel avgöra om en bild innehåller vuxet innehåll, hitta specifika varumärken eller objekt eller hitta mänskliga ansikten.

Du kan använda bildanalys via ett klientbiblioteks-SDK eller genom att anropa REST API direkt. Kom igång genom att följa snabbstarten.

Den här dokumentationen innehåller följande typer av artiklar:

  • Snabbstarterna är stegvisa instruktioner som gör att du kan göra anrop till tjänsten och få resultat på kort tid.
  • Instruktionsguiderna innehåller instruktioner för att använda tjänsten på mer specifika eller anpassade sätt.
  • Konceptuella artiklar innehåller detaljerade förklaringar av tjänstens funktioner och funktioner.
  • Självstudierna är längre guider som visar hur du använder den här tjänsten som en komponent i bredare affärslösningar.

Funktioner för bildanalys

Du kan analysera bilder för att ge insikter om deras visuella funktioner och egenskaper. Alla funktioner i listan nedan tillhandahålls av Analysera bild API. Följ en snabbstart för att komma igång.

Tagga visuella egenskaper

Identifiera och tagga visuella egenskaper i en bild, från tusentals identifierbara objekt, levande varelser, landskap och åtgärder. När taggarna är tvetydiga eller inte är allmänt känt ger API-svaret tips som tydliggör taggens kontext. Taggar är inte begränsade till huvudföremålet på bilden, som till exempel en person i förgrunden, utan finns även för saker som bakgrund (inomhus eller utomhus), möbler, verktyg, växter, djur, accessoarer, saker och så vidare. Tagga visuella egenskaper

En bild av en trucker med taggar lyssnar till höger

Upptäcka objekt

Objektidentifiering liknar taggar, men API:n returnerar avgränsningsfältets koordinater för varje tagg som tillämpas. Om en bild exempelvis innehåller en hund, en katt och en person, kommer identifieringsåtgärden visa en lista över dessa objekt tillsammans med deras koordinater i bilden. Du kan använda den här funktionen till att bearbeta ytterligare relationer mellan objekt i en bild. Du får även veta när det finns flera instanser av samma tagg i en bild. Upptäcka objekt

En bild av ett kontor med en rektangel ritad runt en bärbar dator

Identifiera varumärken

Identifiera varumärken i bilder och videor från en databas med tusentals olika globala logotyper. Du kan använda den här funktionen för att till exempel identifiera vilka varumärken som är mest populära på sociala medier eller förekommer oftast i medieproduktplacering. Identifiera varumärken

Kategorisera en bild

Identifiera och kategorisera en hel bild med hjälp av en kategoritaxonomi med överordnade/underordnade ärftliga hierarkier. Kategorier kan användas fristående eller med våra nya taggningsmodeller.
Engelska är för närvarande det enda språket som stöds för att tagga och kategorisera bilder. Kategorisera en bild

Beskriv en bild

Skapa en beskrivning av en hel bild i läsbart språk med fullständiga meningar. Algoritmer för visuellt innehåll genererar olika beskrivningar som baseras på de objekt som identifierats i bilden. Beskrivningarna utvärderas och förtroendepoäng genereras. Sedan returneras en lista som är sorterad efter högsta till lägsta förtroendepoäng. Beskriv en bild

En bild av kor med en enkel beskrivning till höger

Identifiera ansikten

Identifiera ansikten i en bild och ange information om varje identifierat ansikte. Visuellt innehåll returnerar koordinater, rektanglar, kön och ålder för varje identifierat ansikte.
Visuellt innehåll tillhandahåller en delmängd av ansiktstjänstens funktioner. Du kan använda tjänsten Ansiktsigenkänning för mer detaljerad analys, till exempel ansiktsidentifiering och attitydidentifiering. Identifiera ansikten

Identifiera bildtyper

Identifiera olika kännetecken om en bild som t. ex. om det är en teckning eller om den kan vara ClipArt. Identifiera bildtyper

Identifiera domänspecifikt innehåll

Använd domänmodeller för att upptäcka och identifiera domänspecifikt innehåll i en bild, till exempel kändisar och landmärken. Om en bild till exempel innehåller personer kan Visuellt innehåll använda en domänmodell för kändisar för att avgöra om de personer som identifieras i bilden är kända kändisar. Identifiera domänspecifikt innehåll

Identifiera färgschema

Analysera användningen av färg i en bild. Visuellt innehåll kan avgöra om en bild är svartvit eller i färg samt identifiera vilka färger som är basfärger och vilka färger som är accentfärger i färgbilder. Identifiera färgschema

Skapa en miniatyrbild

Analysera innehållet i en bild för att generera en lämplig miniatyrbild för den. Visuellt innehåll genererar först en högkvalitativ miniatyr och sedan analyseras objekten i bilden för att fastställa intresseområdet. Visuellt innehåll beskär sedan bilden för att den ska uppfylla kraven för intresseområdet. Den genererade miniatyrbilden kan vid behov anges med proportioner som skiljer sig från proportionerna på den ursprungliga bilden. Skapa en miniatyrbild

En bild av en person på ett berg med beskära versioner till höger

Hämta ett intresseområde

Analysera innehållet i en bild för att returnera koordinaterna för intresseområdet. I stället för att beskära bilden och generera en miniatyrbild Visuellt innehåll returnerar koordinaterna för avgränsare för regionen, så att det anropande programmet kan ändra den ursprungliga bilden efter behov. Hämta ett intresseområde

Moderera innehåll i bilder

Du kan använda Visuellt innehåll för att identifiera vuxet innehåll i en bild och returnera förtroendepoäng för olika klassificeringar. Tröskelvärdet för att flagga innehåll kan ställas in på en glidande skala för att passa dina önskemål.

Avbildningskrav

Bildanalys fungerar på bilder som uppfyller följande krav:

  • Bilden måste vara i JPEG-, PNG-, GIF- eller BMP-format
  • Filstorleken måste vara mindre än 4 megabyte (MB)
  • Bildens dimensioner måste vara större än 50 x 50 bildpunkter

Datasekretess och säkerhet

Som med alla Cognitive Services bör utvecklare som använder tjänsten Visuellt innehåll känna till Microsofts policyer gällande kunddata. Läs mer på Cognitive Services-sidan på Microsoft Trust Center.

Nästa steg

Kom igång med bildanalys genom att följa snabbstartsguiden på önskat utvecklingsspråk: