Vad är visuellt innehåll?What is Computer Vision?

Azure-tjänsten Visuellt innehåll ger utvecklare tillgång till avancerade algoritmer som bearbetar bilder och returnerar information.Azure's Computer Vision service provides developers with access to advanced algorithms that process images and return information. Om du vill analysera en bild kan du antingen ladda upp den eller ange en bild-URL.To analyze an image, you can either upload an image or specify an image URL. Algoritmerna för bildbearbetning kan analysera innehållet på olika sätt beroende på de visuella egenskaper som du är intresserad av.The images processing algorithms can analyze content in several different ways, depending on the visual features you're interested in. Till exempel kan Visuellt innehåll avgöra om en bild innehåller stötande eller olämpligt innehåll eller hitta alla människoansikten i en bild.For example, Computer Vision can determine if an image contains adult or racy content, or it can find all of the human faces in an image.

Du kan använda Visuellt innehåll i ditt program antingen med hjälp av en intern SDK eller genom att anropa REST API direkt.You can use Computer Vision in your application by using either a native SDK or invoking the REST API directly. Den här sidan beskriver allmänt vad du kan göra med Visuellt innehåll.This page broadly covers what you can do with Computer Vision.

Analysera bilder för att få insikterAnalyze images for insight

Du kan analysera bilder för att identifiera och få insikter om bildernas visuella egenskaper och kännetecken.You can analyze images to detect and provide insights about their visual features and characteristics. Alla funktioner i tabellen nedan tillhandahålls av Analyze Image-API:et.All of the features in the table below are provided by the Analyze Image API.

ÅtgärdAction BeskrivningDescription
Tagga visuella egenskaperTag visual features Identifiera och tagga visuella egenskaper i en bild, från tusentals identifierbara objekt, levande varelser, landskap och åtgärder.Identify and tag visual features in an image, from a set of thousands of recognizable objects, living things, scenery, and actions. I de fall där taggarna är tvetydiga eller dess betydelse inte är allmänt känd, ger API-svaren ”ledtrådar” som tydliggör taggarnas betydelse i ett visst sammanhang.When the tags are ambiguous or not common knowledge, the API response provides 'hints' to clarify the meaning of the tag in the context of a known setting. Taggar är inte begränsade till huvudföremålet på bilden, som till exempel en person i förgrunden, utan finns även för saker som bakgrund (inomhus eller utomhus), möbler, verktyg, växter, djur, accessoarer, saker och så vidare.Tagging isn't limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on.
Upptäcka objektDetect objects Objektidentifiering liknar taggar, men API:n returnerar avgränsningsfältets koordinater för varje tagg som tillämpas.Object detection is similar to tagging, but the API returns the bounding box coordinates for each tag applied. Om en bild exempelvis innehåller en hund, en katt och en person, kommer identifieringsåtgärden visa en lista över dessa objekt tillsammans med deras koordinater i bilden.For example, if an image contains a dog, cat and person, the Detect operation will list those objects together with their coordinates in the image. Du kan använda den här funktionen till att bearbeta ytterligare relationer mellan objekt i en bild.You can use this functionality to process further relationships between the objects in an image. Du får även veta när det finns flera instanser av samma tagg i en bild.It also lets you know when there are multiple instances of the same tag in an image.
Identifiera varumärkenDetect brands Identifiera varumärken i bilder och videor från en databas med tusentals olika globala logotyper.Identify commercial brands in images or videos from a database of thousands of global logos. Du kan använda den här funktionen för att till exempel identifiera vilka varumärken som är mest populära på sociala medier eller förekommer oftast i medieproduktplacering.You can use this feature, for example, to discover which brands are most popular on social media or most prevalent in media product placement.
Kategorisera en bildCategorize an image Identifiera och kategorisera en hel bild med hjälp av en kategoritaxonomi med överordnade/underordnade ärftliga hierarkier.Identify and categorize an entire image, using a category taxonomy with parent/child hereditary hierarchies. Kategorier kan användas fristående eller med våra nya taggningsmodeller.Categories can be used alone, or with our new tagging models.
Engelska är för närvarande det enda språket som stöds för att tagga och kategorisera bilder.Currently, English is the only supported language for tagging and categorizing images.
Beskriv en bildDescribe an image Skapa en beskrivning av en hel bild i läsbart språk med fullständiga meningar.Generate a description of an entire image in human-readable language, using complete sentences. Algoritmer för visuellt innehåll genererar olika beskrivningar som baseras på de objekt som identifierats i bilden.Computer Vision's algorithms generate various descriptions based on the objects identified in the image. Beskrivningarna utvärderas och förtroendepoäng genereras.The descriptions are each evaluated and a confidence score generated. Sedan returneras en lista som är sorterad efter högsta till lägsta förtroendepoäng.A list is then returned ordered from highest confidence score to lowest.
Identifiera ansiktenDetect faces Identifiera ansikten i en bild och ange information om varje identifierat ansikte.Detect faces in an image and provide information about each detected face. Visuellt innehåll returnerar koordinater, rektanglar, kön och ålder för varje identifierat ansikte.Computer Vision returns the coordinates, rectangle, gender, and age for each detected face.
Visuellt innehåll tillhandahåller en delmängd av de funktioner som finns i Ansiktsigenkänning och du kan använda tjänsten för ansiktsigenkänning för mer detaljerad analys, till exempel identifiering av ansikten och posering.Computer Vision provides a subset of the functionality that can be found in Face, and you can use the Face service for more detailed analysis, such as facial identification and pose detection.
Identifiera bildtyperDetect image types Identifiera olika kännetecken om en bild som t. ex. om det är en teckning eller om den kan vara ClipArt.Detect characteristics about an image, such as whether an image is a line drawing or the likelihood of whether an image is clip art.
Identifiera domänspecifikt innehållDetect domain-specific content Använd domänmodeller för att upptäcka och identifiera domänspecifikt innehåll i en bild, till exempel kändisar och landmärken.Use domain models to detect and identify domain-specific content in an image, such as celebrities and landmarks. Om en bild t. ex. innehåller personer kan visuellt innehåll använda en domänmodell för kändisar som ingår i tjänsten för att avgöra om de personer som identifieras i bilden matchar kändisar.For example, if an image contains people, Computer Vision can use a domain model for celebrities included with the service to determine if the people detected in the image match known celebrities.
Identifiera färgschemaDetect the color scheme Analysera användningen av färg i en bild.Analyze color usage within an image. Visuellt innehåll kan avgöra om en bild är svartvit eller i färg samt identifiera vilka färger som är basfärger och vilka färger som är accentfärger i färgbilder.Computer Vision can determine whether an image is black & white or color and, for color images, identify the dominant and accent colors.
Skapa en miniatyrbildGenerate a thumbnail Analysera innehållet i en bild för att generera en lämplig miniatyrbild för den.Analyze the contents of an image to generate an appropriate thumbnail for that image. Visuellt innehåll genererar först en högkvalitativ miniatyr och sedan analyseras objekten i bilden för att fastställa intresseområdet.Computer Vision first generates a high-quality thumbnail and then analyzes the objects within the image to determine the area of interest. Visuellt innehåll beskär sedan bilden för att den ska uppfylla kraven för intresseområdet.Computer Vision then crops the image to fit the requirements of the area of interest. Den genererade miniatyrbilden kan vid behov anges med proportioner som skiljer sig från proportionerna på den ursprungliga bilden.The generated thumbnail can be presented using an aspect ratio that is different from the aspect ratio of the original image, depending on your needs.
Hämta ett intresseområdeGet the area of interest Analysera innehållet i en bild för att returnera koordinaterna för intresseområdet.Analyze the contents of an image to return the coordinates of the area of interest. Det här är samma funktion som används för att skapa miniatyrbilder, men i stället för att bilden beskärs returnerar Visuellt innehåll avgränsningsfältets koordinater i regionen så att det anropande programmet kan ändra den ursprungliga bilden efter behov.This is the same function that is used to generate a thumbnail, but instead of cropping the image, Computer Vision returns the bounding box coordinates of the region, so the calling application can modify the original image as desired.

Extrahera text från bilderExtract text from images

Du kan använda för visuellt innehåll för att extrahera text från en avbildning till en mängd med hjälp av optisk teckenläsning (OCR).You can use Computer Vision to extract text from an image into a machine-readable character stream using optical character recognition (OCR). Om det behövs korrigerar OCR rotationen av den tolkade texten och anger ramkoordinater för varje ord.If needed, OCR corrects the rotation of the recognized text and provides the frame coordinates of each word. OCR har stöd för 25 olika språk och identifierar automatiskt språket för den tolkade texten.OCR supports 25 languages and automatically detects the language of the recognized text.

Du kan också använda den tillgång till API att extrahera utskrivna såväl som handskriven text från bilder och textbaserade dokument.You can also use the Read API to extract both printed and handwritten text from images and text-heavy documents. Läs-API använder uppdaterade modeller och fungerar för en mängd-objekt med olika ytor och bakgrunder, till exempel kvitton, affischer, visitkort, bokstäver och whiteboardtavlor.The Read API uses updated models and works for a variety objects with different surfaces and backgrounds, such as receipts, posters, business cards, letters, and whiteboards. Engelska är för närvarande det enda språket som stöds.Currently, English is the only supported language.

Moderera innehåll i bilderModerate content in images

Du kan använda visuellt innehåll till att identifiera innehåll som är olämpligt för barn i en bild och returnera en förtroendepoäng för dem.You can use Computer Vision to detect adult and racy content in an image and return a confidence score for both. Filtret för stötande och olämpligt innehåll kan ställas in på en skala för att passa dina preferenser.The filter for adult and racy content detection can be set on a sliding scale to accommodate your preferences.

Använda containrarUse containers

Använd containrar för visuellt innehåll för att känna igen tryckt och handskriven text lokalt genom att installera en standardiserad Docker-container som är närmare till dina data.Use Computer Vision containers to recognize printed and handwritten text locally by installing a standardized Docker container closer to your data.

AvbildningskravImage requirements

Visuellt innehåll kan analysera bilder som uppfyller följande krav:Computer Vision can analyze images that meet the following requirements:

  • Bilden måste vara i JPEG-, PNG-, GIF- eller BMP-formatThe image must be presented in JPEG, PNG, GIF, or BMP format
  • Filstorleken måste vara mindre än 4 megabyte (MB)The file size of the image must be less than 4 megabytes (MB)
  • Bildens dimensioner måste vara större än 50 x 50 bildpunkterThe dimensions of the image must be greater than 50 x 50 pixels
    • För OCR måste bildens mått vara mellan 50 x 50 och 4 200 x 4 200 bildpunkterFor OCR, the dimensions of the image must be between 50 x 50 and 4200 x 4200 pixels

Datasekretess och säkerhetData privacy and security

Som med alla Cognitive Services bör utvecklare som använder tjänsten Visuellt innehåll känna till Microsofts policyer gällande kunddata.As with all of the Cognitive Services, developers using the Computer Vision service should be aware of Microsoft's policies on customer data. Se Cognitive Services-sidan på Microsoft Trust Center om du vill veta mer.See the Cognitive Services page on the Microsoft Trust Center to learn more.

Nästa stegNext steps

Kom igång med Visuellt innehåll genom att följa en snabbstartsguide:Get started with Computer Vision by following a quickstart guide: