Mi a Computer Vision?What is Computer Vision?

Fontos

A TLS 1,2 mostantól a szolgáltatáshoz tartozó összes HTTP-kérelem esetében érvénybe lép.TLS 1.2 is now enforced for all HTTP requests to this service. További információ: Azure Cognitive Services Security.For more information, see Azure Cognitive Services security.

Az Azure Computer Vision szolgáltatása lehetővé teszi a fejlesztők számára, hogy olyan fejlett algoritmusokhoz férhessenek hozzá, amelyek képeket dolgoznak fel, és az Önt érdeklő vizuális funkciók alapján adnak vissza adatokat.Azure's Computer Vision service provides developers with access to advanced algorithms that process images and return information based on the visual features you're interested in. A Computer Vision például megállapíthatja, hogy egy rendszerkép tartalmaz-e felnőtt tartalmat, megkeresheti-e az adott márkákat vagy objektumokat, vagy megkeresheti az emberi arcokat.For example, Computer Vision can determine whether an image contains adult content, find specific brands or objects, or find human faces.

Az alkalmazásban Computer Vision az ügyféloldali kódtár SDK-n keresztül, vagy közvetlenül a REST API meghívásával is használhatja.You can use Computer Vision in your application through a client library SDK or by calling the REST API directly. Ez az oldal széles körben ismerteti, hogy mit tehet a Computer Vision.This page broadly covers what you can do with Computer Vision.

Computer Vision a digitális eszközök kezeléséhezComputer Vision for digital asset management

A Computer Vision számos digitális Asset Management-(DAM-) forgatókönyvet képes kihasználni.Computer Vision can power many digital asset management (DAM) scenarios. A DAM a gazdag média-eszközök rendszerezésének, tárolásának és lekérésének üzleti folyamata, valamint a digitális jogok és engedélyek kezelése.DAM is the business process of organizing, storing, and retrieving rich media assets and managing digital rights and permissions. Előfordulhat például, hogy egy vállalat szeretné csoportosítani és azonosítani a képeket a látható emblémák, arcok, objektumok, színek és egyebek alapján.For example, a company may want to group and identify images based on visible logos, faces, objects, colors, and so on. Vagy előfordulhat, hogy automatikusan kívánja létrehozni a képekhez tartozó feliratokat és kulcsszavakat csatolni, hogy azok kereshetőek legyenek.Or, you might want to automatically generate captions for images and attach keywords so they're searchable. Az Cognitive Services, az Azure Cognitive Search és az intelligens jelentéskészítés szolgáltatást használó teljes körű megoldásért tekintse meg a Knowledge Reporting Solution-gyorsító útmutatót a githubon.For an all-in-one DAM solution using Cognitive Services, Azure Cognitive Search, and intelligent reporting, see the Knowledge Mining Solution Accelerator Guide on GitHub. Más DAM-példákért tekintse meg a Computer Vision megoldási sablonok tárházát.For other DAM examples, see the Computer Vision Solution Templates repository.

Képek elemzése eredmények kinyeréséhezAnalyze images for insight

Elemezheti a képeket, hogy információkat szolgáltasson a vizualizáció szolgáltatásairól és jellemzőiről.You can analyze images to provide insights about their visual features and characteristics. Az alábbi táblázat összes funkcióját a rendszerkép elemzése API tartalmazza.All of the features in the table below are provided by the Analyze Image API.

MűveletekAction LeírásDescription
Vizuális jellemzők címkézéseTag visual features Azonosíthatja és címkézheti egy kép vizualizációs funkcióit több ezer felismerhető objektumból, az élő dolgokból, a díszletből és a tevékenységekből álló készletből.Identify and tag visual features in an image, from a set of thousands of recognizable objects, living things, scenery, and actions. Ha a címkék nem egyértelműek vagy nem általános ismeretek, az API-válasz a címke kontextusának tisztázására szolgáló tippeket tartalmaz.When the tags are ambiguous or not common knowledge, the API response provides hints to clarify the context of the tag. A címkézés nem korlátozódik a kép fő témájára, például az előtérben szereplő személyre, hanem magában foglalja a környezetet (beltér vagy kültér), bútorokat, eszközöket, növényeket, állatokat, kiegészítőket, készülékeket stb.Tagging isn't limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on.
Objektumok észleléseDetect objects Az objektum-észlelés hasonlít a címkézéshez, de az API az egyes alkalmazott címkékhez tartozó határoló mezők koordinátáit adja vissza.Object detection is similar to tagging, but the API returns the bounding box coordinates for each tag applied. Ha például egy rendszerkép kutyát, macskát és személyt tartalmaz, az észlelési művelet a képen látható koordinátákkal együtt listázza ezeket az objektumokat.For example, if an image contains a dog, cat and person, the Detect operation will list those objects together with their coordinates in the image. Ezt a funkciót használhatja a képek objektumai közötti további kapcsolatok feldolgozásához.You can use this functionality to process further relationships between the objects in an image. Azt is megtudhatja, hogy mikor van több példánya ugyanazzal a címkével egy képen.It also lets you know when there are multiple instances of the same tag in an image.
Márkák észleléseDetect brands A képeken vagy videókban található kereskedelmi márkákat több ezer globális emblémából álló adatbázisból azonosíthatja.Identify commercial brands in images or videos from a database of thousands of global logos. Ezt a funkciót használhatja például arra, hogy felderítse, mely márkák a legnépszerűbbek a közösségi médiában, vagy a média termékeinek legelterjedtebb eleme.You can use this feature, for example, to discover which brands are most popular on social media or most prevalent in media product placement.
Képek kategorizálásaCategorize an image Felismeri és kategorizálja a teljes képet egy kategóriaelnevezési rendszer segítségével, szülő/gyermek hierarchiák használatával.Identify and categorize an entire image, using a category taxonomy with parent/child hereditary hierarchies. A kategóriák egyedül vagy az új címkéző modellekkel együtt is használhatóak.Categories can be used alone, or with our new tagging models.
Jelenleg az egyetlen támogatott nyelv a képek címkézéséhez és kategorizálásához az angol.Currently, English is the only supported language for tagging and categorizing images.
Képek leírásaDescribe an image Leírást hoz létre a teljes képhez a felhasználók által is olvasható nyelven, teljes mondatok használatával.Generate a description of an entire image in human-readable language, using complete sentences. A Computer Vision algoritmusai különböző leírásokat hoznak létre a képen felismert tárgyak alapján.Computer Vision's algorithms generate various descriptions based on the objects identified in the image. A leírásokat a rendszer kiértékeli, majd megbízhatósági pontszámot hoz létre hozzájuk.The descriptions are each evaluated and a confidence score generated. A megbízhatósági pontszámok listája csökkenő sorrendbe rendezve érkezik vissza.A list is then returned ordered from highest confidence score to lowest.
ArcfelismerésDetect faces Felismeri a képen található arcokat, és információval szolgál minden felismert arccal kapcsolatban.Detect faces in an image and provide information about each detected face. A Computer Vision visszaküldi az arcok koordinátáit, a téglalapot és a képen szereplő személy nemét és életkorát.Computer Vision returns the coordinates, rectangle, gender, and age for each detected face.
Computer Vision a Face szolgáltatás funkcióinak egy részét biztosítja.Computer Vision provides a subset of the Face service functionality. A Face szolgáltatást részletesebb elemzésre is használhatja, például az arc azonosítására és az észlelésre.You can use the Face service for more detailed analysis, such as facial identification and pose detection.
Képek típusának észleléseDetect image types Észleli a kép jellemzőit, például hogy a kép vonalrajz-e, vagy annak a valószínűségét, hogy a kép ClipArt.Detect characteristics about an image, such as whether an image is a line drawing or the likelihood of whether an image is clip art.
Tartományspecifikus tartalom észleléseDetect domain-specific content Tartománymodellek segítségével észleli és felismeri a kép tartományspecifikus tartalmát, például a hírességeket vagy nevezetességeket.Use domain models to detect and identify domain-specific content in an image, such as celebrities and landmarks. Ha például egy rendszerkép személyeket tartalmaz, Computer Vision a hírességek egy tartományi modelljével határozzák meg, hogy a rendszerképben észlelt személyek ismert hírességek-e.For example, if an image contains people, Computer Vision can use a domain model for celebrities to determine if the people detected in the image are known celebrities.
Színséma észleléseDetect the color scheme A képen használt színek elemzése.Analyze color usage within an image. A Computer Vision eldönti, hogy a kép fekete-fehér-e vagy színes, illetve színes képek esetében felismeri a domináns és a kiegészítő színeket.Computer Vision can determine whether an image is black & white or color and, for color images, identify the dominant and accent colors.
Miniatűr létrehozásaGenerate a thumbnail Elemzi a kép tartalmát, hogy megfelelő miniatűrt tudjon létrehozni a képhez.Analyze the contents of an image to generate an appropriate thumbnail for that image. Computer Vision először egy kiváló minőségű miniatűrt hoz létre, majd a képen található objektumokat elemzi a fontos területmeghatározásához.Computer Vision first generates a high-quality thumbnail and then analyzes the objects within the image to determine the area of interest. Computer Vision ezután megvágja a képet, hogy megfeleljen a fontos terület követelményeinek.Computer Vision then crops the image to fit the requirements of the area of interest. Igény szerint a létrehozott miniatűr az eredeti képtől eltérő oldalaránnyal is rendelkezhet.The generated thumbnail can be presented using an aspect ratio that is different from the aspect ratio of the original image, depending on your needs.
A fontos terület beszerzéseGet the area of interest Egy rendszerkép tartalmának elemzése a fontos területkoordinátáinak visszaadásához.Analyze the contents of an image to return the coordinates of the area of interest. A rendszerkép kivágása és a miniatűr létrehozása helyett a Computer Vision a régió határolókeret koordinátáit adja vissza, így a hívó alkalmazás igény szerint módosíthatja az eredeti rendszerképet.Instead of cropping the image and generating a thumbnail, Computer Vision returns the bounding box coordinates of the region, so the calling application can modify the original image as desired.

Optikai karakterfelismerés (OCR)Optical Character Recognition (OCR)

A Computer Vision az optikai karakterfelismerési (OCR) képességeket is tartalmazza.Computer Vision includes Optical Character Recognition (OCR) capabilities. Az új olvasási API használatával kinyerheti a nyomtatott és a kézírásos szöveget a képekből és a dokumentumokból.You can use the new Read API to extract printed and handwritten text from images and documents. A legújabb modelleket használja, és számos felületen és háttérbeli szöveggel működik együtt.It uses the latest models and works with text on a variety of surfaces and backgrounds. Ezek az inclue-visszaigazolások, plakátok, névjegykártyák, levelek és táblák.These inclue receipts, posters, business cards, letters, and whiteboards. A két OCR API támogatja a nyomtatott szövegek több nyelvenvaló kinyerését.The two OCR APIs support extracting printed text in several languages.

Képek tartalmának moderálásaModerate content in images

A Computer Vision használatával felderítheti a felnőtt tartalmakat egy rendszerképben, és a különböző besorolások megbízhatósági pontszámait is visszaküldheti.You can use Computer Vision to detect adult content in an image and return confidence scores for different classifications. A tartalom megjelölésére vonatkozó küszöbérték beállítható egy csúszó skálán, hogy megfeleljenek a beállításoknak.The threshold for flagging content can be set on a sliding scale to accommodate your preferences.

Tárolók használataUse containers

Computer Vision tárolók használatával helyileg ismeri fel a nyomtatott és a kézírásos szövegeket, ha a szabványos Docker-tárolót az adataihoz közelebb telepíti.Use Computer Vision containers to recognize printed and handwritten text locally by installing a standardized Docker container closer to your data.

A rendszerképre vonatkozó követelményekImage requirements

A Computer Vision a következő követelményeknek megfelelő képeket képes elemezni:Computer Vision can analyze images that meet the following requirements:

  • A képnek JPEG, PNG, GIF vagy BMP formátumúnak kell lennieThe image must be presented in JPEG, PNG, GIF, or BMP format
  • A fájlméret nem érheti el a 4 megabájtot (MB)The file size of the image must be less than 4 megabytes (MB)
  • A képnek nagyobbnak kell lennie, mint 50 x 50 képpontThe dimensions of the image must be greater than 50 x 50 pixels
    • Az olvasási API esetében a rendszerkép méretei 50 x 50 és 10000 x 10000 képpont közé kell, hogy legyenek.For the Read API, the dimensions of the image must be between 50 x 50 and 10000 x 10000 pixels.

Adatvédelem és biztonságData privacy and security

Akárcsak az összes Cognitive Services esetében, a Computer Vision szolgáltatást használó fejlesztőknek ismerniük kell a Microsoft adatkezelési szabályzatait.As with all of the Cognitive Services, developers using the Computer Vision service should be aware of Microsoft's policies on customer data. További információért tekintse meg a Microsoft adatvédelmi központjának Cognitive Services lapját .See the Cognitive Services page on the Microsoft Trust Center to learn more.

További lépésekNext steps

A Computer Vision használatának első lépései a gyors üzembe helyezési útmutatót követve:Get started with Computer Vision by following a quickstart guide: