Mi a Computer Vision?What is Computer Vision?

Az Azure Computer Vision szolgáltatása lehetővé teszi a fejlesztőknek, hogy a képeket feldolgozó és a visszaadott adatokat használó fejlett algoritmusokhoz hozzáférjenek.Azure's Computer Vision service provides developers with access to advanced algorithms that process images and return information. A kép elemzéséhez feltöltheti a képet, vagy megadhatja a kép URL-címét.To analyze an image, you can either upload an image or specify an image URL. A képfeldolgozó algoritmusok számos különböző módon elemezheti a tartalmakat, attól függően, hogy milyen vizuális funkciók érdeklik.The images processing algorithms can analyze content in several different ways, depending on the visual features you're interested in. A Computer Vision például megállapíthatja, hogy egy rendszerkép tartalmaz-e felnőtt tartalmat, vagy megtalálhatja a képen látható összes emberi arcot.For example, Computer Vision can determine if an image contains adult content, or it can find all of the human faces in an image.

A Computer Vision az alkalmazásban natív SDK használatával vagy közvetlenül a REST API meghívásával használhatja.You can use Computer Vision in your application by using either a native SDK or invoking the REST API directly. Ez az oldal széles körben ismerteti, hogy mit tehet a Computer Vision.This page broadly covers what you can do with Computer Vision.

Képek elemzése a betekintéshezAnalyze images for insight

A képeket elemezheti a vizualizáció funkcióinak és jellemzőinek észleléséhez és elemzéséhez.You can analyze images to detect and provide insights about their visual features and characteristics. Az alábbi táblázat összes funkcióját a rendszerkép elemzése API tartalmazza.All of the features in the table below are provided by the Analyze Image API.

ActionAction LeírásDescription
Vizuális jellemzők címkézéseTag visual features Azonosíthatja és címkézheti egy kép vizualizációs funkcióit több ezer felismerhető objektumból, az élő dolgokból, a díszletből és a tevékenységekből álló készletből.Identify and tag visual features in an image, from a set of thousands of recognizable objects, living things, scenery, and actions. Ha a címkék nem egyértelműek vagy nem általános ismeretek, az API-válasz a címke kontextusának tisztázására szolgáló tippeket tartalmaz.When the tags are ambiguous or not common knowledge, the API response provides hints to clarify the context of the tag. A címkézés nem korlátozódik a kép fő témájára, például az előtérben szereplő személyre, hanem magában foglalja a környezetet (beltér vagy kültér), bútorokat, eszközöket, növényeket, állatokat, kiegészítőket, készülékeket stb.Tagging isn't limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on.
Objektumok észleléseDetect objects Az objektum-észlelés hasonlít a címkézéshez, de az API az egyes alkalmazott címkékhez tartozó határoló mezők koordinátáit adja vissza.Object detection is similar to tagging, but the API returns the bounding box coordinates for each tag applied. Ha például egy rendszerkép kutyát, macskát és személyt tartalmaz, az észlelési művelet a képen látható koordinátákkal együtt listázza ezeket az objektumokat.For example, if an image contains a dog, cat and person, the Detect operation will list those objects together with their coordinates in the image. Ezt a funkciót használhatja a képek objektumai közötti további kapcsolatok feldolgozásához.You can use this functionality to process further relationships between the objects in an image. Azt is megtudhatja, hogy mikor van több példánya ugyanazzal a címkével egy képen.It also lets you know when there are multiple instances of the same tag in an image.
Márkák észleléseDetect brands A képeken vagy videókban található kereskedelmi márkákat több ezer globális emblémából álló adatbázisból azonosíthatja.Identify commercial brands in images or videos from a database of thousands of global logos. Ezt a funkciót használhatja például arra, hogy felderítse, mely márkák a legnépszerűbbek a közösségi médiában, vagy a média termékeinek legelterjedtebb eleme.You can use this feature, for example, to discover which brands are most popular on social media or most prevalent in media product placement.
Képek kategorizálásaCategorize an image Felismeri és kategorizálja a teljes képet egy kategóriaelnevezési rendszer segítségével, szülő/gyermek hierarchiák használatával.Identify and categorize an entire image, using a category taxonomy with parent/child hereditary hierarchies. A kategóriák egyedül vagy az új címkéző modellekkel együtt is használhatóak.Categories can be used alone, or with our new tagging models.
Jelenleg az egyetlen támogatott nyelv a képek címkézéséhez és kategorizálásához az angol.Currently, English is the only supported language for tagging and categorizing images.
Képek leírásaDescribe an image Leírást hoz létre a teljes képhez a felhasználók által is olvasható nyelven, teljes mondatok használatával.Generate a description of an entire image in human-readable language, using complete sentences. A Computer Vision algoritmusai különböző leírásokat hoznak létre a képen felismert tárgyak alapján.Computer Vision's algorithms generate various descriptions based on the objects identified in the image. A leírásokat a rendszer kiértékeli, majd megbízhatósági pontszámot hoz létre hozzájuk.The descriptions are each evaluated and a confidence score generated. A megbízhatósági pontszámok listája csökkenő sorrendbe rendezve érkezik vissza.A list is then returned ordered from highest confidence score to lowest.
ArcfelismerésDetect faces Felismeri a képen található arcokat, és információval szolgál minden felismert arccal kapcsolatban.Detect faces in an image and provide information about each detected face. A Computer Vision visszaküldi az arcok koordinátáit, a téglalapot és a képen szereplő személy nemét és életkorát.Computer Vision returns the coordinates, rectangle, gender, and age for each detected face.
Computer Vision a Face szolgáltatás funkcióinak egy részét biztosítja.Computer Vision provides a subset of the Face service functionality. A Face szolgáltatást részletesebb elemzésre is használhatja, például az arc azonosítására és az észlelésre.You can use the Face service for more detailed analysis, such as facial identification and pose detection.
Képek típusának észleléseDetect image types Észleli a kép jellemzőit, például hogy a kép vonalrajz-e, vagy annak a valószínűségét, hogy a kép ClipArt.Detect characteristics about an image, such as whether an image is a line drawing or the likelihood of whether an image is clip art.
Tartományspecifikus tartalom észleléseDetect domain-specific content Tartománymodellek segítségével észleli és felismeri a kép tartományspecifikus tartalmát, például a hírességeket vagy nevezetességeket.Use domain models to detect and identify domain-specific content in an image, such as celebrities and landmarks. Ha például egy rendszerkép személyeket tartalmaz, Computer Vision a hírességek egy tartományi modelljével határozzák meg, hogy a rendszerképben észlelt személyek ismert hírességek-e.For example, if an image contains people, Computer Vision can use a domain model for celebrities to determine if the people detected in the image are known celebrities.
Színséma észleléseDetect the color scheme A képen használt színek elemzése.Analyze color usage within an image. A Computer Vision eldönti, hogy a kép fekete-fehér-e vagy színes, illetve színes képek esetében felismeri a domináns és a kiegészítő színeket.Computer Vision can determine whether an image is black & white or color and, for color images, identify the dominant and accent colors.
Miniatűr létrehozásaGenerate a thumbnail Elemzi a kép tartalmát, hogy megfelelő miniatűrt tudjon létrehozni a képhez.Analyze the contents of an image to generate an appropriate thumbnail for that image. Computer Vision először egy kiváló minőségű miniatűrt hoz létre, majd a képen található objektumokat elemzi a fontos területmeghatározásához.Computer Vision first generates a high-quality thumbnail and then analyzes the objects within the image to determine the area of interest. Computer Vision ezután megvágja a képet, hogy megfeleljen a fontos terület követelményeinek.Computer Vision then crops the image to fit the requirements of the area of interest. Igény szerint a létrehozott miniatűr az eredeti képtől eltérő oldalaránnyal is rendelkezhet.The generated thumbnail can be presented using an aspect ratio that is different from the aspect ratio of the original image, depending on your needs.
A fontos terület beszerzéseGet the area of interest Egy rendszerkép tartalmának elemzése a fontos területkoordinátáinak visszaadásához.Analyze the contents of an image to return the coordinates of the area of interest. A rendszerkép kivágása és a miniatűr létrehozása helyett a Computer Vision a régió határolókeret koordinátáit adja vissza, így a hívó alkalmazás igény szerint módosíthatja az eredeti rendszerképet.Instead of cropping the image and generating a thumbnail, Computer Vision returns the bounding box coordinates of the region, so the calling application can modify the original image as desired.

Szöveg kinyerése a képekbőlExtract text from images

A Computer Vision READ API használatával kinyerheti a nyomtatott és a kézírásos szöveget a képekből egy géppel olvasható karakteres adatfolyamba.You can use Computer Vision Read API to extract printed and handwritten text from images into a machine-readable character stream. Az olvasási API a legújabb modelleket használja, és számos felületen és háttérbeli szöveggel dolgozik, például a nyugták, a plakátok, az üzleti kártyák, a levelek és a táblák.The Read API uses our latest models and works with text on a variety of surfaces and backgrounds, such as receipts, posters, business cards, letters, and whiteboards. Jelenleg az egyetlen támogatott nyelv az angol.Currently, English is the only supported language.

Az optikai karakterfelismerési (OCR) API használatával több nyelven is kinyerheti a nyomtatott szöveget.You can also use the optical character recognition (OCR) API to extract printed text in several languages. Ha szükséges, az OCR kijavította a felismert szöveg forgását, és megadja az egyes szavak keretének koordinátáit.If needed, OCR corrects the rotation of the recognized text and provides the frame coordinates of each word. Az OCR 25 nyelvet támogat, és automatikusan észleli a felismert szöveg nyelvét.OCR supports 25 languages and automatically detects the language of the recognized text.

Mérsékelt tartalom a képekbenModerate content in images

A Computer Vision használatával felderítheti a felnőtt tartalmakat egy rendszerképben, és a különböző besorolások megbízhatósági pontszámait is visszaküldheti.You can use Computer Vision to detect adult content in an image and return confidence scores for different classifications. A tartalom megjelölésére vonatkozó küszöbérték beállítható egy csúszó skálán, hogy megfeleljenek a beállításoknak.The threshold for flagging content can be set on a sliding scale to accommodate your preferences.

Tárolók használataUse containers

Computer Vision tárolók használatával helyileg ismeri fel a nyomtatott és a kézírásos szövegeket, ha a szabványos Docker-tárolót az adataihoz közelebb telepíti.Use Computer Vision containers to recognize printed and handwritten text locally by installing a standardized Docker container closer to your data.

A rendszerképre vonatkozó követelményekImage requirements

A Computer Vision a következő követelményeknek megfelelő képeket képes elemezni:Computer Vision can analyze images that meet the following requirements:

  • A képnek JPEG, PNG, GIF vagy BMP formátumúnak kell lennieThe image must be presented in JPEG, PNG, GIF, or BMP format
  • A fájlméret nem érheti el a 4 megabájtot (MB)The file size of the image must be less than 4 megabytes (MB)
  • A képnek nagyobbnak kell lennie, mint 50 x 50 képpontThe dimensions of the image must be greater than 50 x 50 pixels
    • Az olvasási API esetében a rendszerkép méretei 50 x 50 és 10000 x 10000 képpont közé kell, hogy legyenek.For the Read API, the dimensions of the image must be between 50 x 50 and 10000 x 10000 pixels.

Adatvédelem és biztonságData privacy and security

Akárcsak az összes Cognitive Services esetében, a Computer Vision szolgáltatást használó fejlesztőknek ismerniük kell a Microsoft adatkezelési szabályzatait.As with all of the Cognitive Services, developers using the Computer Vision service should be aware of Microsoft's policies on customer data. További információért tekintse meg a Microsoft adatvédelmi központjának Cognitive Services lapját .See the Cognitive Services page on the Microsoft Trust Center to learn more.

További lépésekNext steps

A Computer Vision használatának első lépései a gyors üzembe helyezési útmutatót követve:Get started with Computer Vision by following a quickstart guide: