Görüntü İşleme nedir?What is Computer Vision?

Azure Görüntü İşleme Hizmeti, geliştiricilerin resimleri işleyen gelişmiş algoritmalara ve ilgilendiğiniz görsel özelliklere bağlı olarak bilgi döndürmesini sağlar.Azure's Computer Vision service provides developers with access to advanced algorithms that process images and return information, depending on the visual features you're interested in. Örneğin, Görüntü İşleme bir görüntünün yetişkinlere yönelik içerik içerip içermediğini belirtebilir veya bir görüntüdeki tüm insan yüzlerini bulabilir.For example, Computer Vision can determine if an image contains adult content, or it can find all of the human faces in an image.

Uygulamanızda Yerel bir SDK aracılığıyla veya REST API doğrudan çağırarak Görüntü İşleme kullanabilirsiniz.You can use Computer Vision in your application through a native SDK or by invoking the REST API directly. Bu sayfa, Görüntü İşleme ile yapabileceklerinizi büyük ölçüde ele alır.This page broadly covers what you can do with Computer Vision.

Dijital varlık yönetimi için Görüntü İşlemeComputer Vision for digital asset management

Görüntü İşleme, birçok dijital varlık yönetimi (DAM) senaryosunu güçlendirin.Computer Vision can power many digital asset management (DAM) scenarios. DAM, zengin medya varlıklarını düzenleme, depolama ve alma ve dijital hakları ve izinleri yönetme iş sürecleridir.DAM is the business process of organizing, storing, and retrieving rich media assets and managing digital rights and permissions. Örneğin, bir şirket görünür logo, yüz, nesne, renk vb. temel alarak görüntüleri gruplamak ve tanımlamak isteyebilir.For example, a company may want to group and identify images based on visible logos, faces, objects, colors, and so on. Ya da görüntüler için otomatik olarak açıklamalı alt yazılar oluşturmak ve anahtar sözcükler eklemek isteyebilirsiniz.Or, you might want to automatically generate captions for images and attach keywords so they're searchable. Bilişsel hizmetler, Azure Bilişsel Arama ve akıllı Raporlama kullanan hepsi bir arada DAM çözümü için GitHub 'da bilgi araştırma Çözüm Hızlandırıcısı kılavuzuna bakın.For an all-in-one DAM solution using Cognitive Services, Azure Cognitive Search, and intelligent reporting, see the Knowledge Mining Solution Accelerator Guide on GitHub. Diğer DAM örnekleri için görüntü işleme çözüm şablonları deposuna bakın.For other DAM examples, see the Computer Vision Solution Templates repository.

Öngörüler için görüntüleri analiz etmeAnalyze images for insight

Görsel özellikleri ve özellikleri hakkında öngörüleri tespit etmek ve sağlamak için görüntüleri analiz edebilirsiniz.You can analyze images to detect and provide insights about their visual features and characteristics. Aşağıdaki tabloda bulunan tüm özellikler, görüntüyü çözümle API 'si tarafından sağlanır.All of the features in the table below are provided by the Analyze Image API.

EylemAction AçıklamaDescription
Görsel özellikleri etiketlemeTag visual features Görüntüde görsel özellikleri, binlerce tanınabilir nesne, çok sayıda, manzara ve eylem kümesinden belirleyin ve etiketleyin.Identify and tag visual features in an image, from a set of thousands of recognizable objects, living things, scenery, and actions. Etiketler belirsiz veya ortak olmayan bir bilgi olmadığında, API yanıtı etiketin bağlamını açıklığa kavuşturmak için ipuçları sağlar.When the tags are ambiguous or not common knowledge, the API response provides hints to clarify the context of the tag. Etiketleme yalnızca temel konu ile sınırlı kalmayıp ortam (iç mekân veya dış mekân), mobilyalar, aletler, bitkiler, hayvanlar, aksesuarlar, araçlar ve benzer öğeleri de kapsar.Tagging isn't limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on.
Nesneleri AlgılaDetect objects Nesne algılama, etiketlemeyle benzerdir ancak API, uygulanan her bir etiket için sınırlayıcı kutu koordinatlarını döndürür.Object detection is similar to tagging, but the API returns the bounding box coordinates for each tag applied. Örneğin, bir görüntü köpek, kedi ve kişi içeriyorsa, Algıla işlemi bu nesneleri görüntüdeki koordinatlarıyla birlikte listeler.For example, if an image contains a dog, cat and person, the Detect operation will list those objects together with their coordinates in the image. Görüntüdeki nesneler arasında daha fazla ilişki işlemek için bu işlevi kullanabilirsiniz.You can use this functionality to process further relationships between the objects in an image. Ayrıca, görüntüde aynı etiketin birden çok örneği olduğunu da bilmenizi sağlar.It also lets you know when there are multiple instances of the same tag in an image.
Markalar AlgılaDetect brands Binlerce küresel logo veritabanındaki resimlerde veya videolarda ticari markalar belirler.Identify commercial brands in images or videos from a database of thousands of global logos. Bu özelliği örneğin, sosyal medya veya en popüler medya ürün yerleştirmesi üzerinde en popüler olan markalar öğrenmek için kullanabilirsiniz.You can use this feature, for example, to discover which brands are most popular on social media or most prevalent in media product placement.
Bir görüntüyü kategorilere ayırmaCategorize an image Üst/alt öğe kalıtım hiyerarşileri içeren bir kategori sınıflandırması kullanarak bir görüntüyü bütünüyle tanımlayın ve kategorilere ayırın.Identify and categorize an entire image, using a category taxonomy with parent/child hereditary hierarchies. Kategoriler tek başına veya yeni etiketleme modellerimizle birlikte kullanılabilir.Categories can be used alone, or with our new tagging models.
Şu anda, görüntülerin etiketlenmesi ve kategorilere ayrılması için yalnızca İngilizce desteklenmektedir.Currently, English is the only supported language for tagging and categorizing images.
Bir görüntüyü açıklamaDescribe an image Tam cümleler kullanarak bir görüntünün tamamı için okunabilir açıklamalar oluşturun.Generate a description of an entire image in human-readable language, using complete sentences. Görüntü İşleme algoritmaları, görüntüde tanımlanan nesneleri temel alan çeşitli açıklamalar oluşturur.Computer Vision's algorithms generate various descriptions based on the objects identified in the image. Açıklamaların her biri değerlendirilir ve bir güvenilirlik puanı oluşturulur.The descriptions are each evaluated and a confidence score generated. Ardından, güvenilirlik puanı için azalan düzende sıralı bir liste döndürülür.A list is then returned ordered from highest confidence score to lowest.
Yüz algılamaDetect faces Bir görüntüdeki yüzleri algılayın ve algılanan her bir yüz için bilgiler sunun.Detect faces in an image and provide information about each detected face. Görüntü İşleme algılanan her bir yüz için koordinatları, dikdörtgeni, cinsiyeti ve yaşı döndürür.Computer Vision returns the coordinates, rectangle, gender, and age for each detected face.
Görüntü İşleme yüz hizmeti işlevlerinin bir alt kümesini sağlar.Computer Vision provides a subset of the Face service functionality. Yüz tanıma ve poz algılama gibi daha ayrıntılı analizler için yüz hizmetini kullanabilirsiniz.You can use the Face service for more detailed analysis, such as facial identification and pose detection.
Görüntü türünü algılamaDetect image types Bir görüntü ile ilgili özellikleri (görüntünün çizim olup olmaması veya küçük resim olup olmama olasılığı gibi) algılayın.Detect characteristics about an image, such as whether an image is a line drawing or the likelihood of whether an image is clip art.
Etki alanına özgü içeriği algılamaDetect domain-specific content Bir görüntüde yer alan, ünlüler ve önemli yerler gibi etki alanına özgü içerikleri algılamak ve tanımak için etki alanı modelleri kullanın.Use domain models to detect and identify domain-specific content in an image, such as celebrities and landmarks. Örneğin, bir görüntü kişi içeriyorsa Görüntü İşleme, görüntüde algılanan kişilerin bilinen ünlüler olup olmadığını tespit etmek üzere Ünlüler için bir etki alanı modeli kullanabilir.For example, if an image contains people, Computer Vision can use a domain model for celebrities to determine if the people detected in the image are known celebrities.
Renk düzenini algılamaDetect the color scheme Bir görüntüdeki renk kullanımını analiz edin.Analyze color usage within an image. Görüntü İşleme, bir görüntünün siyah-beyaz olup olmadığını belirlemenin yanı sıra renkli görüntüler için baskın renkleri ve vurgu renklerini tanıyabilir.Computer Vision can determine whether an image is black & white or color and, for color images, identify the dominant and accent colors.
Küçük resim oluşturmaGenerate a thumbnail Görüntülere uygun küçük resimler oluşturmak üzere söz konusu görüntülerin içeriklerini analiz edin.Analyze the contents of an image to generate an appropriate thumbnail for that image. Görüntü İşleme ilk olarak yüksek kaliteli bir küçük resim oluşturur ve sonra ilgilendiğiniz alanıöğrenmek için görüntü içindeki nesneleri analiz eder.Computer Vision first generates a high-quality thumbnail and then analyzes the objects within the image to determine the area of interest. Görüntü İşleme sonra görüntüyü, ilgilendiğiniz alanın gereksinimlerine uyacak şekilde kırpar.Computer Vision then crops the image to fit the requirements of the area of interest. Oluşturulan küçük resim, ihtiyaçlarınız doğrultusunda, özgün görüntünün en boy oranından farklı bir en boy oranı kullanılarak sunulabilir.The generated thumbnail can be presented using an aspect ratio that is different from the aspect ratio of the original image, depending on your needs.
İlgilendiğiniz alanı alınGet the area of interest İlgilendiğiniz alanınkoordinatlarını döndürmek için bir görüntünün içeriğini analiz edin.Analyze the contents of an image to return the coordinates of the area of interest. Görüntüyü kırpmak ve küçük resim oluşturmak yerine, Görüntü İşleme bölgenin sınırlayıcı kutusu koordinatlarını döndürür, böylece çağıran uygulama özgün görüntüyü istediğiniz gibi değiştirebilir.Instead of cropping the image and generating a thumbnail, Computer Vision returns the bounding box coordinates of the region, so the calling application can modify the original image as desired.

Görüntülerden metin AyıklaExtract text from images

Görüntülerden, yazdırılmış ve el yazısı metinleri makine tarafından okunabilen bir karakter akışına ayıklamak için Görüntü İşleme okuma API 'sini kullanabilirsiniz.You can use Computer Vision Read API to extract printed and handwritten text from images into a machine-readable character stream. Okuma API 'SI, en son modellerimizi kullanır ve alındılar, posterler, iş kartları, mektuplar ve beyaz tahtalar gibi çeşitli yüzeyler ve arka planlar üzerinde metinle birlikte çalışmaktadır.The Read API uses our latest models and works with text on a variety of surfaces and backgrounds, such as receipts, posters, business cards, letters, and whiteboards. Şu anda Ingilizce desteklenen tek dildir.Currently, English is the only supported language.

Aynı zamanda, yazdırılan metni birkaç dilde ayıklamak için optik karakter tanıma (OCR) API 'sini de kullanabilirsiniz.You can also use the optical character recognition (OCR) API to extract printed text in several languages. Gerekirse, OCR tanınan metnin dönüşünü düzeltir ve her sözcüğün kare koordinatlarını sağlar.If needed, OCR corrects the rotation of the recognized text and provides the frame coordinates of each word. OCR, 25 dili destekler ve tanınan metnin dilini otomatik olarak algılar.OCR supports 25 languages and automatically detects the language of the recognized text.

Görüntülerde orta içerikModerate content in images

Görüntü İşleme kullanarak bir görüntüdeki yetişkinlere yönelik içeriği algılayabilir ve farklı sınıflandırmaların güvenilirlik puanlarını getirebilirsiniz.You can use Computer Vision to detect adult content in an image and return confidence scores for different classifications. İçerik bayrak belirleme eşiği, tercihlerinize uyum sağlamak için bir kayan ölçekte ayarlanabilir.The threshold for flagging content can be set on a sliding scale to accommodate your preferences.

Kapsayıcıları kullanmaUse containers

Verilerinize yaklaşarak standartlaştırılmış bir Docker kapsayıcısı yükleyerek, yazdırılmış ve el yazısı metinleri yerel olarak tanımak için görüntü işleme kapsayıcıları kullanın .Use Computer Vision containers to recognize printed and handwritten text locally by installing a standardized Docker container closer to your data.

Görüntü gereksinimleriImage requirements

Görüntü İşleme, şu gereksinimleri karşılayan görüntüleri analiz edebilir:Computer Vision can analyze images that meet the following requirements:

  • Sunulan görüntünün JPEG, PNG, GIF veya BMP biçiminde olması gerekirThe image must be presented in JPEG, PNG, GIF, or BMP format
  • Görüntünün dosya boyutunun 4 megabayt (MB) değerini aşmaması gerekirThe file size of the image must be less than 4 megabytes (MB)
  • Görüntünün boyutlarının 50 x 50 pikselden büyük olması gerekirThe dimensions of the image must be greater than 50 x 50 pixels
    • Okuma API 'SI için, resmin boyutları 50 x 50 ve 10000 x 10000 piksel arasında olmalıdır.For the Read API, the dimensions of the image must be between 50 x 50 and 10000 x 10000 pixels.

Veri gizliliği ve güvenliğiData privacy and security

Tüm bilişsel hizmetlerde olduğu gibi, Görüntü İşleme hizmetini kullanan geliştiriciler Microsoft 'un müşteri verileri ilkelerine göre farkında olmalıdır.As with all of the Cognitive Services, developers using the Computer Vision service should be aware of Microsoft's policies on customer data. Daha fazla bilgi edinmek için Microsoft Güven Merkezi ' nde bilişsel Hizmetler sayfasına bakın.See the Cognitive Services page on the Microsoft Trust Center to learn more.

Sonraki adımlarNext steps

Hızlı Başlangıç kılavuzunu izleyerek Görüntü İşleme kullanmaya başlayın:Get started with Computer Vision by following a quickstart guide: