Czym jest przetwarzanie obrazów?What is Computer Vision?

Usługa przetwarzania obrazów platformy Azure oferuje deweloperom dostęp do zaawansowanych algorytmów przetwarzania obrazów i informacji zwrotnych.Azure's Computer Vision service provides developers with access to advanced algorithms that process images and return information. W celu analizy obrazu można przekazać obraz lub określić jego adres URL.To analyze an image, you can either upload an image or specify an image URL. Algorytmy przetwarzania obrazów pozwalają analizować zawartość na różne sposoby, w zależności od interesujących Cię funkcji wizualnych.The images processing algorithms can analyze content in several different ways, depending on the visual features you're interested in. Na przykład przetwarzanie obrazów może określić, czy obraz zawiera zawartość dla dorosłych, czy też może znaleźć wszystkie ludzkie twarzy na obrazie.For example, Computer Vision can determine if an image contains adult content, or it can find all of the human faces in an image.

Przetwarzania obrazów w aplikacji można używać, korzystając z natywnego zestawu SDK lub wywołując interfejs API REST bezpośrednio.You can use Computer Vision in your application by using either a native SDK or invoking the REST API directly. Na tej stronie ogólnie omówiono, co można zrobić za pomocą przetwarzania obrazów.This page broadly covers what you can do with Computer Vision.

Analizowanie obrazów w celu uzyskania szczegółowych informacjiAnalyze images for insight

Obrazy można analizować, aby wykrywać cechy wizualne i właściwości obrazów oraz dostarczać szczegółowe informacje na ich temat.You can analyze images to detect and provide insights about their visual features and characteristics. Wszystkie funkcje w poniższej tabeli są udostępniane przez interfejs API analizowania obrazu.All of the features in the table below are provided by the Analyze Image API.

DziałanieAction OpisDescription
Tagowanie funkcji wizualnychTag visual features Identyfikowanie i tagowanie elementów wizualnych na obrazie w oparciu o zestaw tysięcy rozpoznawalnych obiektów, istot żywych, scenerii i akcji.Identify and tag visual features in an image, from a set of thousands of recognizable objects, living things, scenery, and actions. Gdy Tagi są niejednoznaczne lub nietypowej wiedzy, odpowiedź interfejsu API zawiera wskazówki wyjaśniające kontekst znacznika.When the tags are ambiguous or not common knowledge, the API response provides hints to clarify the context of the tag. Tagowanie nie jest ograniczone do głównego tematu, na przykład do osoby na pierwszym planie, ale uwzględnia także otoczenie (wewnątrz lub na zewnątrz), meble, narzędzia, rośliny, zwierzęta, akcesoria, gadżety itd.Tagging isn't limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on.
Wykrywanie obiektówDetect objects Wykrywanie obiektów jest podobne do tagowania, ale interfejs API zwraca współrzędne pola ograniczenia dla każdego zastosowanego tagu.Object detection is similar to tagging, but the API returns the bounding box coordinates for each tag applied. Na przykład jeśli na obrazie znajduje się pies, kot i osoba, operacja wykrywania utworzy listę tych obiektów wraz z ich współrzędnymi na obrazie.For example, if an image contains a dog, cat and person, the Detect operation will list those objects together with their coordinates in the image. Ta funkcja umożliwia przetwarzanie dalszych relacji między obiektami na obrazie.You can use this functionality to process further relationships between the objects in an image. Ponadto w odpowiednich przypadkach informuje, że obraz zawiera wiele wystąpień tego samego tagu.It also lets you know when there are multiple instances of the same tag in an image.
Wykrywanie marekDetect brands Identyfikuj marki handlowe na obrazach lub filmach na podstawie bazy danych z tysiącami znaków logo z całego świata.Identify commercial brands in images or videos from a database of thousands of global logos. Za pomocą tej funkcji można na przykład ustalać, które marki są najpopularniejsze w mediach społecznościowych lub najpowszechniej promowane za pomocą lokowania produktów w mediach.You can use this feature, for example, to discover which brands are most popular on social media or most prevalent in media product placement.
Kategoryzowanie obrazuCategorize an image Identyfikowanie i kategoryzowanie całego obrazu za pomocą taksonomii kategorii z użyciem dziedzicznych hierarchii obiektów nadrzędnych i podrzędnych.Identify and categorize an entire image, using a category taxonomy with parent/child hereditary hierarchies. Kategorii można używać oddzielnie lub z naszymi nowymi modelami tagowania.Categories can be used alone, or with our new tagging models.
Obecnie jedynym obsługiwanym językiem tagowania i kategoryzowania obrazów jest angielski.Currently, English is the only supported language for tagging and categorizing images.
Opisywanie obrazuDescribe an image Generowanie opisu całego obrazu w języku zrozumiałym dla człowieka przy użyciu pełnych zdań.Generate a description of an entire image in human-readable language, using complete sentences. Algorytmy przetwarzania obrazów generują różne opisy na podstawie obiektów zidentyfikowanych na obrazie.Computer Vision's algorithms generate various descriptions based on the objects identified in the image. Poszczególne opisy są oceniane, po czym generowany jest współczynnik ufności.The descriptions are each evaluated and a confidence score generated. Następnie zwracana jest lista uporządkowana od najwyższego do najniższego współczynnika ufności.A list is then returned ordered from highest confidence score to lowest.
Wykrywanie twarzyDetect faces Wykrywanie twarzy na obrazie i dostarczanie informacji o każdej wykrytej twarzy.Detect faces in an image and provide information about each detected face. Usługa przetwarzania obrazów zwraca współrzędne, prostokąt, płeć i wiek osoby dla każdej wykrytej twarzy.Computer Vision returns the coordinates, rectangle, gender, and age for each detected face.
Przetwarzanie obrazów zapewnia podzestaw funkcji usługi kroju .Computer Vision provides a subset of the Face service functionality. Możesz użyć usługi twarzy, aby uzyskać bardziej szczegółową analizę, taką jak Identyfikacja twarzy i wykrywanie ułożenia.You can use the Face service for more detailed analysis, such as facial identification and pose detection.
Wykrywanie typów obrazuDetect image types Wykrywanie właściwości obrazu, na przykład czy obraz jest rysunkiem lub prawdopodobieństwa, że obraz jest obiektem clipart.Detect characteristics about an image, such as whether an image is a line drawing or the likelihood of whether an image is clip art.
Wykrywanie zawartości specyficznej dla domenyDetect domain-specific content Wykrywanie i identyfikowanie zawartości obrazu specyficznej dla domeny, takiej jak osobistości i charakterystyczne elementy krajobrazu, przy użyciu modeli domeny.Use domain models to detect and identify domain-specific content in an image, such as celebrities and landmarks. Na przykład jeśli obraz zawiera inne osoby, przetwarzanie obrazów może użyć modelu domeny dla osobistości, aby określić, czy osoby wykryte w obrazie są znane osobistości.For example, if an image contains people, Computer Vision can use a domain model for celebrities to determine if the people detected in the image are known celebrities.
Wykrywanie schematu kolorówDetect the color scheme Analizowanie użycia kolorów na obrazie.Analyze color usage within an image. Przetwarzanie obrazów może określić, czy obraz jest czarno-biały, czy kolorowy, a w przypadku obrazów kolorowych zidentyfikować kolory dominujące i kolory akcentu.Computer Vision can determine whether an image is black & white or color and, for color images, identify the dominant and accent colors.
Generowanie miniaturGenerate a thumbnail Analizowanie zawartości obrazu w celu wygenerowania dla niego odpowiedniej miniatury.Analyze the contents of an image to generate an appropriate thumbnail for that image. Usługa przetwarzania obrazów najpierw generuje wysokiej jakości miniaturę, po czym analizuje obiekty na obrazie, aby określić obszar zainteresowania.Computer Vision first generates a high-quality thumbnail and then analyzes the objects within the image to determine the area of interest. Następnie przetwarzanie obrazów przycina obraz zgodnie z wymaganiami obszaru zainteresowania.Computer Vision then crops the image to fit the requirements of the area of interest. W zależności od potrzeb wygenerowana miniatura może mieć współczynnik proporcji inny od współczynnika proporcji oryginalnego obrazu.The generated thumbnail can be presented using an aspect ratio that is different from the aspect ratio of the original image, depending on your needs.
Określanie obszaru zainteresowaniaGet the area of interest Przeanalizuj zawartość obrazu w celu zwrócenia współrzędnych obszaru zainteresowania.Analyze the contents of an image to return the coordinates of the area of interest. Zamiast przycinania obrazu i generowania miniatur, przetwarzanie obrazów zwraca współrzędne pola ograniczenia regionu, dzięki czemu aplikacja wywołująca może zmodyfikować oryginalny obraz zgodnie z potrzebami.Instead of cropping the image and generating a thumbnail, Computer Vision returns the bounding box coordinates of the region, so the calling application can modify the original image as desired.

Wyodrębnianie tekstu z obrazówExtract text from images

Możesz użyć przetwarzanie obrazów odczytu interfejsu API , aby wyodrębnić drukowany i odręczny tekst z obrazów do strumienia znaków z możliwością odczytu maszynowego.You can use Computer Vision Read API to extract printed and handwritten text from images into a machine-readable character stream. Interfejs API odczytu korzysta z naszych najnowszych modeli i pracuje z tekstem na różnych powierzchniach i w tle, takich jak paragony, plakaty, karty biznesowe, litery i tablice.The Read API uses our latest models and works with text on a variety of surfaces and backgrounds, such as receipts, posters, business cards, letters, and whiteboards. Obecnie jedynym obsługiwanym językiem jest angielski.Currently, English is the only supported language.

Możesz również użyć interfejsu API rozpoznawania znaków optycznych (OCR) do wyodrębniania tekstu drukowanego w kilku językach.You can also use the optical character recognition (OCR) API to extract printed text in several languages. Jeśli to konieczne, funkcja optycznego rozpoznawania znaków poprawia kąt obrotu i podaje współrzędne ramki każdego wyrazu.If needed, OCR corrects the rotation of the recognized text and provides the frame coordinates of each word. Funkcja optycznego rozpoznawania znaków obsługuje 25 języków i automatycznie wykrywa język rozpoznanego tekstu.OCR supports 25 languages and automatically detects the language of the recognized text.

Moderowanie zawartości na obrazachModerate content in images

Za pomocą przetwarzanie obrazów można wykrywać zawartość dla dorosłych w obrazie i zwracać wyniki zaufania dla różnych klasyfikacji.You can use Computer Vision to detect adult content in an image and return confidence scores for different classifications. Próg oflagowania zawartości można ustawić na ruchomej skali, aby dopasować swoje preferencje.The threshold for flagging content can be set on a sliding scale to accommodate your preferences.

Korzystanie z kontenerówUse containers

Po zainstalowaniu standardowego kontenera platformy Docker blisko danych można lokalnie rozpoznawać tekst drukowany i pismo odręczne, korzystając z kontenerów przetwarzania obrazów.Use Computer Vision containers to recognize printed and handwritten text locally by installing a standardized Docker container closer to your data.

Wymagania obrazuImage requirements

Przetwarzanie obrazów umożliwia analizowanie obrazów, które spełniają następujące wymagania:Computer Vision can analyze images that meet the following requirements:

  • Obraz musi być w formacie JPEG, PNG, GIF lub BMPThe image must be presented in JPEG, PNG, GIF, or BMP format
  • Rozmiar pliku obrazu musi być mniejszy niż 4 megabajty (MB)The file size of the image must be less than 4 megabytes (MB)
  • Wymiary obrazu muszą być większe niż 50x50 pikseliThe dimensions of the image must be greater than 50 x 50 pixels
    • W przypadku interfejsu API odczytu wymiary obrazu muszą zawierać się w przedziale od 50 x 50 do 10000 x 10000 pikseli.For the Read API, the dimensions of the image must be between 50 x 50 and 10000 x 10000 pixels.

Prywatność i zabezpieczenia danychData privacy and security

Jak w przypadku wszystkich usług Cognitive Services, deweloperzy korzystający z usługi przetwarzania obrazów powinni znać zasady firmy Microsoft dotyczące danych klientów.As with all of the Cognitive Services, developers using the Computer Vision service should be aware of Microsoft's policies on customer data. Zobacz stronę usług Cognitive Services w Centrum zaufania firmy Microsoft, aby dowiedzieć się więcej.See the Cognitive Services page on the Microsoft Trust Center to learn more.

Następne krokiNext steps

Rozpocznij pracę z przetwarzaniem obrazów, korzystając z przewodnika Szybki start:Get started with Computer Vision by following a quickstart guide: