Co to jest analiza obrazów?

Ważne

Transport Layer Security (TLS) 1.2 jest teraz wymuszana dla wszystkich żądań HTTP do tej usługi. Aby uzyskać więcej informacji, zobacz Azure Cognitive Services zabezpieczeń.

Usługa przetwarzanie obrazów Analizy obrazów może wyodrębnić z obrazów szeroką gamę funkcji wizualnych. Może na przykład określić, czy obraz zawiera zawartość dla dorosłych, znaleźć konkretne marki lub obiekty albo znaleźć ludzkie twarze.

Analizy obrazów można używać za pośrednictwem zestawu SDK biblioteki klienta lub przez bezpośrednie wywołanie interfejsu API REST. Postępuj zgodnie z przewodnika Szybki start, aby rozpocząć pracę.

Ta dokumentacja zawiera następujące typy artykułów:

  • Przewodnik Szybki start to instrukcje krok po kroku, które pozwalają na wywołania usługi i uzyskiwanie wyników w krótkim czasie.
  • Przewodniki z instrukcjami zawierają instrukcje dotyczące korzystania z usługi w bardziej szczegółowe lub dostosowane sposoby.
  • Artykuły koncepcyjne zawierają szczegółowe wyjaśnienia dotyczące funkcjonalności i funkcji usługi.
  • Samouczki dłuższymi przewodnikami, które pokazują, jak używać tej usługi jako składnika w szerszych rozwiązaniach biznesowych.

Funkcje analizy obrazów

Możesz analizować obrazy w celu zapewnienia szczegółowych informacji o ich cechach wizualnych i cechach. Wszystkie funkcje na poniższej liście są udostępniane przez interfejs API analizowanie obrazów API. Skorzystaj z przewodnika Szybki start, aby rozpocząć pracę.

Tagowanie funkcji wizualnych

Identyfikowanie i tagowanie elementów wizualnych na obrazie w oparciu o zestaw tysięcy rozpoznawalnych obiektów, istot żywych, scenerii i akcji. Gdy tagi są niejednoznaczne lub nie są powszechnie używane, odpowiedź interfejsu API zawiera wskazówki w celu wyjaśnienia kontekstu tagu. Tagowanie nie jest ograniczone do głównego tematu, na przykład do osoby na pierwszym planie, ale uwzględnia także otoczenie (wewnątrz lub na zewnątrz), meble, narzędzia, rośliny, zwierzęta, akcesoria, gadżety itd. Tagowanie funkcji wizualnych

Wykrywanie obiektów

Wykrywanie obiektów jest podobne do tagowania, ale interfejs API zwraca współrzędne pola ograniczenia dla każdego zastosowanego tagu. Na przykład jeśli na obrazie znajduje się pies, kot i osoba, operacja wykrywania utworzy listę tych obiektów wraz z ich współrzędnymi na obrazie. Ta funkcja umożliwia przetwarzanie dalszych relacji między obiektami na obrazie. Ponadto w odpowiednich przypadkach informuje, że obraz zawiera wiele wystąpień tego samego tagu. Wykrywanie obiektów

Wykrywanie marek

Identyfikuj marki handlowe na obrazach lub filmach na podstawie bazy danych z tysiącami znaków logo z całego świata. Za pomocą tej funkcji można na przykład ustalać, które marki są najpopularniejsze w mediach społecznościowych lub najpowszechniej promowane za pomocą lokowania produktów w mediach. Wykrywanie marek

Kategoryzowanie obrazu

Identyfikowanie i kategoryzowanie całego obrazu za pomocą taksonomii kategorii z użyciem dziedzicznych hierarchii obiektów nadrzędnych i podrzędnych. Kategorii można używać oddzielnie lub z naszymi nowymi modelami tagowania.
Obecnie jedynym obsługiwanym językiem tagowania i kategoryzowania obrazów jest angielski. Kategoryzowanie obrazu

Opisywanie obrazu

Generowanie opisu całego obrazu w języku zrozumiałym dla człowieka przy użyciu pełnych zdań. Algorytmy przetwarzania obrazów generują różne opisy na podstawie obiektów zidentyfikowanych na obrazie. Poszczególne opisy są oceniane, po czym generowany jest współczynnik ufności. Następnie zwracana jest lista uporządkowana od najwyższego do najniższego współczynnika ufności. Opisywanie obrazu

Wykrywanie twarzy

Wykrywanie twarzy na obrazie i dostarczanie informacji o każdej wykrytej twarzy. Usługa przetwarzania obrazów zwraca współrzędne, prostokąt, płeć i wiek osoby dla każdej wykrytej twarzy.
przetwarzanie obrazów udostępnia podzbiór funkcji usługi rozpoznawania twarzy. Usługa rozpoznawania twarzy umożliwia bardziej szczegółową analizę, na przykład identyfikację twarzy i wykrywanie ułożenia. Wykrywanie twarzy

Wykrywanie typów obrazu

Wykrywanie właściwości obrazu, na przykład czy obraz jest rysunkiem lub prawdopodobieństwa, że obraz jest obiektem clipart. Wykrywanie typów obrazu

Wykrywanie zawartości specyficznej dla domeny

Wykrywanie i identyfikowanie zawartości obrazu specyficznej dla domeny, takiej jak osobistości i charakterystyczne elementy krajobrazu, przy użyciu modeli domeny. Jeśli na przykład obraz zawiera osoby, przetwarzanie obrazów model domeny dla osobistości w celu określenia, czy osoby wykryte na obrazie są znanymi osobistościami. Wykrywanie zawartości specyficznej dla domeny

Wykrywanie schematu kolorów

Analizowanie użycia kolorów na obrazie. Przetwarzanie obrazów może określić, czy obraz jest czarno-biały, czy kolorowy, a w przypadku obrazów kolorowych zidentyfikować kolory dominujące i kolory akcentu. Wykrywanie schematu kolorów

Generowanie miniatur

Analizowanie zawartości obrazu w celu wygenerowania dla niego odpowiedniej miniatury. Usługa przetwarzania obrazów najpierw generuje wysokiej jakości miniaturę, po czym analizuje obiekty na obrazie, aby określić obszar zainteresowania. Następnie przetwarzanie obrazów przycina obraz zgodnie z wymaganiami obszaru zainteresowania. W zależności od potrzeb wygenerowana miniatura może mieć współczynnik proporcji inny od współczynnika proporcji oryginalnego obrazu. Generowanie miniatur

Określanie obszaru zainteresowania

Przeanalizuj zawartość obrazu w celu zwrócenia współrzędnych obszaru zainteresowania. Zamiast przycinania obrazu i generowania miniatury przetwarzanie obrazów zwraca współrzędne pola granicy regionu, dzięki czemu aplikacja wywołująca może zmodyfikować oryginalny obraz zgodnie z potrzebami. Określanie obszaru zainteresowania

Moderowanie zawartości na obrazach

Możesz użyć funkcji przetwarzanie obrazów do wykrywania zawartości dla dorosłych na obrazie i zwracania ocen ufności dla różnych klasyfikacji. Próg flagowania zawartości można ustawić na przesuwanej skali, aby dostosować ją do swoich preferencji.

Wymagania obrazu

Analiza obrazów działa na obrazach, które spełniają następujące wymagania:

  • Obraz musi być w formacie JPEG, PNG, GIF lub BMP
  • Rozmiar pliku obrazu musi być mniejszy niż 4 megabajty (MB)
  • Wymiary obrazu muszą być większe niż 50x50 pikseli

Prywatność i zabezpieczenia danych

Jak w przypadku wszystkich usług Cognitive Services, deweloperzy korzystający z usługi przetwarzania obrazów powinni znać zasady firmy Microsoft dotyczące danych klientów. Zobacz stronę usług Cognitive Services w Centrum zaufania firmy Microsoft, aby dowiedzieć się więcej.

Następne kroki

Rozpoczynanie pracy z analizą obrazów, korzystając z przewodnika Szybki start w preferowanym języku programowania: