ComputerVisionClient Klasa

Interfejs API przetwarzanie obrazów udostępnia najnowocześniejsze algorytmy do przetwarzania obrazów i zwracania informacji. Na przykład można go użyć do określenia, czy obraz zawiera dojrzałą zawartość, lub może służyć do znajdowania wszystkich twarzy na obrazie. Oferuje również inne funkcje, takie jak szacowanie kolorów dominujących i wiodących, kategoryzowanie zawartości obrazów oraz opisywanie obrazu pełnymi zdaniami w języku angielskim. Ponadto umożliwia inteligentne generowanie miniatur obrazów do efektywnego wyświetlania dużych obrazów.

Dziedziczenie
azure.cognitiveservices.vision.computervision.operations._computer_vision_client_operations.ComputerVisionClientOperationsMixin
ComputerVisionClient
ComputerVisionClient

Konstruktor

ComputerVisionClient(endpoint, credentials)

Parametry

endpoint
str
Wymagane

Obsługiwane punkty końcowe usług Cognitive Services.

credentials
None
Wymagane

Poświadczenia subskrypcji, które jednoznacznie identyfikują subskrypcję klienta.

Zmienne

config
ComputerVisionClientConfiguration

Konfiguracja klienta.

Metody

analyze_image

Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. W żądaniu istnieje opcjonalny parametr umożliwiający wybranie funkcji, które mają być zwracane. Domyślnie kategorie obrazów są zwracane w odpowiedzi. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

analyze_image_by_domain

Ta operacja rozpoznaje zawartość na obrazie, stosując model specyficzny dla domeny. Listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów można pobrać przy użyciu żądania /models GET. Obecnie interfejs API udostępnia następujące modele specyficzne dla domeny: gwiazdy, punkty orientacyjne. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

analyze_image_by_domain_in_stream

Ta operacja rozpoznaje zawartość na obrazie, stosując model specyficzny dla domeny. Listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów można pobrać przy użyciu żądania /models GET. Obecnie interfejs API udostępnia następujące modele specyficzne dla domeny: gwiazdy, punkty orientacyjne. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

analyze_image_in_stream

Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. W żądaniu istnieje opcjonalny parametr umożliwiający wybranie funkcji, które mają być zwracane. Domyślnie kategorie obrazów są zwracane w odpowiedzi. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

close

Zamknij klienta, jeśli keep_alive ma wartość True.

describe_image

Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami. Opis jest oparty na kolekcji tagów zawartości, które są również zwracane przez operację. Dla każdego obrazu można wygenerować więcej niż jeden opis. Opisy są uporządkowane według ich wyniku ufności. Opisy mogą zawierać wyniki z modeli domen sławnych i przełomowych, jeśli ma to zastosowanie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

describe_image_in_stream

Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami. Opis jest oparty na kolekcji tagów zawartości, które są również zwracane przez operację. Dla każdego obrazu można wygenerować więcej niż jeden opis. Opisy są uporządkowane według ich wyniku ufności. Opisy mogą zawierać wyniki z modeli domen sławnych i przełomowych, jeśli ma to zastosowanie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

detect_objects

Wykonuje wykrywanie obiektów na określonym obrazie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

detect_objects_in_stream

Wykonuje wykrywanie obiektów na określonym obrazie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

generate_thumbnail

Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością. Domyślnie usługa analizuje obraz, identyfikuje region zainteresowania (ROI) i generuje współrzędne inteligentnego przycinania w oparciu o ten region. Inteligentne przycinanie ułatwia określenie współczynnika proporcji, który różni się od proporcji obrazu wejściowego. Po pomyślnym przetworzeniu żądania jest zwracana odpowiedź zawierająca dane binarne obrazu miniatury. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.

generate_thumbnail_in_stream

Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością. Domyślnie usługa analizuje obraz, identyfikuje region zainteresowania (ROI) i generuje współrzędne inteligentnego przycinania w oparciu o ten region. Inteligentne przycinanie ułatwia określenie współczynnika proporcji, który różni się od proporcji obrazu wejściowego. Po pomyślnym przetworzeniu żądania jest zwracana odpowiedź zawierająca dane binarne obrazu miniatury. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.

get_area_of_interest

Ta operacja zwraca pole ograniczenia wokół najważniejszego obszaru obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.

get_area_of_interest_in_stream

Ta operacja zwraca pole ograniczenia wokół najważniejszego obszaru obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.

get_read_result

Ten interfejs służy do uzyskiwania wyników OCR operacji odczytu. Adres URL tego interfejsu należy pobrać z pola "Operation-Location" zwróconego z interfejsu odczytu.

list_models

Ta operacja zwraca listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów. Obecnie interfejs API obsługuje następujące modele specyficzne dla domeny: rozpoznawanie osobistości, rozpoznawanie punktów orientacyjnych. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

read

Użyj tego interfejsu, aby uzyskać wynik operacji odczytu, wykorzystując najnowocześniejsze algorytmy optycznego rozpoznawania znaków (OCR) zoptymalizowane pod kątem dokumentów z dużą ilością tekstu. W przypadku korzystania z interfejsu Read odpowiedź zawiera pole o nazwie "Operation-Location". Pole "Operation-Location" zawiera adres URL, którego należy użyć do operacji "GetReadResult", aby uzyskać dostęp do wyników OCR..

read_in_stream

Użyj tego interfejsu, aby uzyskać wynik operacji odczytu, wykorzystując najnowocześniejsze algorytmy optycznego rozpoznawania znaków (OCR) zoptymalizowane pod kątem dokumentów z dużą ilością tekstu. W przypadku korzystania z interfejsu Read odpowiedź zawiera pole o nazwie "Operation-Location". Pole "Operation-Location" zawiera adres URL, którego należy użyć do operacji "GetReadResult", aby uzyskać dostęp do wyników OCR..

recognize_printed_text

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia znaków nadającego się do użycia maszynowo. Po pomyślnym zwróceniu wyników OCR. Po awarii zostanie zwrócony kod błędu wraz z komunikatem o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage lub InternalServerError.

recognize_printed_text_in_stream

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia znaków nadającego się do użycia maszynowo. Po pomyślnym zwróceniu wyników OCR. Po awarii zostanie zwrócony kod błędu wraz z komunikatem o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage lub InternalServerError.

tag_image

Ta operacja generuje listę wyrazów lub tagów, które są istotne dla zawartości dostarczonego obrazu. Interfejs API przetwarzanie obrazów może zwracać tagi na podstawie obiektów, istot żywych, scenerii lub akcji znalezionych na obrazach. W przeciwieństwie do kategorii tagi nie są zorganizowane zgodnie z hierarchicznym systemem klasyfikacji, ale odpowiadają zawartości obrazu. Tagi mogą zawierać wskazówki, aby uniknąć niejednoznaczności lub zapewnić kontekst, na przykład tag "ascomycete" może towarzyszyć wskazówce "grzyb". Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

tag_image_in_stream

Ta operacja generuje listę wyrazów lub tagów, które są istotne dla zawartości dostarczonego obrazu. Interfejs API przetwarzanie obrazów może zwracać tagi na podstawie obiektów, istot żywych, scenerii lub akcji znalezionych na obrazach. W przeciwieństwie do kategorii tagi nie są zorganizowane zgodnie z hierarchicznym systemem klasyfikacji, ale odpowiadają zawartości obrazu. Tagi mogą zawierać wskazówki, aby uniknąć niejednoznaczności lub zapewnić kontekst, na przykład tag "ascomycete" może towarzyszyć wskazówce "grzyb". Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

analyze_image

Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. W żądaniu istnieje opcjonalny parametr umożliwiający wybranie funkcji, które mają być zwracane. Domyślnie kategorie obrazów są zwracane w odpowiedzi. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametry

url
str
Wymagane

Publiczny adres URL obrazu.

visual_features
list[str lub VisualFeatureTypes]
wartość domyślna: None

Ciąg wskazujący, jakie typy funkcji wizualizacji mają być zwracane. Wiele wartości powinno być rozdzielonych przecinkami. Prawidłowe typy funkcji wizualizacji obejmują: Kategorie — kategoryzuje zawartość obrazu zgodnie z taksonomią zdefiniowaną w dokumentacji. Tagi — taguje obraz ze szczegółową listą słów związanych z zawartością obrazu. Opis — opisuje zawartość obrazu z pełnym zdaniem w języku angielskim. Twarze — wykrywa, czy twarze są obecne. Jeśli istnieje, wygeneruj współrzędne, płeć i wiek. ImageType — wykrywa, czy obraz jest clipart lub rysunek liniowy. Kolor — określa kolor wyróżniający, kolor dominujący i czy obraz jest czarny&biały. Dorosły - wykrywa, czy obraz jest pornograficzny w naturze (przedstawia nagość lub akt seksualny) lub jest gory (przedstawia skrajną przemoc lub krew). Wykryto również treści sugestywne seksualnie (aka rasistowskie). Obiekty — wykrywa różne obiekty na obrazie, w tym przybliżoną lokalizację. Argument Objects jest dostępny tylko w języku angielskim. Marki — wykrywa różne marki na obrazie, w tym przybliżoną lokalizację. Argument Brands jest dostępny tylko w języku angielskim.

details
list[str lub Details]
wartość domyślna: None

Ciąg wskazujący, które szczegóły specyficzne dla domeny mają być zwracane. Wiele wartości powinno być rozdzielonych przecinkami. Prawidłowe typy funkcji wizualizacji obejmują: Gwiazdy — identyfikuje gwiazdy, jeśli zostały wykryte na obrazie, Punkty orientacyjne — identyfikuje godne uwagi punkty orientacyjne na obrazie.

language
str
wartość domyślna: en

Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - uproszczony chiński. Możliwe wartości to: "en", "es", "ja", "pt", "zh"

description_exclude
list[str lub DescriptionExclude]
wartość domyślna: None

Wyłącz określone modele domeny podczas generowania opisu.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

zwraca bezpośrednią odpowiedź obok odpowiedzi deserializowanej

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

ImageAnalysis lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

analyze_image_by_domain

Ta operacja rozpoznaje zawartość na obrazie, stosując model specyficzny dla domeny. Listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów można pobrać przy użyciu żądania /models GET. Obecnie interfejs API udostępnia następujące modele specyficzne dla domeny: gwiazdy, punkty orientacyjne. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametry

model
str
Wymagane

Zawartość specyficzna dla domeny do rozpoznania.

url
str
Wymagane

Publiczny adres URL obrazu.

language
str
wartość domyślna: en

Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - uproszczony chiński. Możliwe wartości to: "en", "es", "ja", "pt", "zh"

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

zwraca bezpośrednią odpowiedź obok odpowiedzi deserializowanej

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

DomainModelResults lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

analyze_image_by_domain_in_stream

Ta operacja rozpoznaje zawartość na obrazie, stosując model specyficzny dla domeny. Listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów można pobrać przy użyciu żądania /models GET. Obecnie interfejs API udostępnia następujące modele specyficzne dla domeny: gwiazdy, punkty orientacyjne. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

model
str
Wymagane

Zawartość specyficzna dla domeny do rozpoznania.

image
Generator
Wymagane

Strumień obrazu.

language
str
wartość domyślna: en

Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - uproszczony chiński. Możliwe wartości to: "en", "es", "ja", "pt", "zh"

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

zwraca bezpośrednią odpowiedź obok odpowiedzi deserializowanej

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych przesyłanych strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty, bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

DomainModelResults lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

analyze_image_in_stream

Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. W żądaniu istnieje opcjonalny parametr umożliwiający wybranie funkcji, które mają być zwracane. Domyślnie kategorie obrazów są zwracane w odpowiedzi. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

image
Generator
Wymagane

Strumień obrazu.

visual_features
list[str lub VisualFeatureTypes]
wartość domyślna: None

Ciąg wskazujący, jakie typy funkcji wizualizacji mają być zwracane. Wiele wartości powinno być rozdzielonych przecinkami. Prawidłowe typy funkcji wizualizacji obejmują: Kategorie — kategoryzuje zawartość obrazu zgodnie z taksonomią zdefiniowaną w dokumentacji. Tagi — taguje obraz ze szczegółową listą słów związanych z zawartością obrazu. Opis — opisuje zawartość obrazu z pełnym zdaniem w języku angielskim. Twarze — wykrywa, czy twarze są obecne. Jeśli istnieje, wygeneruj współrzędne, płeć i wiek. ImageType — wykrywa, czy obraz jest clipart lub rysunek liniowy. Kolor — określa kolor wyróżniający, kolor dominujący i czy obraz jest czarny&biały. Dorosły - wykrywa, czy obraz jest pornograficzny w naturze (przedstawia nagość lub akt seksualny) lub jest gory (przedstawia skrajną przemoc lub krew). Wykryto również treści sugestywne seksualnie (aka rasistowskie). Obiekty — wykrywa różne obiekty na obrazie, w tym przybliżoną lokalizację. Argument Objects jest dostępny tylko w języku angielskim. Marki — wykrywa różne marki na obrazie, w tym przybliżoną lokalizację. Argument Brands jest dostępny tylko w języku angielskim.

details
list[str lub Details]
wartość domyślna: None

Ciąg wskazujący, które szczegóły specyficzne dla domeny mają być zwracane. Wiele wartości powinno być rozdzielonych przecinkami. Prawidłowe typy funkcji wizualizacji obejmują: Gwiazdy — identyfikuje gwiazdy, jeśli zostały wykryte na obrazie, Punkty orientacyjne — identyfikuje godne uwagi punkty orientacyjne na obrazie.

language
str
wartość domyślna: en

Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - uproszczony chiński. Możliwe wartości to: "en", "es", "ja", "pt", "zh"

description_exclude
list[str lub DescriptionExclude]
wartość domyślna: None

Wyłącz określone modele domeny podczas generowania opisu.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

zwraca bezpośrednią odpowiedź obok odpowiedzi deserializowanej

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych przesyłanych strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty, bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

ImageAnalysis lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

close

Zamknij klienta, jeśli keep_alive ma wartość True.

close() -> None

Wyjątki

describe_image

Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami. Opis jest oparty na kolekcji tagów zawartości, które są również zwracane przez operację. Dla każdego obrazu można wygenerować więcej niż jeden opis. Opisy są uporządkowane według ich wyniku ufności. Opisy mogą zawierać wyniki z modeli domen sławnych i przełomowych, jeśli ma to zastosowanie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametry

url
str
Wymagane

Publiczny adres URL obrazu.

max_candidates
int
wartość domyślna: 1

Maksymalna liczba opisów kandydatów do zwrócenia. Wartość domyślna to 1.

language
str
wartość domyślna: en

Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - uproszczony chiński. Możliwe wartości to: "en", "es", "ja", "pt", "zh"

description_exclude
list[str lub DescriptionExclude]
wartość domyślna: None

Wyłącz określone modele domeny podczas generowania opisu.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

zwraca bezpośrednią odpowiedź obok odpowiedzi deserializowanej

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

ImageDescription lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

describe_image_in_stream

Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami. Opis jest oparty na kolekcji tagów zawartości, które są również zwracane przez operację. Dla każdego obrazu można wygenerować więcej niż jeden opis. Opisy są uporządkowane według ich wyniku ufności. Opisy mogą zawierać wyniki z modeli domen sławnych i przełomowych, jeśli ma to zastosowanie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

image
Generator
Wymagane

Strumień obrazu.

max_candidates
int
wartość domyślna: 1

Maksymalna liczba opisów kandydatów do zwrócenia. Wartość domyślna to 1.

language
str
wartość domyślna: en

Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - uproszczony chiński. Możliwe wartości to: "en", "es", "ja", "pt", "zh"

description_exclude
list[str lub DescriptionExclude]
wartość domyślna: None

Wyłącz określone modele domeny podczas generowania opisu.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

zwraca bezpośrednią odpowiedź obok odpowiedzi deserializowanej

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych przesyłanych strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty, bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

ImageDescription lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

detect_objects

Wykonuje wykrywanie obiektów na określonym obrazie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametry

url
str
Wymagane

Publiczny adres URL obrazu.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

zwraca bezpośrednią odpowiedź obok odpowiedzi deserializowanej

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

DetectResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

detect_objects_in_stream

Wykonuje wykrywanie obiektów na określonym obrazie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

image
Generator
Wymagane

Strumień obrazu.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

DetectResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

generate_thumbnail

Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością. Domyślnie usługa analizuje obraz, identyfikuje region zainteresowania (ROI) i generuje współrzędne inteligentnego przycinania w oparciu o ten region. Inteligentne przycinanie ułatwia określenie współczynnika proporcji, który różni się od proporcji obrazu wejściowego. Po pomyślnym przetworzeniu żądania jest zwracana odpowiedź zawierająca dane binarne obrazu miniatury. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.

generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

width
int
Wymagane

Szerokość miniatury w pikselach. Musi zawierać się w przedziale od 1 do 1024. Zalecane minimum 50.

height
int
Wymagane

Wysokość miniatury w pikselach. Musi zawierać się w przedziale od 1 do 1024. Zalecane minimum 50.

url
str
Wymagane

Publicznie dostępny adres URL obrazu.

smart_cropping
bool
wartość domyślna: False

Flaga logiczna umożliwiająca inteligentne przycinanie.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

object lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

generate_thumbnail_in_stream

Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością. Domyślnie usługa analizuje obraz, identyfikuje region zainteresowania (ROI) i generuje współrzędne inteligentnego przycinania w oparciu o ten region. Inteligentne przycinanie ułatwia określenie współczynnika proporcji, który różni się od proporcji obrazu wejściowego. Po pomyślnym przetworzeniu żądania jest zwracana odpowiedź zawierająca dane binarne obrazu miniatury. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.

generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

width
int
Wymagane

Szerokość miniatury w pikselach. Musi zawierać się w przedziale od 1 do 1024. Zalecane minimum 50.

height
int
Wymagane

Wysokość miniatury w pikselach. Musi zawierać się w przedziale od 1 do 1024. Zalecane minimum 50.

image
Generator
Wymagane

Strumień obrazu.

smart_cropping
bool
wartość domyślna: False

Flaga logiczna umożliwiająca inteligentne przycinanie.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

object lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

get_area_of_interest

Ta operacja zwraca pole ograniczenia wokół najważniejszego obszaru obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.

get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametry

url
str
Wymagane

Publicznie dostępny adres URL obrazu.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

AreaOfInterestResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

get_area_of_interest_in_stream

Ta operacja zwraca pole ograniczenia wokół najważniejszego obszaru obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.

get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

image
Generator
Wymagane

Strumień obrazu.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

AreaOfInterestResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

get_read_result

Ten interfejs służy do uzyskiwania wyników OCR operacji odczytu. Adres URL tego interfejsu należy pobrać z pola "Operation-Location" zwróconego z interfejsu odczytu.

get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)

Parametry

operation_id
str
Wymagane

Identyfikator operacji odczytu zwróconej w odpowiedzi interfejsu "Odczyt".

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

ReadOperationResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

list_models

Ta operacja zwraca listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów. Obecnie interfejs API obsługuje następujące modele specyficzne dla domeny: rozpoznawanie osobistości, rozpoznawanie punktów orientacyjnych. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

list_models(custom_headers=None, raw=False, **operation_config)

Parametry

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

ListModelsResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

read

Użyj tego interfejsu, aby uzyskać wynik operacji odczytu, wykorzystując najnowocześniejsze algorytmy optycznego rozpoznawania znaków (OCR) zoptymalizowane pod kątem dokumentów z dużą ilością tekstu. W przypadku korzystania z interfejsu Read odpowiedź zawiera pole o nazwie "Operation-Location". Pole "Operation-Location" zawiera adres URL, którego należy użyć do operacji "GetReadResult", aby uzyskać dostęp do wyników OCR..

read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)

Parametry

url
str
Wymagane

Publicznie dostępny adres URL obrazu.

language
str lub OcrDetectionLanguage
wartość domyślna: None

Kod języka BCP-47 tekstu w dokumencie. Funkcja Read obsługuje automatyczną identyfikację języka i dokumenty w wielu językach, dlatego podaj tylko kod języka, jeśli chcesz wymusić przetworzenie dokumentu w tym konkretnym języku. Zobacz https://aka.ms/ocr-languages listę obsługiwanych języków. Możliwe wartości to: "af", "ast", "bi", 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac'', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
wartość domyślna: None

Niestandardowe numery stron dla dokumentów wielostronicowych (PDF/TIFF), wprowadź liczbę stron, które chcesz uzyskać wynik OCR. W przypadku zakresu stron użyj łącznika. Oddziel każdą stronę lub zakres przecinkiem.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu OCR używanego do wyodrębniania tekstu. Akceptowane wartości to: "latest", "latest-preview", "2021-04-12". Wartość domyślna to "latest".

reading_order
str
wartość domyślna: basic

Opcjonalny parametr określający algorytm kolejności odczytu, który ma być stosowany podczas porządkowania wyodrębnianych elementów tekstowych. Może to być "podstawowy" lub "naturalny". Wartość domyślna to "basic", jeśli nie zostanie określona

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

Brak lub Wartość ClientRawResponse, jeśli parametr raw=true

Typ zwracany

None,

Wyjątki

read_in_stream

Użyj tego interfejsu, aby uzyskać wynik operacji odczytu, wykorzystując najnowocześniejsze algorytmy optycznego rozpoznawania znaków (OCR) zoptymalizowane pod kątem dokumentów z dużą ilością tekstu. W przypadku korzystania z interfejsu Read odpowiedź zawiera pole o nazwie "Operation-Location". Pole "Operation-Location" zawiera adres URL, którego należy użyć do operacji "GetReadResult", aby uzyskać dostęp do wyników OCR..

read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

image
Generator
Wymagane

Strumień obrazu.

language
str lub OcrDetectionLanguage
wartość domyślna: None

Kod języka BCP-47 tekstu w dokumencie. Funkcja Read obsługuje automatyczną identyfikację języka i dokumenty w wielu językach, dlatego podaj tylko kod języka, jeśli chcesz wymusić przetworzenie dokumentu w tym konkretnym języku. Zobacz https://aka.ms/ocr-languages listę obsługiwanych języków. Możliwe wartości to: "af", "ast", "bi", 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac'', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
wartość domyślna: None

Niestandardowe numery stron dla dokumentów wielostronicowych (PDF/TIFF), wprowadź liczbę stron, które chcesz uzyskać wynik OCR. W przypadku zakresu stron użyj łącznika. Oddziel każdą stronę lub zakres przecinkiem.

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu OCR używanego do wyodrębniania tekstu. Akceptowane wartości to: "latest", "latest-preview", "2021-04-12". Wartość domyślna to "latest".

reading_order
str
wartość domyślna: basic

Opcjonalny parametr określający algorytm kolejności odczytu, który ma być stosowany podczas porządkowania wyodrębnianych elementów tekstowych. Może to być "podstawowy" lub "naturalny". Wartość domyślna to "basic", jeśli nie zostanie określona

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

Brak lub Wartość ClientRawResponse, jeśli parametr raw=true

Typ zwracany

None,

Wyjątki

recognize_printed_text

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia znaków nadającego się do użycia maszynowo. Po pomyślnym zwróceniu wyników OCR. Po awarii zostanie zwrócony kod błędu wraz z komunikatem o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage lub InternalServerError.

recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametry

detect_orientation
bool
wartość domyślna: True

Określa, czy na obrazie wykryto orientację tekstu. Za pomocą funkcji detectOrientation=true usługa OCR próbuje wykryć orientację obrazu i poprawić ją przed dalszym przetwarzaniem (np. jeśli jest do góry nogami).

url
str
Wymagane

Publicznie dostępny adres URL obrazu.

language
str lub OcrLanguages
wartość domyślna: unk

Kod języka BCP-47 tekstu, który ma zostać wykryty na obrazie. Wartość domyślna to "unk". Możliwe wartości to: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

OcrResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

recognize_printed_text_in_stream

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia znaków nadającego się do użycia maszynowo. Po pomyślnym zwróceniu wyników OCR. Po awarii zostanie zwrócony kod błędu wraz z komunikatem o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage lub InternalServerError.

recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

detect_orientation
bool
wartość domyślna: True

Określa, czy na obrazie wykryto orientację tekstu. Za pomocą funkcji detectOrientation=true usługa OCR próbuje wykryć orientację obrazu i poprawić ją przed dalszym przetwarzaniem (np. jeśli jest do góry nogami).

image
Generator
Wymagane

Strumień obrazu.

language
str lub OcrLanguages
wartość domyślna: unk

Kod języka BCP-47 tekstu, który ma zostać wykryty na obrazie. Wartość domyślna to "unk". Możliwe wartości to: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

OcrResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

tag_image

Ta operacja generuje listę wyrazów lub tagów, które są istotne dla zawartości dostarczonego obrazu. Interfejs API przetwarzanie obrazów może zwracać tagi na podstawie obiektów, istot żywych, scenerii lub akcji znalezionych na obrazach. W przeciwieństwie do kategorii tagi nie są zorganizowane zgodnie z hierarchicznym systemem klasyfikacji, ale odpowiadają zawartości obrazu. Tagi mogą zawierać wskazówki, aby uniknąć niejednoznaczności lub zapewnić kontekst, na przykład tag "ascomycete" może towarzyszyć wskazówce "grzyb". Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametry

url
str
Wymagane

Publicznie dostępny adres URL obrazu.

language
str
wartość domyślna: en

Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - chiński uproszczony. Możliwe wartości to: "en", "es", "ja", "pt", "zh"

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

TagResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki

tag_image_in_stream

Ta operacja generuje listę wyrazów lub tagów, które są istotne dla zawartości dostarczonego obrazu. Interfejs API przetwarzanie obrazów może zwracać tagi na podstawie obiektów, istot żywych, scenerii lub akcji znalezionych na obrazach. W przeciwieństwie do kategorii tagi nie są zorganizowane zgodnie z hierarchicznym systemem klasyfikacji, ale odpowiadają zawartości obrazu. Tagi mogą zawierać wskazówki, aby uniknąć niejednoznaczności lub zapewnić kontekst, na przykład tag "ascomycete" może towarzyszyć wskazówce "grzyb". Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.

tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametry

image
Generator
Wymagane

Strumień obrazu.

language
str
wartość domyślna: en

Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - chiński uproszczony. Możliwe wartości to: "en", "es", "ja", "pt", "zh"

model_version
str
wartość domyślna: latest

Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".

custom_headers
dict
wartość domyślna: None

nagłówki, które zostaną dodane do żądania

raw
bool
wartość domyślna: False

Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi

callback
Callable[<xref:Bytes>, <xref:response=None>]
wartość domyślna: None

Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.

operation_config
Wymagane

Przesłonięcia konfiguracji operacji.

Zwraca

TagResult lub ClientRawResponse, jeśli raw=true

Typ zwracany

Wyjątki