ComputerVisionClient Klass

Referens

VISUELLT INNEHÅLL-API:et tillhandahåller avancerade algoritmer för att bearbeta bilder och returnera information. Den kan till exempel användas för att avgöra om en bild innehåller moget innehåll eller om den kan användas för att hitta alla ansikten i en bild. Den har även andra funktioner som att beräkna dominerande och accentfärger, kategorisera och dela upp innehållet i bilder och beskriva en bild med fullständiga engelska meningar. Den kan dessutom också smart generera miniatyrer av bilder för att visa stora bilder på ett effektivt sätt.

Arv: azure.cognitiveservices.vision.computervision.operations._computer_vision_client_operations.ComputerVisionClientOperationsMixin

ComputerVisionClient

SDKClient

ComputerVisionClient

Konstruktor

ComputerVisionClient(endpoint, credentials)

Parametrar

endpoint: str

Obligatorisk

Cognitive Services-slutpunkter som stöds.

credentials: None

Obligatorisk

Prenumerationsautentiseringsuppgifter som unikt identifierar klientprenumeration.

Variabler

config: ComputerVisionClientConfiguration

Konfiguration för klienten.

Metoder

analyze_image	Den här åtgärden extraherar en omfattande uppsättning visuella funktioner baserat på bildinnehållet. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. I din begäran finns det en valfri parameter som gör att du kan välja vilka funktioner som ska returneras. Som standard returneras bildkategorier i svaret. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
analyze_image_by_domain	Den här åtgärden identifierar innehåll i en bild genom att tillämpa en domänspecifik modell. Listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et kan hämtas med hjälp av GET-begäran för /models. API:et tillhandahåller för närvarande följande domänspecifika modeller: kändisar, landmärken. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
analyze_image_by_domain_in_stream	Den här åtgärden identifierar innehåll i en bild genom att tillämpa en domänspecifik modell. Listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et kan hämtas med hjälp av GET-begäran för /models. API:et tillhandahåller för närvarande följande domänspecifika modeller: kändisar, landmärken. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
analyze_image_in_stream	Den här åtgärden extraherar en omfattande uppsättning visuella funktioner baserat på bildinnehållet. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. I din begäran finns det en valfri parameter som gör att du kan välja vilka funktioner som ska returneras. Som standard returneras bildkategorier i svaret. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
close	Stäng klienten om keep_alive är Sant.
describe_image	Den här åtgärden genererar en beskrivning av en bild på ett läsbart språk med fullständiga meningar. Beskrivningen baseras på en samling innehållstaggar som också returneras av åtgärden. Mer än en beskrivning kan genereras för varje bild. Beskrivningar sorteras efter deras konfidenspoäng. Beskrivningar kan innehålla resultat från kändis- och landmärkesdomänmodeller, om tillämpligt. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
describe_image_in_stream	Den här åtgärden genererar en beskrivning av en bild på ett läsbart språk med fullständiga meningar. Beskrivningen baseras på en samling innehållstaggar som också returneras av åtgärden. Mer än en beskrivning kan genereras för varje bild. Beskrivningar sorteras efter deras konfidenspoäng. Beskrivningar kan innehålla resultat från kändis- och landmärkesdomänmodeller, om tillämpligt. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
detect_objects	Utför objektidentifiering på den angivna bilden. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
detect_objects_in_stream	Utför objektidentifiering på den angivna bilden. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
generate_thumbnail	Den här åtgärden genererar en miniatyrbild med användarens angivna bredd och höjd. Som standard analyserar tjänsten bilden, identifierar det intressanta området (ROI) och skapar smarta beskärningskoordinater baserat på det intressanta området. Smart beskärning hjälper när du anger ett proportioner som skiljer sig från indatabildens. Om åtgärden lyckas innehåller svaret binärfilen för miniatyrbilden. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.
generate_thumbnail_in_stream	Den här åtgärden genererar en miniatyrbild med användarens angivna bredd och höjd. Som standard analyserar tjänsten bilden, identifierar det intressanta området (ROI) och skapar smarta beskärningskoordinater baserat på det intressanta området. Smart beskärning hjälper när du anger ett proportioner som skiljer sig från indatabildens. Om åtgärden lyckas innehåller svaret binärfilen för miniatyrbilden. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.
get_area_of_interest	Den här åtgärden returnerar en avgränsningsruta runt bildens viktigaste område. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.
get_area_of_interest_in_stream	Den här åtgärden returnerar en avgränsningsruta runt bildens viktigaste område. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.
get_read_result	Det här gränssnittet används för att hämta OCR-resultat från läsåtgärden. URL:en till det här gränssnittet ska hämtas från fältet "Åtgärdsplats" som returneras från läsgränssnittet.
list_models	Den här åtgärden returnerar listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et. API:et stöder för närvarande följande domänspecifika modeller: kändisigenkänning, landmärkesigenkänning. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
read	Använd det här gränssnittet för att få resultatet av en läsåtgärd med de avancerade OCR-algoritmerna (Optisk teckenläsning) som är optimerade för textintensiva dokument. När du använder gränssnittet Läs innehåller svaret ett fält med namnet "Operation-Location". Fältet Operation-Location innehåller den URL som du måste använda för åtgärden GetReadResult för att få åtkomst till OCR-resultat..
read_in_stream	Använd det här gränssnittet för att få resultatet av en läsåtgärd med de avancerade OCR-algoritmerna (Optisk teckenläsning) som är optimerade för textintensiva dokument. När du använder gränssnittet Läs innehåller svaret ett fält med namnet "Operation-Location". Fältet Operation-Location innehåller den URL som du måste använda för åtgärden GetReadResult för att få åtkomst till OCR-resultat..
recognize_printed_text	Optisk teckenläsning (OCR) identifierar text i en bild och extraherar de identifierade tecknen till en datorbaserad teckenström. När det lyckas returneras OCR-resultaten. Vid fel returneras felkoden tillsammans med ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage eller InternalServerError.
recognize_printed_text_in_stream	Optisk teckenläsning (OCR) identifierar text i en bild och extraherar de identifierade tecknen till en datorbaserad teckenström. När det lyckas returneras OCR-resultaten. Vid fel returneras felkoden tillsammans med ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage eller InternalServerError.
tag_image	Den här åtgärden genererar en lista med ord, eller taggar, som är relevanta för innehållet i den angivna bilden. API:et Visuellt innehåll kan returnera taggar baserat på objekt, levande varelser, landskap eller åtgärder som finns i bilder. Till skillnad från kategorier ordnas inte taggar enligt ett hierarkiskt klassificeringssystem, utan motsvarar bildinnehåll. Taggar kan innehålla tips för att undvika tvetydigheter eller ge kontext, till exempel kan taggen "ascomycete" åtföljas av tipset "svamp". Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
tag_image_in_stream	Den här åtgärden genererar en lista med ord, eller taggar, som är relevanta för innehållet i den angivna bilden. API:et Visuellt innehåll kan returnera taggar baserat på objekt, levande varelser, landskap eller åtgärder som finns i bilder. Till skillnad från kategorier ordnas inte taggar enligt ett hierarkiskt klassificeringssystem, utan motsvarar bildinnehåll. Taggar kan innehålla tips för att undvika tvetydigheter eller ge kontext, till exempel kan taggen "ascomycete" åtföljas av tipset "svamp". Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.

analyze_image

Den här åtgärden extraherar en omfattande uppsättning visuella funktioner baserat på bildinnehållet. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. I din begäran finns det en valfri parameter som gör att du kan välja vilka funktioner som ska returneras. Som standard returneras bildkategorier i svaret. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.

analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametrar

url: str

Obligatorisk

Offentligt nåbar URL för en bild.

visual_features: list[str eller VisualFeatureTypes]

standardvärde: None

En sträng som anger vilka typer av visuella funktioner som ska returneras. Flera värden bör kommaavgränsas. Giltiga visuella funktionstyper är: Kategorier – kategoriserar bildinnehåll enligt en taxonomi som definieras i dokumentationen. Taggar – taggar bilden med en detaljerad lista med ord relaterade till bildinnehållet. Beskrivning – beskriver bildinnehållet med en fullständig engelsk mening. Ansikten – identifierar om ansikten finns. Om det finns, generera koordinater, kön och ålder. ImageType – identifierar om bilden är ClipArt eller en linjeritning. Färg – avgör accentfärg, dominerande färg och om en bild är svartvit&. Vuxen – upptäcker om bilden är pornografisk till sin natur (visar nakenhet eller en sexakt) eller är blodig (visar extremt våld eller blod). Sexuellt suggestivt innehåll (även kallat olämpligt innehåll) identifieras också. Objekt – identifierar olika objekt i en bild, inklusive den ungefärliga platsen. Argumentet Objekt är endast tillgängligt på engelska. Varumärken – identifierar olika varumärken i en bild, inklusive den ungefärliga platsen. Argumentet Varumärken är endast tillgängligt på engelska.

details: list[str eller Details]

standardvärde: None

En sträng som anger vilken domänspecifik information som ska returneras. Flera värden bör kommaavgränsas. Giltiga visuella funktionstyper är: Kändisar – identifierar kändisar om de identifieras i bilden, Landmärken – identifierar viktiga landmärken i bilden.

language: str

standardvärde: en

Önskat språk för utdatagenerering. Om den här parametern inte anges är standardvärdet "en". Språk som stöds:en – engelska, standard. es - spanska, ja - japanska, pt - portugisiska, zh - förenklad kinesiska. Möjliga värden är: "en", "es", "ja", "pt", "zh"

description_exclude: list[str eller DescriptionExclude]

standardvärde: None

Inaktivera angivna domänmodeller när du genererar beskrivningen.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som ska läggas till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

ImageAnalysis eller ClientRawResponse om raw=true

Returtyp

ImageAnalysis,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

analyze_image_by_domain

Den här åtgärden identifierar innehåll i en bild genom att tillämpa en domänspecifik modell. Listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et kan hämtas med hjälp av GET-begäran för /models. API:et tillhandahåller för närvarande följande domänspecifika modeller: kändisar, landmärken. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.

analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametrar

model: str

Obligatorisk

Det domänspecifika innehåll som ska identifieras.

url: str

Obligatorisk

Offentligt nåbar URL för en bild.

language: str

standardvärde: en

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som ska läggas till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

DomainModelResults eller ClientRawResponse om raw=true

Returtyp

DomainModelResults,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

analyze_image_by_domain_in_stream

analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

model: str

Obligatorisk

Det domänspecifika innehåll som ska identifieras.

image: Generator

Obligatorisk

En bildström.

language: str

standardvärde: en

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som ska läggas till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

DomainModelResults eller ClientRawResponse om raw=true

Returtyp

DomainModelResults,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

analyze_image_in_stream

analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

image: Generator

Obligatorisk

En bildström.

visual_features: list[str eller VisualFeatureTypes]

standardvärde: None

En sträng som anger vilka typer av visuella funktioner som ska returneras. Flera värden bör kommaavgränsas. Giltiga visuella funktionstyper är: Kategorier – kategoriserar bildinnehåll enligt en taxonomi som definieras i dokumentationen. Taggar – taggar bilden med en detaljerad lista med ord relaterade till bildinnehållet. Beskrivning – beskriver bildinnehållet med en fullständig engelsk mening. Ansikten – identifierar om ansikten finns. Om det finns genererar du koordinater, kön och ålder. ImageType – identifierar om bilden är ClipArt eller en linjeritning. Färg – avgör accentfärgen, den dominerande färgen och om en bild är svartvit&. Vuxen – upptäcker om bilden är pornografisk till sin natur (illustrerar nakenhet eller en sexakt) eller är blodig (skildrar extremt våld eller blod). Sexuellt suggestivt innehåll (även kallat olämpligt innehåll) identifieras också. Objekt – identifierar olika objekt i en bild, inklusive den ungefärliga platsen. Argumentet Objekt är endast tillgängligt på engelska. Varumärken – identifierar olika varumärken i en bild, inklusive den ungefärliga platsen. Argumentet Varumärken är endast tillgängligt på engelska.

details: list[str eller Details]

standardvärde: None

En sträng som anger vilken domänspecifik information som ska returneras. Flera värden ska kommaavgränsas. Giltiga visuella funktionstyper är: Kändisar – identifierar kändisar om de identifieras i bilden, Landmärken – identifierar viktiga landmärken i bilden.

language: str

standardvärde: en

description_exclude: list[str eller DescriptionExclude]

standardvärde: None

Inaktivera angivna domänmodeller när du genererar beskrivningen.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

ImageAnalysis eller ClientRawResponse om raw=true

Returtyp

ImageAnalysis,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

close

Stäng klienten om keep_alive är Sant.

close() -> None

Undantag

ComputerVisionErrorResponseException

describe_image

Den här åtgärden genererar en beskrivning av en bild på ett läsbart språk med fullständiga meningar. Beskrivningen baseras på en samling innehållstaggar som också returneras av åtgärden. Mer än en beskrivning kan genereras för varje bild. Beskrivningar sorteras efter deras konfidenspoäng. Beskrivningar kan innehålla resultat från kändis- och landmärkesdomänmodeller, om tillämpligt. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.

describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametrar

url: str

Obligatorisk

Offentligt nåbar URL för en bild.

max_candidates: int

standardvärde: 1

Maximalt antal kandidatbeskrivningar som ska returneras. Standard är 1.

language: str

standardvärde: en

description_exclude: list[str eller DescriptionExclude]

standardvärde: None

Inaktivera angivna domänmodeller när du genererar beskrivningen.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

ImageDescription eller ClientRawResponse om raw=true

Returtyp

ImageDescription,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

describe_image_in_stream

describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

image: Generator

Obligatorisk

En bildström.

max_candidates: int

standardvärde: 1

Maximalt antal kandidatbeskrivningar som ska returneras. Standard är 1.

language: str

standardvärde: en

description_exclude: list[str eller DescriptionExclude]

standardvärde: None

Inaktivera angivna domänmodeller när du genererar beskrivningen.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

ImageDescription eller ClientRawResponse om raw=true

Returtyp

ImageDescription,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

detect_objects

Utför objektidentifiering på den angivna bilden. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.

detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametrar

url: str

Obligatorisk

Offentligt nåbar URL för en bild.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

DetectResult eller ClientRawResponse om raw=true

Returtyp

DetectResult,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

detect_objects_in_stream

detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

image: Generator

Obligatorisk

En bildström.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

DetectResult eller ClientRawResponse om raw=true

Returtyp

DetectResult,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

generate_thumbnail

Den här åtgärden genererar en miniatyrbild med användarens angivna bredd och höjd. Som standard analyserar tjänsten bilden, identifierar det intressanta området (ROI) och skapar smarta beskärningskoordinater baserat på det intressanta området. Smart beskärning hjälper när du anger ett proportioner som skiljer sig från indatabildens. Om åtgärden lyckas innehåller svaret binärfilen för miniatyrbilden. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.

generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

width: int

Obligatorisk

Miniatyrbildens bredd i bildpunkter. Den måste vara mellan 1 och 1024. Rekommenderat minst 50.

height: int

Obligatorisk

Miniatyrbildens höjd i bildpunkter. Den måste vara mellan 1 och 1024. Rekommenderat minst 50.

url: str

Obligatorisk

Offentligt nåbar URL för en bild.

smart_cropping: bool

standardvärde: False

Boolesk flagga för att aktivera smart beskärning.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som ska läggas till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

object eller ClientRawResponse om raw=true

Returtyp

Generator,

ClientRawResponse

Undantag

HttpOperationError

generate_thumbnail_in_stream

generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

width: int

Obligatorisk

Miniatyrbildens bredd i bildpunkter. Den måste vara mellan 1 och 1024. Rekommenderat minst 50.

height: int

Obligatorisk

Miniatyrbildens höjd i bildpunkter. Den måste vara mellan 1 och 1024. Rekommenderat minst 50.

image: Generator

Obligatorisk

En bildström.

smart_cropping: bool

standardvärde: False

Boolesk flagga för att aktivera smart beskärning.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som ska läggas till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

object eller ClientRawResponse om raw=true

Returtyp

Generator,

ClientRawResponse

Undantag

HttpOperationError

get_area_of_interest

Den här åtgärden returnerar en avgränsningsruta runt bildens viktigaste område. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.

get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametrar

url: str

Obligatorisk

Offentligt nåbar URL för en bild.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som ska läggas till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

AreaOfInterestResult eller ClientRawResponse om raw=true

Returtyp

AreaOfInterestResult,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

get_area_of_interest_in_stream

get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

image: Generator

Obligatorisk

En bildström.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som ska läggas till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

AreaOfInterestResult eller ClientRawResponse om raw=true

Returtyp

AreaOfInterestResult,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

get_read_result

Det här gränssnittet används för att hämta OCR-resultat från läsåtgärden. URL:en till det här gränssnittet ska hämtas från fältet "Åtgärdsplats" som returneras från läsgränssnittet.

get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)

Parametrar

operation_id: str

Obligatorisk

ID för läsåtgärd som returneras i svaret för gränssnittet "Läs".

custom_headers: dict

standardvärde: None

rubriker som ska läggas till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

ReadOperationResult eller ClientRawResponse om raw=true

Returtyp

ReadOperationResult,

ClientRawResponse

Undantag

ComputerVisionOcrErrorException

list_models

Den här åtgärden returnerar listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et. API:et stöder för närvarande följande domänspecifika modeller: kändisigenkänning, landmärkesigenkänning. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.

list_models(custom_headers=None, raw=False, **operation_config)

Parametrar

custom_headers: dict

standardvärde: None

rubriker som ska läggas till i begäran

raw: bool

standardvärde: False

returnerar direktsvaret tillsammans med det deserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

ListModelsResult eller ClientRawResponse om raw=true

Returtyp

ListModelsResult,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

read

Använd det här gränssnittet för att få resultatet av en läsåtgärd med de avancerade OCR-algoritmerna (Optisk teckenläsning) som är optimerade för textintensiva dokument. När du använder gränssnittet Läs innehåller svaret ett fält med namnet "Operation-Location". Fältet Operation-Location innehåller den URL som du måste använda för åtgärden GetReadResult för att få åtkomst till OCR-resultat..

read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)

Parametrar

url: str

Obligatorisk

Offentligt nåbar URL för en bild.

language: str eller OcrDetectionLanguage

standardvärde: None

BCP-47-språkkoden för texten i dokumentet. Läsning stöder automatisk språkidentifiering och dokument med flera språk, så ange bara en språkkod om du vill tvinga dokumentet att bearbetas på det specifika språket. Se https://aka.ms/ocr-languages för en lista över språk som stöds. Möjliga värden är: "af", "ast", 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', "gv", "hni", "hsb", "ht", "hu", "ia", "id", "it", "iu", "ja", "jv", "kaa", "kaa" c", "kea", "kha", "kl", "ko", "ku", "kw", "lb", "ms", "mww", "nap", "nl", "no", "oc", "pl", "pt", "quc", "rm", "sco", "sl", "sq", "sv", "sw", "tet", "tr", "tt", "uz", "vo", "wae", "yua", "za", "zh-Hans", "zh-Hant", "zu"

pages: list[str]

standardvärde: None

Anpassade sidnummer för flersidiga dokument (PDF/TIFF), anger antalet sidor som du vill få OCR-resultat. Använd ett bindestreck för ett antal sidor. Avgränsa varje sida eller intervall med kommatecken.

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av OCR-modellen som används för textextrahering. Accepterade värden är: "latest", "latest-preview", "2021-04-12". Standardvärdet är "senaste".

reading_order: str

standardvärde: basic

Valfri parameter för att ange vilken läsordningsalgoritm som ska användas vid beställning av extraheringstextelementen. Kan vara antingen "grundläggande" eller "naturlig". Standardvärdet är "basic" om det inte anges

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

Ingen eller ClientRawResponse om raw=true

Returtyp

None,

ClientRawResponse

Undantag

ComputerVisionOcrErrorException

read_in_stream

read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

image: Generator

Obligatorisk

En bildström.

language: str eller OcrDetectionLanguage

standardvärde: None

pages: list[str]

standardvärde: None

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av OCR-modellen som används för textextrahering. Accepterade värden är: "latest", "latest-preview", "2021-04-12". Standardvärdet är "senaste".

reading_order: str

standardvärde: basic

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

Ingen eller ClientRawResponse om raw=true

Returtyp

None,

ClientRawResponse

Undantag

ComputerVisionOcrErrorException

recognize_printed_text

Optisk teckenläsning (OCR) identifierar text i en bild och extraherar de identifierade tecknen till en datorbaserad teckenström. När det lyckas returneras OCR-resultaten. Vid fel returneras felkoden tillsammans med ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage eller InternalServerError.

recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametrar

detect_orientation: bool

standardvärde: True

Om textorienteringen i bilden identifieras. Med detectOrientation=true försöker OCR-tjänsten identifiera bildorienteringen och korrigera den innan vidare bearbetning (t.ex. om den är upp och ned).

url: str

Obligatorisk

Offentligt nåbar URL för en bild.

language: str eller OcrLanguages

standardvärde: unk

BCP-47-språkkoden för texten som ska identifieras i bilden. Standardvärdet är "unk". Möjliga värden är: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

OcrResult eller ClientRawResponse om raw=true

Returtyp

OcrResult,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

recognize_printed_text_in_stream

recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

detect_orientation: bool

standardvärde: True

image: Generator

Obligatorisk

En bildström.

language: str eller OcrLanguages

standardvärde: unk

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

OcrResult eller ClientRawResponse om raw=true

Returtyp

OcrResult,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

tag_image

Den här åtgärden genererar en lista med ord, eller taggar, som är relevanta för innehållet i den angivna bilden. API:et Visuellt innehåll kan returnera taggar baserat på objekt, levande varelser, landskap eller åtgärder som finns i bilder. Till skillnad från kategorier ordnas inte taggar enligt ett hierarkiskt klassificeringssystem, utan motsvarar bildinnehåll. Taggar kan innehålla tips för att undvika tvetydigheter eller ge kontext, till exempel kan taggen "ascomycete" åtföljas av tipset "svamp". Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.

tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametrar

url: str

Obligatorisk

Offentligt nåbar URL för en bild.

language: str

standardvärde: en

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

TagResult eller ClientRawResponse om raw=true

Returtyp

TagResult,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException

tag_image_in_stream

tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametrar

image: Generator

Obligatorisk

En bildström.

language: str

standardvärde: en

model_version: str

standardvärde: latest

Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".

custom_headers: dict

standardvärde: None

rubriker som läggs till i begäran

raw: bool

standardvärde: False

returnerar det direkta svaret tillsammans med det avserialiserade svaret

callback: Callable[<xref:Bytes>, <xref:response=None>]

standardvärde: None

När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.

operation_config

Obligatorisk

Åsidosättningar av åtgärdskonfiguration.

Returer

TagResult eller ClientRawResponse om raw=true

Returtyp

TagResult,

ClientRawResponse

Undantag

ComputerVisionErrorResponseException