ComputerVisionClient Klass
VISUELLT INNEHÅLL-API:et tillhandahåller avancerade algoritmer för att bearbeta bilder och returnera information. Den kan till exempel användas för att avgöra om en bild innehåller moget innehåll eller om den kan användas för att hitta alla ansikten i en bild. Den har även andra funktioner som att beräkna dominerande och accentfärger, kategorisera och dela upp innehållet i bilder och beskriva en bild med fullständiga engelska meningar. Den kan dessutom också smart generera miniatyrer av bilder för att visa stora bilder på ett effektivt sätt.
- Arv
-
azure.cognitiveservices.vision.computervision.operations._computer_vision_client_operations.ComputerVisionClientOperationsMixinComputerVisionClientComputerVisionClient
Konstruktor
ComputerVisionClient(endpoint, credentials)
Parametrar
- credentials
- None
Prenumerationsautentiseringsuppgifter som unikt identifierar klientprenumeration.
Variabler
Konfiguration för klienten.
Metoder
analyze_image |
Den här åtgärden extraherar en omfattande uppsättning visuella funktioner baserat på bildinnehållet. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. I din begäran finns det en valfri parameter som gör att du kan välja vilka funktioner som ska returneras. Som standard returneras bildkategorier i svaret. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
analyze_image_by_domain |
Den här åtgärden identifierar innehåll i en bild genom att tillämpa en domänspecifik modell. Listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et kan hämtas med hjälp av GET-begäran för /models. API:et tillhandahåller för närvarande följande domänspecifika modeller: kändisar, landmärken. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
analyze_image_by_domain_in_stream |
Den här åtgärden identifierar innehåll i en bild genom att tillämpa en domänspecifik modell. Listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et kan hämtas med hjälp av GET-begäran för /models. API:et tillhandahåller för närvarande följande domänspecifika modeller: kändisar, landmärken. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
analyze_image_in_stream |
Den här åtgärden extraherar en omfattande uppsättning visuella funktioner baserat på bildinnehållet. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. I din begäran finns det en valfri parameter som gör att du kan välja vilka funktioner som ska returneras. Som standard returneras bildkategorier i svaret. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
close |
Stäng klienten om keep_alive är Sant. |
describe_image |
Den här åtgärden genererar en beskrivning av en bild på ett läsbart språk med fullständiga meningar. Beskrivningen baseras på en samling innehållstaggar som också returneras av åtgärden. Mer än en beskrivning kan genereras för varje bild. Beskrivningar sorteras efter deras konfidenspoäng. Beskrivningar kan innehålla resultat från kändis- och landmärkesdomänmodeller, om tillämpligt. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
describe_image_in_stream |
Den här åtgärden genererar en beskrivning av en bild på ett läsbart språk med fullständiga meningar. Beskrivningen baseras på en samling innehållstaggar som också returneras av åtgärden. Mer än en beskrivning kan genereras för varje bild. Beskrivningar sorteras efter deras konfidenspoäng. Beskrivningar kan innehålla resultat från kändis- och landmärkesdomänmodeller, om tillämpligt. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
detect_objects |
Utför objektidentifiering på den angivna bilden. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
detect_objects_in_stream |
Utför objektidentifiering på den angivna bilden. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
generate_thumbnail |
Den här åtgärden genererar en miniatyrbild med användarens angivna bredd och höjd. Som standard analyserar tjänsten bilden, identifierar det intressanta området (ROI) och skapar smarta beskärningskoordinater baserat på det intressanta området. Smart beskärning hjälper när du anger ett proportioner som skiljer sig från indatabildens. Om åtgärden lyckas innehåller svaret binärfilen för miniatyrbilden. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError. |
generate_thumbnail_in_stream |
Den här åtgärden genererar en miniatyrbild med användarens angivna bredd och höjd. Som standard analyserar tjänsten bilden, identifierar det intressanta området (ROI) och skapar smarta beskärningskoordinater baserat på det intressanta området. Smart beskärning hjälper när du anger ett proportioner som skiljer sig från indatabildens. Om åtgärden lyckas innehåller svaret binärfilen för miniatyrbilden. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError. |
get_area_of_interest |
Den här åtgärden returnerar en avgränsningsruta runt bildens viktigaste område. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError. |
get_area_of_interest_in_stream |
Den här åtgärden returnerar en avgränsningsruta runt bildens viktigaste område. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError. |
get_read_result |
Det här gränssnittet används för att hämta OCR-resultat från läsåtgärden. URL:en till det här gränssnittet ska hämtas från fältet "Åtgärdsplats" som returneras från läsgränssnittet. |
list_models |
Den här åtgärden returnerar listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et. API:et stöder för närvarande följande domänspecifika modeller: kändisigenkänning, landmärkesigenkänning. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
read |
Använd det här gränssnittet för att få resultatet av en läsåtgärd med de avancerade OCR-algoritmerna (Optisk teckenläsning) som är optimerade för textintensiva dokument. När du använder gränssnittet Läs innehåller svaret ett fält med namnet "Operation-Location". Fältet Operation-Location innehåller den URL som du måste använda för åtgärden GetReadResult för att få åtkomst till OCR-resultat.. |
read_in_stream |
Använd det här gränssnittet för att få resultatet av en läsåtgärd med de avancerade OCR-algoritmerna (Optisk teckenläsning) som är optimerade för textintensiva dokument. När du använder gränssnittet Läs innehåller svaret ett fält med namnet "Operation-Location". Fältet Operation-Location innehåller den URL som du måste använda för åtgärden GetReadResult för att få åtkomst till OCR-resultat.. |
recognize_printed_text |
Optisk teckenläsning (OCR) identifierar text i en bild och extraherar de identifierade tecknen till en datorbaserad teckenström. När det lyckas returneras OCR-resultaten. Vid fel returneras felkoden tillsammans med ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage eller InternalServerError. |
recognize_printed_text_in_stream |
Optisk teckenläsning (OCR) identifierar text i en bild och extraherar de identifierade tecknen till en datorbaserad teckenström. När det lyckas returneras OCR-resultaten. Vid fel returneras felkoden tillsammans med ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage eller InternalServerError. |
tag_image |
Den här åtgärden genererar en lista med ord, eller taggar, som är relevanta för innehållet i den angivna bilden. API:et Visuellt innehåll kan returnera taggar baserat på objekt, levande varelser, landskap eller åtgärder som finns i bilder. Till skillnad från kategorier ordnas inte taggar enligt ett hierarkiskt klassificeringssystem, utan motsvarar bildinnehåll. Taggar kan innehålla tips för att undvika tvetydigheter eller ge kontext, till exempel kan taggen "ascomycete" åtföljas av tipset "svamp". Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
tag_image_in_stream |
Den här åtgärden genererar en lista med ord, eller taggar, som är relevanta för innehållet i den angivna bilden. API:et Visuellt innehåll kan returnera taggar baserat på objekt, levande varelser, landskap eller åtgärder som finns i bilder. Till skillnad från kategorier ordnas inte taggar enligt ett hierarkiskt klassificeringssystem, utan motsvarar bildinnehåll. Taggar kan innehålla tips för att undvika tvetydigheter eller ge kontext, till exempel kan taggen "ascomycete" åtföljas av tipset "svamp". Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel. |
analyze_image
Den här åtgärden extraherar en omfattande uppsättning visuella funktioner baserat på bildinnehållet. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. I din begäran finns det en valfri parameter som gör att du kan välja vilka funktioner som ska returneras. Som standard returneras bildkategorier i svaret. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametrar
- visual_features
- list[str eller VisualFeatureTypes]
En sträng som anger vilka typer av visuella funktioner som ska returneras. Flera värden bör kommaavgränsas. Giltiga visuella funktionstyper är: Kategorier – kategoriserar bildinnehåll enligt en taxonomi som definieras i dokumentationen. Taggar – taggar bilden med en detaljerad lista med ord relaterade till bildinnehållet. Beskrivning – beskriver bildinnehållet med en fullständig engelsk mening. Ansikten – identifierar om ansikten finns. Om det finns, generera koordinater, kön och ålder. ImageType – identifierar om bilden är ClipArt eller en linjeritning. Färg – avgör accentfärg, dominerande färg och om en bild är svartvit&. Vuxen – upptäcker om bilden är pornografisk till sin natur (visar nakenhet eller en sexakt) eller är blodig (visar extremt våld eller blod). Sexuellt suggestivt innehåll (även kallat olämpligt innehåll) identifieras också. Objekt – identifierar olika objekt i en bild, inklusive den ungefärliga platsen. Argumentet Objekt är endast tillgängligt på engelska. Varumärken – identifierar olika varumärken i en bild, inklusive den ungefärliga platsen. Argumentet Varumärken är endast tillgängligt på engelska.
En sträng som anger vilken domänspecifik information som ska returneras. Flera värden bör kommaavgränsas. Giltiga visuella funktionstyper är: Kändisar – identifierar kändisar om de identifieras i bilden, Landmärken – identifierar viktiga landmärken i bilden.
- language
- str
Önskat språk för utdatagenerering. Om den här parametern inte anges är standardvärdet "en". Språk som stöds:en – engelska, standard. es - spanska, ja - japanska, pt - portugisiska, zh - förenklad kinesiska. Möjliga värden är: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str eller DescriptionExclude]
Inaktivera angivna domänmodeller när du genererar beskrivningen.
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
ImageAnalysis eller ClientRawResponse om raw=true
Returtyp
Undantag
analyze_image_by_domain
Den här åtgärden identifierar innehåll i en bild genom att tillämpa en domänspecifik modell. Listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et kan hämtas med hjälp av GET-begäran för /models. API:et tillhandahåller för närvarande följande domänspecifika modeller: kändisar, landmärken. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametrar
- language
- str
Önskat språk för utdatagenerering. Om den här parametern inte anges är standardvärdet "en". Språk som stöds:en – engelska, standard. es - spanska, ja - japanska, pt - portugisiska, zh - förenklad kinesiska. Möjliga värden är: "en", "es", "ja", "pt", "zh"
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
DomainModelResults eller ClientRawResponse om raw=true
Returtyp
Undantag
analyze_image_by_domain_in_stream
Den här åtgärden identifierar innehåll i en bild genom att tillämpa en domänspecifik modell. Listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et kan hämtas med hjälp av GET-begäran för /models. API:et tillhandahåller för närvarande följande domänspecifika modeller: kändisar, landmärken. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- language
- str
Önskat språk för utdatagenerering. Om den här parametern inte anges är standardvärdet "en". Språk som stöds:en – engelska, standard. es - spanska, ja - japanska, pt - portugisiska, zh - förenklad kinesiska. Möjliga värden är: "en", "es", "ja", "pt", "zh"
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
DomainModelResults eller ClientRawResponse om raw=true
Returtyp
Undantag
analyze_image_in_stream
Den här åtgärden extraherar en omfattande uppsättning visuella funktioner baserat på bildinnehållet. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. I din begäran finns det en valfri parameter som gör att du kan välja vilka funktioner som ska returneras. Som standard returneras bildkategorier i svaret. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- visual_features
- list[str eller VisualFeatureTypes]
En sträng som anger vilka typer av visuella funktioner som ska returneras. Flera värden bör kommaavgränsas. Giltiga visuella funktionstyper är: Kategorier – kategoriserar bildinnehåll enligt en taxonomi som definieras i dokumentationen. Taggar – taggar bilden med en detaljerad lista med ord relaterade till bildinnehållet. Beskrivning – beskriver bildinnehållet med en fullständig engelsk mening. Ansikten – identifierar om ansikten finns. Om det finns genererar du koordinater, kön och ålder. ImageType – identifierar om bilden är ClipArt eller en linjeritning. Färg – avgör accentfärgen, den dominerande färgen och om en bild är svartvit&. Vuxen – upptäcker om bilden är pornografisk till sin natur (illustrerar nakenhet eller en sexakt) eller är blodig (skildrar extremt våld eller blod). Sexuellt suggestivt innehåll (även kallat olämpligt innehåll) identifieras också. Objekt – identifierar olika objekt i en bild, inklusive den ungefärliga platsen. Argumentet Objekt är endast tillgängligt på engelska. Varumärken – identifierar olika varumärken i en bild, inklusive den ungefärliga platsen. Argumentet Varumärken är endast tillgängligt på engelska.
En sträng som anger vilken domänspecifik information som ska returneras. Flera värden ska kommaavgränsas. Giltiga visuella funktionstyper är: Kändisar – identifierar kändisar om de identifieras i bilden, Landmärken – identifierar viktiga landmärken i bilden.
- language
- str
Önskat språk för utdatagenerering. Om den här parametern inte anges är standardvärdet "en". Språk som stöds:en – engelska, standard. es - spanska, ja - japanska, pt - portugisiska, zh - förenklad kinesiska. Möjliga värden är: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str eller DescriptionExclude]
Inaktivera angivna domänmodeller när du genererar beskrivningen.
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
ImageAnalysis eller ClientRawResponse om raw=true
Returtyp
Undantag
close
describe_image
Den här åtgärden genererar en beskrivning av en bild på ett läsbart språk med fullständiga meningar. Beskrivningen baseras på en samling innehållstaggar som också returneras av åtgärden. Mer än en beskrivning kan genereras för varje bild. Beskrivningar sorteras efter deras konfidenspoäng. Beskrivningar kan innehålla resultat från kändis- och landmärkesdomänmodeller, om tillämpligt. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametrar
- max_candidates
- int
Maximalt antal kandidatbeskrivningar som ska returneras. Standard är 1.
- language
- str
Önskat språk för utdatagenerering. Om den här parametern inte anges är standardvärdet "en". Språk som stöds:en – engelska, standard. es - spanska, ja - japanska, pt - portugisiska, zh - förenklad kinesiska. Möjliga värden är: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str eller DescriptionExclude]
Inaktivera angivna domänmodeller när du genererar beskrivningen.
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
ImageDescription eller ClientRawResponse om raw=true
Returtyp
Undantag
describe_image_in_stream
Den här åtgärden genererar en beskrivning av en bild på ett läsbart språk med fullständiga meningar. Beskrivningen baseras på en samling innehållstaggar som också returneras av åtgärden. Mer än en beskrivning kan genereras för varje bild. Beskrivningar sorteras efter deras konfidenspoäng. Beskrivningar kan innehålla resultat från kändis- och landmärkesdomänmodeller, om tillämpligt. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- max_candidates
- int
Maximalt antal kandidatbeskrivningar som ska returneras. Standard är 1.
- language
- str
Önskat språk för utdatagenerering. Om den här parametern inte anges är standardvärdet "en". Språk som stöds:en – engelska, standard. es - spanska, ja - japanska, pt - portugisiska, zh - förenklad kinesiska. Möjliga värden är: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str eller DescriptionExclude]
Inaktivera angivna domänmodeller när du genererar beskrivningen.
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
ImageDescription eller ClientRawResponse om raw=true
Returtyp
Undantag
detect_objects
Utför objektidentifiering på den angivna bilden. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametrar
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
DetectResult eller ClientRawResponse om raw=true
Returtyp
Undantag
detect_objects_in_stream
Utför objektidentifiering på den angivna bilden. Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
DetectResult eller ClientRawResponse om raw=true
Returtyp
Undantag
generate_thumbnail
Den här åtgärden genererar en miniatyrbild med användarens angivna bredd och höjd. Som standard analyserar tjänsten bilden, identifierar det intressanta området (ROI) och skapar smarta beskärningskoordinater baserat på det intressanta området. Smart beskärning hjälper när du anger ett proportioner som skiljer sig från indatabildens. Om åtgärden lyckas innehåller svaret binärfilen för miniatyrbilden. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.
generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- width
- int
Miniatyrbildens bredd i bildpunkter. Den måste vara mellan 1 och 1024. Rekommenderat minst 50.
- height
- int
Miniatyrbildens höjd i bildpunkter. Den måste vara mellan 1 och 1024. Rekommenderat minst 50.
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
object eller ClientRawResponse om raw=true
Returtyp
Undantag
generate_thumbnail_in_stream
Den här åtgärden genererar en miniatyrbild med användarens angivna bredd och höjd. Som standard analyserar tjänsten bilden, identifierar det intressanta området (ROI) och skapar smarta beskärningskoordinater baserat på det intressanta området. Smart beskärning hjälper när du anger ett proportioner som skiljer sig från indatabildens. Om åtgärden lyckas innehåller svaret binärfilen för miniatyrbilden. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.
generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- width
- int
Miniatyrbildens bredd i bildpunkter. Den måste vara mellan 1 och 1024. Rekommenderat minst 50.
- height
- int
Miniatyrbildens höjd i bildpunkter. Den måste vara mellan 1 och 1024. Rekommenderat minst 50.
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
object eller ClientRawResponse om raw=true
Returtyp
Undantag
get_area_of_interest
Den här åtgärden returnerar en avgränsningsruta runt bildens viktigaste område. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.
get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametrar
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
AreaOfInterestResult eller ClientRawResponse om raw=true
Returtyp
Undantag
get_area_of_interest_in_stream
Den här åtgärden returnerar en avgränsningsruta runt bildens viktigaste område. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande för att avgöra vad som gick fel. Vid fel returneras felkoden och ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout eller InternalServerError.
get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Godkända värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När det anges anropas med varje segment av data som strömmas. Återanropet bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
AreaOfInterestResult eller ClientRawResponse om raw=true
Returtyp
Undantag
get_read_result
Det här gränssnittet används för att hämta OCR-resultat från läsåtgärden. URL:en till det här gränssnittet ska hämtas från fältet "Åtgärdsplats" som returneras från läsgränssnittet.
get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)
Parametrar
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
ReadOperationResult eller ClientRawResponse om raw=true
Returtyp
Undantag
list_models
Den här åtgärden returnerar listan över domänspecifika modeller som stöds av Visuellt innehåll-API:et. API:et stöder för närvarande följande domänspecifika modeller: kändisigenkänning, landmärkesigenkänning. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
list_models(custom_headers=None, raw=False, **operation_config)
Parametrar
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
ListModelsResult eller ClientRawResponse om raw=true
Returtyp
Undantag
read
Använd det här gränssnittet för att få resultatet av en läsåtgärd med de avancerade OCR-algoritmerna (Optisk teckenläsning) som är optimerade för textintensiva dokument. När du använder gränssnittet Läs innehåller svaret ett fält med namnet "Operation-Location". Fältet Operation-Location innehåller den URL som du måste använda för åtgärden GetReadResult för att få åtkomst till OCR-resultat..
read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)
Parametrar
- language
- str eller OcrDetectionLanguage
BCP-47-språkkoden för texten i dokumentet. Läsning stöder automatisk språkidentifiering och dokument med flera språk, så ange bara en språkkod om du vill tvinga dokumentet att bearbetas på det specifika språket. Se https://aka.ms/ocr-languages för en lista över språk som stöds. Möjliga värden är: "af", "ast", 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', "gv", "hni", "hsb", "ht", "hu", "ia", "id", "it", "iu", "ja", "jv", "kaa", "kaa" c", "kea", "kha", "kl", "ko", "ku", "kw", "lb", "ms", "mww", "nap", "nl", "no", "oc", "pl", "pt", "quc", "rm", "sco", "sl", "sq", "sv", "sw", "tet", "tr", "tt", "uz", "vo", "wae", "yua", "za", "zh-Hans", "zh-Hant", "zu"
Anpassade sidnummer för flersidiga dokument (PDF/TIFF), anger antalet sidor som du vill få OCR-resultat. Använd ett bindestreck för ett antal sidor. Avgränsa varje sida eller intervall med kommatecken.
- model_version
- str
Valfri parameter för att ange versionen av OCR-modellen som används för textextrahering. Accepterade värden är: "latest", "latest-preview", "2021-04-12". Standardvärdet är "senaste".
- reading_order
- str
Valfri parameter för att ange vilken läsordningsalgoritm som ska användas vid beställning av extraheringstextelementen. Kan vara antingen "grundläggande" eller "naturlig". Standardvärdet är "basic" om det inte anges
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
Ingen eller ClientRawResponse om raw=true
Returtyp
Undantag
read_in_stream
Använd det här gränssnittet för att få resultatet av en läsåtgärd med de avancerade OCR-algoritmerna (Optisk teckenläsning) som är optimerade för textintensiva dokument. När du använder gränssnittet Läs innehåller svaret ett fält med namnet "Operation-Location". Fältet Operation-Location innehåller den URL som du måste använda för åtgärden GetReadResult för att få åtkomst till OCR-resultat..
read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- language
- str eller OcrDetectionLanguage
BCP-47-språkkoden för texten i dokumentet. Läsning stöder automatisk språkidentifiering och dokument med flera språk, så ange bara en språkkod om du vill tvinga dokumentet att bearbetas på det specifika språket. Se https://aka.ms/ocr-languages för en lista över språk som stöds. Möjliga värden är: "af", "ast", 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', "gv", "hni", "hsb", "ht", "hu", "ia", "id", "it", "iu", "ja", "jv", "kaa", "kaa" c", "kea", "kha", "kl", "ko", "ku", "kw", "lb", "ms", "mww", "nap", "nl", "no", "oc", "pl", "pt", "quc", "rm", "sco", "sl", "sq", "sv", "sw", "tet", "tr", "tt", "uz", "vo", "wae", "yua", "za", "zh-Hans", "zh-Hant", "zu"
Anpassade sidnummer för flersidiga dokument (PDF/TIFF), anger antalet sidor som du vill få OCR-resultat. Använd ett bindestreck för ett antal sidor. Avgränsa varje sida eller intervall med kommatecken.
- model_version
- str
Valfri parameter för att ange versionen av OCR-modellen som används för textextrahering. Accepterade värden är: "latest", "latest-preview", "2021-04-12". Standardvärdet är "senaste".
- reading_order
- str
Valfri parameter för att ange vilken läsordningsalgoritm som ska användas vid beställning av extraheringstextelementen. Kan vara antingen "grundläggande" eller "naturlig". Standardvärdet är "basic" om det inte anges
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
Ingen eller ClientRawResponse om raw=true
Returtyp
Undantag
recognize_printed_text
Optisk teckenläsning (OCR) identifierar text i en bild och extraherar de identifierade tecknen till en datorbaserad teckenström. När det lyckas returneras OCR-resultaten. Vid fel returneras felkoden tillsammans med ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage eller InternalServerError.
recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametrar
- detect_orientation
- bool
Om textorienteringen i bilden identifieras. Med detectOrientation=true försöker OCR-tjänsten identifiera bildorienteringen och korrigera den innan vidare bearbetning (t.ex. om den är upp och ned).
- language
- str eller OcrLanguages
BCP-47-språkkoden för texten som ska identifieras i bilden. Standardvärdet är "unk". Möjliga värden är: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
OcrResult eller ClientRawResponse om raw=true
Returtyp
Undantag
recognize_printed_text_in_stream
Optisk teckenläsning (OCR) identifierar text i en bild och extraherar de identifierade tecknen till en datorbaserad teckenström. När det lyckas returneras OCR-resultaten. Vid fel returneras felkoden tillsammans med ett felmeddelande. Felkoden kan vara en av InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage eller InternalServerError.
recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- detect_orientation
- bool
Om textorienteringen i bilden identifieras. Med detectOrientation=true försöker OCR-tjänsten identifiera bildorienteringen och korrigera den innan vidare bearbetning (t.ex. om den är upp och ned).
- language
- str eller OcrLanguages
BCP-47-språkkoden för texten som ska identifieras i bilden. Standardvärdet är "unk". Möjliga värden är: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
OcrResult eller ClientRawResponse om raw=true
Returtyp
Undantag
tag_image
Den här åtgärden genererar en lista med ord, eller taggar, som är relevanta för innehållet i den angivna bilden. API:et Visuellt innehåll kan returnera taggar baserat på objekt, levande varelser, landskap eller åtgärder som finns i bilder. Till skillnad från kategorier ordnas inte taggar enligt ett hierarkiskt klassificeringssystem, utan motsvarar bildinnehåll. Taggar kan innehålla tips för att undvika tvetydigheter eller ge kontext, till exempel kan taggen "ascomycete" åtföljas av tipset "svamp". Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametrar
- language
- str
Önskat språk för utdatagenerering. Om den här parametern inte anges är standardvärdet "en". Språk som stöds:en – engelska, standard. es - spanska, ja - japanska, pt - portugisiska, zh - förenklad kinesiska. Möjliga värden är: "en", "es", "ja", "pt", "zh"
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
TagResult eller ClientRawResponse om raw=true
Returtyp
Undantag
tag_image_in_stream
Den här åtgärden genererar en lista med ord, eller taggar, som är relevanta för innehållet i den angivna bilden. API:et Visuellt innehåll kan returnera taggar baserat på objekt, levande varelser, landskap eller åtgärder som finns i bilder. Till skillnad från kategorier ordnas inte taggar enligt ett hierarkiskt klassificeringssystem, utan motsvarar bildinnehåll. Taggar kan innehålla tips för att undvika tvetydigheter eller ge kontext, till exempel kan taggen "ascomycete" åtföljas av tipset "svamp". Två indatametoder stöds – (1) Ladda upp en bild eller (2) ange en bild-URL. Ett lyckat svar returneras i JSON. Om begäran misslyckades innehåller svaret en felkod och ett meddelande som hjälper dig att förstå vad som gick fel.
tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametrar
- language
- str
Önskat språk för utdatagenerering. Om den här parametern inte anges är standardvärdet "en". Språk som stöds:en – engelska, standard. es - spanska, ja - japanska, pt - portugisiska, zh - förenklad kinesiska. Möjliga värden är: "en", "es", "ja", "pt", "zh"
- model_version
- str
Valfri parameter för att ange versionen av AI-modellen. Accepterade värden är: "senaste", "2021-04-01". Standardvärdet är "senaste".
- raw
- bool
returnerar det direkta svaret tillsammans med det avserialiserade svaret
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
När detta anges anropas med varje segment av data som strömmas. Motringningen bör ta två argument, byte för det aktuella datasegmentet och svarsobjektet. Om data laddas upp blir svaret Ingen.
- operation_config
Åsidosättningar av åtgärdskonfiguration.
Returer
TagResult eller ClientRawResponse om raw=true
Returtyp
Undantag
Azure SDK for Python
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för