ComputerVisionClientOperationsMixin Classe

Ereditarietà
builtins.object
ComputerVisionClientOperationsMixin

Costruttore

ComputerVisionClientOperationsMixin()

Metodi

analyze_image

Questa operazione estrae un set completo di funzionalità visive in base al contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. All'interno della richiesta è disponibile un parametro facoltativo per consentire di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

analyze_image_by_domain

Questa operazione riconosce il contenuto all'interno di un'immagine applicando un modello specifico del dominio. È possibile recuperare l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale usando la richiesta GET /models. Attualmente l'API fornisce modelli specifici del dominio seguenti: celebrità, punti di riferimento. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

analyze_image_by_domain_in_stream

Questa operazione riconosce il contenuto all'interno di un'immagine applicando un modello specifico del dominio. È possibile recuperare l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale usando la richiesta GET /models. Attualmente l'API fornisce modelli specifici del dominio seguenti: celebrità, punti di riferimento. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

analyze_image_in_stream

Questa operazione estrae un set completo di funzionalità visive in base al contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. All'interno della richiesta è disponibile un parametro facoltativo per consentire di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

describe_image

Questa operazione genera una descrizione di un'immagine nel linguaggio leggibile umano con frasi complete. La descrizione si basa su una raccolta di tag di contenuto, restituiti anche dall'operazione. È possibile generare più di una descrizione per ogni immagine. Le descrizioni vengono ordinate dal punteggio di attendibilità. Le descrizioni possono includere risultati da modelli di dominio celebrità e punti di riferimento, se applicabile. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

describe_image_in_stream

Questa operazione genera una descrizione di un'immagine nel linguaggio leggibile umano con frasi complete. La descrizione si basa su una raccolta di tag di contenuto, restituiti anche dall'operazione. È possibile generare più di una descrizione per ogni immagine. Le descrizioni vengono ordinate dal punteggio di attendibilità. Le descrizioni possono includere risultati da modelli di dominio celebrità e punti di riferimento, se applicabile. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

detect_objects

Esegue il rilevamento degli oggetti nell'immagine specificata. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

detect_objects_in_stream

Esegue il rilevamento degli oggetti nell'immagine specificata. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

generate_thumbnail

Questa operazione genera un'immagine di anteprima con la larghezza e l'altezza specificate dall'utente. Per impostazione predefinita il servizio analizza l'immagine, identifica l'area di interesse e genera le coordinate di ritaglio intelligente sulla base dell'area di interesse. Il ritaglio intelligente consente di specificare proporzioni diverse da quella dell'immagine di input. Una risposta con esito positivo contiene il file binario dell'immagine di anteprima. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

generate_thumbnail_in_stream

Questa operazione genera un'immagine di anteprima con la larghezza e l'altezza specificate dall'utente. Per impostazione predefinita il servizio analizza l'immagine, identifica l'area di interesse e genera le coordinate di ritaglio intelligente sulla base dell'area di interesse. Il ritaglio intelligente consente di specificare proporzioni diverse da quella dell'immagine di input. Una risposta con esito positivo contiene il file binario dell'immagine di anteprima. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_area_of_interest

Questa operazione restituisce un rettangolo di selezione intorno all'area più importante dell'immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_area_of_interest_in_stream

Questa operazione restituisce un rettangolo di selezione intorno all'area più importante dell'immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_read_result

Questa interfaccia viene usata per ottenere i risultati OCR dell'operazione di lettura. L'URL di questa interfaccia deve essere recuperato dal campo 'Operation-Location' restituito dall'interfaccia lettura.

list_models

Questa operazione restituisce l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale. Attualmente, l'API supporta i modelli specifici del dominio seguenti: riconoscimento di celebrità, riconoscimento dei punti di riferimento. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto.

read

Usare questa interfaccia per ottenere il risultato di un'operazione di lettura, utilizzando gli algoritmi OCR (Optical Character Recognition) all'avanguardia ottimizzati per i documenti con un numero elevato di testo. Quando si usa l'interfaccia Lettura, la risposta contiene un campo denominato 'Operation-Location'. Il campo 'Operation-Location' contiene l'URL che è necessario usare per l'operazione 'GetReadResult' per accedere ai risultati OCR..

read_in_stream

Usare questa interfaccia per ottenere il risultato di un'operazione di lettura, utilizzando gli algoritmi OCR (Optical Character Recognition) all'avanguardia ottimizzati per i documenti con un numero elevato di testo. Quando si usa l'interfaccia Lettura, la risposta contiene un campo denominato 'Operation-Location'. Il campo 'Operation-Location' contiene l'URL che è necessario usare per l'operazione 'GetReadResult' per accedere ai risultati OCR..

recognize_printed_text

Il riconoscimento ottico dei caratteri rileva il testo in un'immagine ed estrae i caratteri riconosciuti in un flusso di caratteri utilizzabile dal computer. Al termine dell'operazione, verranno restituiti i risultati di OCR. In caso di errore, verrà restituito il codice di errore insieme a un messaggio di errore. Il codice di errore può essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.

recognize_printed_text_in_stream

Il riconoscimento ottico dei caratteri rileva il testo in un'immagine ed estrae i caratteri riconosciuti in un flusso di caratteri utilizzabile dal computer. Al termine dell'operazione, verranno restituiti i risultati di OCR. In caso di errore, verrà restituito il codice di errore insieme a un messaggio di errore. Il codice di errore può essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.

tag_image

Questa operazione genera un elenco di parole o tag rilevanti per il contenuto dell'immagine fornita. L'API Visione artificiale può restituire tag basati su oggetti, esseri viventi, paesaggi o azioni presenti nelle immagini. A differenza delle categorie, i tag non sono organizzati in base a un sistema di classificazione gerarchica, ma corrispondono al contenuto dell'immagine. I tag possono contenere hint per evitare ambiguità o fornire contesto, ad esempio il tag "ascomycete" può essere accompagnato dall'hint "fungo". Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL di immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto.

tag_image_in_stream

Questa operazione genera un elenco di parole o tag pertinenti al contenuto dell'immagine specificata. L'API Visione artificiale può restituire tag basati su oggetti, esseri viventi, scenari o azioni trovati nelle immagini. A differenza delle categorie, i tag non sono organizzati in base a un sistema di classificazione gerarchico, ma corrispondono al contenuto dell'immagine. I tag possono contenere hint per evitare ambiguità o fornire contesto, ad esempio il tag "ascomycete" può essere accompagnato dall'hint "fungo". Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

analyze_image

Questa operazione estrae un set completo di funzionalità visive in base al contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. All'interno della richiesta è disponibile un parametro facoltativo per consentire di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametri

url
str
Necessario

URL raggiungibile pubblicamente di un'immagine.

visual_features
list[str oppure VisualFeatureTypes]
valore predefinito: None

Stringa che indica quali tipi di funzionalità visive restituire. Più valori devono essere separati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto dell'immagine in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione - descrive il contenuto dell'immagine con una frase in lingua inglese completa. Visi - rileva se sono presenti visi. Se presente, generare coordinate, sesso e età. ImageType - rileva se l'immagine è clipart o un disegno. Colore: determina il colore accentato, il colore dominante e se un'immagine è bianca&. Adulti - rileva se l'immagine è pornografica in natura (mostra nudità o un atto sessuale) o è gory (rappresenta la violenza estrema o il sangue). Viene rilevato anche contenuto sessualmente suggestivo (contenuto aka racy). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Brand è disponibile solo in inglese.

details
list[str oppure Details]
valore predefinito: None

Stringa che indica quali dettagli specifici del dominio restituire. Più valori devono essere separati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica punti di riferimento rilevanti nell'immagine.

language
str
valore predefinito: en

Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str oppure DescriptionExclude]
valore predefinito: None

Disattivare i modelli di dominio specificati durante la generazione della descrizione.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

La configurazione dell'operazione esegue l'override.

Restituisce

ImageAnalysis o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

analyze_image_by_domain

Questa operazione riconosce il contenuto all'interno di un'immagine applicando un modello specifico del dominio. È possibile recuperare l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale usando la richiesta GET /models. Attualmente l'API fornisce modelli specifici del dominio seguenti: celebrità, punti di riferimento. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametri

model
str
Necessario

Contenuto specifico del dominio da riconoscere.

url
str
Necessario

URL raggiungibile pubblicamente di un'immagine.

language
str
valore predefinito: en

Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

La configurazione dell'operazione esegue l'override.

Restituisce

DomainModelResults o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

analyze_image_by_domain_in_stream

Questa operazione riconosce il contenuto all'interno di un'immagine applicando un modello specifico del dominio. È possibile recuperare l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale usando la richiesta GET /models. Attualmente l'API fornisce modelli specifici del dominio seguenti: celebrità, punti di riferimento. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

model
str
Necessario

Contenuto specifico del dominio da riconoscere.

image
Generator
Necessario

Flusso di immagini.

language
str
valore predefinito: en

Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.

operation_config
Necessario

La configurazione dell'operazione esegue l'override.

Restituisce

DomainModelResults o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

analyze_image_in_stream

Questa operazione estrae un set completo di funzionalità visive in base al contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. All'interno della richiesta è disponibile un parametro facoltativo per consentire di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

image
Generator
Necessario

Flusso di immagini.

visual_features
list[str oppure VisualFeatureTypes]
valore predefinito: None

Stringa che indica quali tipi di funzionalità visive restituire. Più valori devono essere separati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto dell'immagine in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione - descrive il contenuto dell'immagine con una frase in lingua inglese completa. Visi - rileva se sono presenti visi. Se presente, generare coordinate, sesso e età. ImageType - rileva se l'immagine è clipart o un disegno. Colore: determina il colore accentato, il colore dominante e se un'immagine è bianca&. Adulti - rileva se l'immagine è pornografica in natura (mostra nudità o un atto sessuale) o è gory (rappresenta la violenza estrema o il sangue). Viene rilevato anche contenuto sessualmente suggestivo (contenuto aka racy). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Brand è disponibile solo in inglese.

details
list[str oppure Details]
valore predefinito: None

Stringa che indica quali dettagli specifici del dominio restituire. Più valori devono essere separati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica punti di riferimento rilevanti nell'immagine.

language
str
valore predefinito: en

Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str oppure DescriptionExclude]
valore predefinito: None

Disattivare i modelli di dominio specificati durante la generazione della descrizione.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.

operation_config
Necessario

La configurazione dell'operazione esegue l'override.

Restituisce

ImageAnalysis o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

describe_image

Questa operazione genera una descrizione di un'immagine nel linguaggio leggibile umano con frasi complete. La descrizione si basa su una raccolta di tag di contenuto, restituiti anche dall'operazione. È possibile generare più di una descrizione per ogni immagine. Le descrizioni vengono ordinate dal punteggio di attendibilità. Le descrizioni possono includere risultati da modelli di dominio celebrità e punti di riferimento, se applicabile. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametri

url
str
Necessario

URL raggiungibile pubblicamente di un'immagine.

max_candidates
int
valore predefinito: 1

Numero massimo di descrizioni dei candidati da restituire. Il valore predefinito è 1.

language
str
valore predefinito: en

Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str oppure DescriptionExclude]
valore predefinito: None

Disattivare i modelli di dominio specificati durante la generazione della descrizione.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

La configurazione dell'operazione esegue l'override.

Restituisce

ImageDescription o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

describe_image_in_stream

Questa operazione genera una descrizione di un'immagine nel linguaggio leggibile umano con frasi complete. La descrizione si basa su una raccolta di tag di contenuto, restituiti anche dall'operazione. È possibile generare più di una descrizione per ogni immagine. Le descrizioni vengono ordinate dal punteggio di attendibilità. Le descrizioni possono includere risultati da modelli di dominio celebrità e punti di riferimento, se applicabile. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

image
Generator
Necessario

Flusso di immagini.

max_candidates
int
valore predefinito: 1

Numero massimo di descrizioni dei candidati da restituire. Il valore predefinito è 1.

language
str
valore predefinito: en

Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str oppure DescriptionExclude]
valore predefinito: None

Disattivare i modelli di dominio specificati durante la generazione della descrizione.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.

operation_config
Necessario

La configurazione dell'operazione esegue l'override.

Restituisce

ImageDescription o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

detect_objects

Esegue il rilevamento degli oggetti nell'immagine specificata. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametri

url
str
Necessario

URL raggiungibile pubblicamente di un'immagine.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

La configurazione dell'operazione esegue l'override.

Restituisce

DetectResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

detect_objects_in_stream

Esegue il rilevamento degli oggetti nell'immagine specificata. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

image
Generator
Necessario

Flusso di immagini.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.

operation_config
Necessario

La configurazione dell'operazione esegue l'override.

Restituisce

DetectResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

generate_thumbnail

Questa operazione genera un'immagine di anteprima con la larghezza e l'altezza specificate dall'utente. Per impostazione predefinita il servizio analizza l'immagine, identifica l'area di interesse e genera le coordinate di ritaglio intelligente sulla base dell'area di interesse. Il ritaglio intelligente consente di specificare proporzioni diverse da quella dell'immagine di input. Una risposta con esito positivo contiene il file binario dell'immagine di anteprima. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

width
int
Necessario

Larghezza dell'anteprima, in pixel. Deve essere compreso tra 1 e 1024. Minimo consigliato 50.

height
int
Necessario

Altezza dell'anteprima, in pixel. Deve essere compreso tra 1 e 1024. Minimo consigliato 50.

url
str
Necessario

URL raggiungibile pubblicamente di un'immagine.

smart_cropping
bool
valore predefinito: False

Flag booleano per abilitare il ritaglio intelligente.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

object o ClientRawResponse if raw=true

Tipo restituito

Eccezioni

generate_thumbnail_in_stream

Questa operazione genera un'immagine di anteprima con la larghezza e l'altezza specificate dall'utente. Per impostazione predefinita il servizio analizza l'immagine, identifica l'area di interesse e genera le coordinate di ritaglio intelligente sulla base dell'area di interesse. Il ritaglio intelligente consente di specificare proporzioni diverse da quella dell'immagine di input. Una risposta con esito positivo contiene il file binario dell'immagine di anteprima. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

width
int
Necessario

Larghezza dell'anteprima, in pixel. Deve essere compreso tra 1 e 1024. Minimo consigliato 50.

height
int
Necessario

Altezza dell'anteprima, in pixel. Deve essere compreso tra 1 e 1024. Minimo consigliato 50.

image
Generator
Necessario

Flusso di immagini.

smart_cropping
bool
valore predefinito: False

Flag booleano per abilitare il ritaglio intelligente.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

object o ClientRawResponse if raw=true

Tipo restituito

Eccezioni

get_area_of_interest

Questa operazione restituisce un rettangolo di selezione intorno all'area più importante dell'immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametri

url
str
Necessario

URL raggiungibile pubblicamente di un'immagine.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

AreaOfInterestResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

get_area_of_interest_in_stream

Questa operazione restituisce un rettangolo di selezione intorno all'area più importante dell'immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

image
Generator
Necessario

Flusso di immagini.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

AreaOfInterestResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

get_read_result

Questa interfaccia viene usata per ottenere i risultati OCR dell'operazione di lettura. L'URL di questa interfaccia deve essere recuperato dal campo 'Operation-Location' restituito dall'interfaccia lettura.

get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)

Parametri

operation_id
str
Necessario

ID dell'operazione di lettura restituita nella risposta dell'interfaccia 'Read'.

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

ReadOperationResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

list_models

Questa operazione restituisce l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale. Attualmente, l'API supporta i modelli specifici del dominio seguenti: riconoscimento di celebrità, riconoscimento dei punti di riferimento. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto.

list_models(custom_headers=None, raw=False, **operation_config)

Parametri

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

ListModelsResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

read

Usare questa interfaccia per ottenere il risultato di un'operazione di lettura, utilizzando gli algoritmi OCR (Optical Character Recognition) all'avanguardia ottimizzati per i documenti con un numero elevato di testo. Quando si usa l'interfaccia Lettura, la risposta contiene un campo denominato 'Operation-Location'. Il campo 'Operation-Location' contiene l'URL che è necessario usare per l'operazione 'GetReadResult' per accedere ai risultati OCR..

read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)

Parametri

url
str
Necessario

URL raggiungibile pubblicamente di un'immagine.

language
str oppure OcrDetectionLanguage
valore predefinito: None

Codice della lingua BCP-47 del testo nel documento. Read supporta l'identificazione automatica della lingua e i documenti in più lingue, quindi fornire solo un codice linguistico se si desidera forzare l'elaborazione del documento in tale lingua specifica. Per l'elenco delle lingue supportate, vedere https://aka.ms/ocr-languages . I valori possibili includono: 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'cs', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kac 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
valore predefinito: None

Numeri di pagina personalizzati per documenti a più pagine (PDF/TIFF), immettere il numero delle pagine che si desidera ottenere il risultato OCR. Per un intervallo di pagine, usare un trattino. Separare ogni pagina o intervallo con una virgola.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello OCR usato per l'estrazione di testo. I valori accettati sono: "latest", "latest-preview", "2021-04-12". Il valore predefinito è "latest".

reading_order
str
valore predefinito: basic

Parametro facoltativo per specificare l'algoritmo di ordine di lettura da applicare durante l'ordinamento degli elementi di testo di estrazione. Può essere "di base" o "naturale". L'impostazione predefinita è 'basic' se non specificata

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

Nessuno o ClientRawResponse se raw=true

Tipo restituito

None,

Eccezioni

read_in_stream

Usare questa interfaccia per ottenere il risultato di un'operazione di lettura, utilizzando gli algoritmi OCR (Optical Character Recognition) all'avanguardia ottimizzati per i documenti con un numero elevato di testo. Quando si usa l'interfaccia Lettura, la risposta contiene un campo denominato 'Operation-Location'. Il campo 'Operation-Location' contiene l'URL che è necessario usare per l'operazione 'GetReadResult' per accedere ai risultati OCR..

read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

image
Generator
Necessario

Flusso di immagini.

language
str oppure OcrDetectionLanguage
valore predefinito: None

Codice della lingua BCP-47 del testo nel documento. Read supporta l'identificazione automatica della lingua e i documenti in più lingue, quindi fornire solo un codice linguistico se si desidera forzare l'elaborazione del documento in tale lingua specifica. Per l'elenco delle lingue supportate, vedere https://aka.ms/ocr-languages . I valori possibili includono: 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'cs', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kac 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
valore predefinito: None

Numeri di pagina personalizzati per documenti a più pagine (PDF/TIFF), immettere il numero delle pagine che si desidera ottenere il risultato OCR. Per un intervallo di pagine, usare un trattino. Separare ogni pagina o intervallo con una virgola.

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello OCR usato per l'estrazione di testo. I valori accettati sono: "latest", "latest-preview", "2021-04-12". Il valore predefinito è "latest".

reading_order
str
valore predefinito: basic

Parametro facoltativo per specificare l'algoritmo di ordine di lettura da applicare durante l'ordinamento degli elementi di testo di estrazione. Può essere "di base" o "naturale". L'impostazione predefinita è 'basic' se non specificata

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

Nessuno o ClientRawResponse se raw=true

Tipo restituito

None,

Eccezioni

recognize_printed_text

Il riconoscimento ottico dei caratteri rileva il testo in un'immagine ed estrae i caratteri riconosciuti in un flusso di caratteri utilizzabile dal computer. Al termine dell'operazione, verranno restituiti i risultati di OCR. In caso di errore, verrà restituito il codice di errore insieme a un messaggio di errore. Il codice di errore può essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.

recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametri

detect_orientation
bool
valore predefinito: True

Indica se rilevare l'orientamento del testo nell'immagine. Con detectOrientation=true, il servizio OCR tenta di rilevare l'orientamento dell'immagine e correggerlo prima di un'ulteriore elaborazione, ad esempio se è capovolto.

url
str
Necessario

URL raggiungibile pubblicamente di un'immagine.

language
str oppure OcrLanguages
valore predefinito: unk

Codice linguistico BCP-47 del testo da rilevare nell'immagine. Il valore predefinito è 'unk'. I valori possibili includono: 'unk', 'zh-Hans', 'zh-Hant', 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

OcrResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

recognize_printed_text_in_stream

Il riconoscimento ottico dei caratteri rileva il testo in un'immagine ed estrae i caratteri riconosciuti in un flusso di caratteri utilizzabile dal computer. Al termine dell'operazione, verranno restituiti i risultati di OCR. In caso di errore, verrà restituito il codice di errore insieme a un messaggio di errore. Il codice di errore può essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.

recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

detect_orientation
bool
valore predefinito: True

Indica se rilevare l'orientamento del testo nell'immagine. Con detectOrientation=true, il servizio OCR tenta di rilevare l'orientamento dell'immagine e correggerlo prima di un'ulteriore elaborazione, ad esempio se è capovolto.

image
Generator
Necessario

Flusso di immagini.

language
str oppure OcrLanguages
valore predefinito: unk

Codice linguistico BCP-47 del testo da rilevare nell'immagine. Il valore predefinito è 'unk'. I valori possibili includono: 'unk', 'zh-Hans', 'zh-Hant', 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

OcrResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

tag_image

Questa operazione genera un elenco di parole o tag rilevanti per il contenuto dell'immagine fornita. L'API Visione artificiale può restituire tag basati su oggetti, esseri viventi, paesaggi o azioni presenti nelle immagini. A differenza delle categorie, i tag non sono organizzati in base a un sistema di classificazione gerarchica, ma corrispondono al contenuto dell'immagine. I tag possono contenere hint per evitare ambiguità o fornire contesto, ad esempio il tag "ascomycete" può essere accompagnato dall'hint "fungo". Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL di immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto.

tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parametri

url
str
Necessario

URL raggiungibile pubblicamente di un'immagine.

language
str
valore predefinito: en

Lingua desiderata per la generazione di output. Se questo parametro non viene specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

operation_config
Necessario

Override della configurazione dell'operazione.

Restituisce

TagResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni

tag_image_in_stream

Questa operazione genera un elenco di parole o tag pertinenti al contenuto dell'immagine specificata. L'API Visione artificiale può restituire tag basati su oggetti, esseri viventi, scenari o azioni trovati nelle immagini. A differenza delle categorie, i tag non sono organizzati in base a un sistema di classificazione gerarchico, ma corrispondono al contenuto dell'immagine. I tag possono contenere hint per evitare ambiguità o fornire contesto, ad esempio il tag "ascomycete" può essere accompagnato dall'hint "fungo". Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.

tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parametri

image
Generator
Necessario

Flusso di immagini.

language
str
valore predefinito: en

Lingua desiderata per la generazione di output. Se questo parametro non viene specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
valore predefinito: latest

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".

custom_headers
dict
valore predefinito: None

intestazioni che verranno aggiunte alla richiesta

raw
bool
valore predefinito: False

restituisce la risposta diretta insieme alla risposta deserializzata

callback
Callable[<xref:Bytes>, <xref:response=None>]
valore predefinito: None

Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.

operation_config
Necessario

La configurazione dell'operazione esegue l'override.

Restituisce

TagResult o ClientRawResponse se raw=true

Tipo restituito

Eccezioni