ComputerVisionClient Osztály

A Computer Vision API a legkorszerűbb algoritmusokat biztosítja a képek feldolgozásához és az információk visszaadásához. Például annak meghatározására használható, hogy egy kép érett tartalmat tartalmaz-e, vagy egy kép összes arcának megkeresésére használható. További funkciói között szerepel az uralkodó és kiegészítő színek megbecslése, a képek tartalmának kategorizálása, és egy kép leírása teljes angol mondatokkal. Arra is képes, hogy intelligensen miniatűröket generáljon a nagy képek hatékony megjelenítéséhez.

Öröklődés
azure.cognitiveservices.vision.computervision.operations._computer_vision_client_operations.ComputerVisionClientOperationsMixin
ComputerVisionClient
ComputerVisionClient

Konstruktor

ComputerVisionClient(endpoint, credentials)

Paraméterek

endpoint
str
Kötelező

Támogatott Cognitive Services-végpontok.

credentials
None
Kötelező

Az előfizetés hitelesítő adatai, amelyek egyedileg azonosítják az ügyfél-előfizetést.

Változók

config
ComputerVisionClientConfiguration

Az ügyfél konfigurációja.

Metódusok

analyze_image

Ez a művelet a képtartalom alapján számos vizuális funkciót nyer ki. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A kérésben van egy opcionális paraméter, amellyel kiválaszthatja, hogy mely szolgáltatásokat szeretné visszaadni. Alapértelmezés szerint a rendszer képkategóriákat ad vissza a válaszban. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

analyze_image_by_domain

Ez a művelet egy tartományspecifikus modell alkalmazásával felismeri a képeken belüli tartalmat. Az Computer Vision API által támogatott tartományspecifikus modellek listája a /models GET kéréssel kérhető le. Az API jelenleg a következő tartományspecifikus modelleket biztosítja: hírességek, nevezetességek. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

analyze_image_by_domain_in_stream

Ez a művelet egy tartományspecifikus modell alkalmazásával felismeri a képeken belüli tartalmat. Az Computer Vision API által támogatott tartományspecifikus modellek listája a /models GET kéréssel kérhető le. Az API jelenleg a következő tartományspecifikus modelleket biztosítja: hírességek, nevezetességek. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

analyze_image_in_stream

Ez a művelet a képtartalom alapján számos vizuális funkciót nyer ki. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A kérésben van egy opcionális paraméter, amellyel kiválaszthatja, hogy mely szolgáltatásokat szeretné visszaadni. Alapértelmezés szerint a rendszer képkategóriákat ad vissza a válaszban. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

close

Zárja be az ügyfelet, ha keep_alive igaz.

describe_image

Ez a művelet egy teljes mondatokat tartalmazó, emberi nyelven olvasható kép leírását hozza létre. A leírás tartalomcímkék gyűjteményén alapul, amelyeket a művelet szintén visszaad. Minden képhez több leírás is létrehozható. A leírások a megbízhatósági pontszámuk alapján vannak rendezve. A leírások között szerepelhetnek hírességek és nevezetességek tartománymodelljeiből származó eredmények, ha vannak ilyenek. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

describe_image_in_stream

Ez a művelet egy teljes mondatokat tartalmazó, emberi nyelven olvasható kép leírását hozza létre. A leírás tartalomcímkék gyűjteményén alapul, amelyeket a művelet szintén visszaad. Minden képhez több leírás is létrehozható. A leírások a megbízhatósági pontszámuk alapján vannak rendezve. A leírások között szerepelhetnek hírességek és nevezetességek tartománymodelljeiből származó eredmények, ha vannak ilyenek. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

detect_objects

Objektumészlelést végez a megadott képen. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

detect_objects_in_stream

Objektumészlelést végez a megadott képen. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza a JSON-ban. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

generate_thumbnail

Ez a művelet létrehoz egy miniatűrképet a felhasználó által megadott szélességgel és magassággal. Alapértelmezés szerint a szolgáltatás elemzi a képet, azonosítja a releváns tartományt (ROI), és intelligens körbevágási koordinátákat hoz létre a tartomány alapján. Az intelligens körülvágás segít, ha a bemeneti kép méretarányától eltérő méretarányt ad meg. A sikeres válasz bináris formátumban tartalmazza a miniatűrképet. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít meghatározni, hogy mi történt. Hiba esetén a rendszer a hibakódot és egy hibaüzenetet ad vissza. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout vagy InternalServerError hibakód.

generate_thumbnail_in_stream

Ez a művelet létrehoz egy miniatűrképet a felhasználó által megadott szélességgel és magassággal. Alapértelmezés szerint a szolgáltatás elemzi a képet, azonosítja a releváns tartományt (ROI), és intelligens körbevágási koordinátákat hoz létre a tartomány alapján. Az intelligens körülvágás segít, ha a bemeneti kép méretarányától eltérő méretarányt ad meg. A sikeres válasz bináris formátumban tartalmazza a miniatűrképet. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít meghatározni, hogy mi történt. Hiba esetén a rendszer a hibakódot és egy hibaüzenetet ad vissza. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout vagy InternalServerError hibakód.

get_area_of_interest

Ez a művelet egy határolókeretet ad vissza a kép legfontosabb területe körül. A rendszer sikeres választ ad vissza a JSON-ban. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít meghatározni, hogy mi történt. Hiba esetén a rendszer a hibakódot és egy hibaüzenetet ad vissza. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout vagy InternalServerError hibakód.

get_area_of_interest_in_stream

Ez a művelet egy határolókeretet ad vissza a kép legfontosabb területe körül. A rendszer sikeres választ ad vissza a JSON-ban. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít meghatározni, hogy mi történt. Hiba esetén a rendszer a hibakódot és egy hibaüzenetet ad vissza. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout vagy InternalServerError hibakód.

get_read_result

Ez az interfész az olvasási művelet OCR-eredményeinek lekérésére szolgál. A felület URL-címét az Olvasási felület "Operation-Location" mezőjéből kell lekérni.

list_models

Ez a művelet a Computer Vision API által támogatott tartományspecifikus modellek listáját adja vissza. Az API jelenleg a következő tartományspecifikus modelleket támogatja: celebrity recognizer, landmark recognizer. A rendszer sikeres választ ad vissza a JSON-ban. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

read

Ezzel a felülettel lekérheti az olvasási művelet eredményét, és a legkorszerűbb optikai karakterfelismerési (OCR) algoritmusokat használja a szövegigényes dokumentumokhoz. Az Olvasási felület használatakor a válasz tartalmaz egy "Operation-Location" nevű mezőt. A "Operation-Location" mező tartalmazza azt az URL-címet, amelyet a GetReadResult művelethez az OCR-eredmények eléréséhez használnia kell..

read_in_stream

Ezzel a felülettel lekérheti az olvasási művelet eredményét, és a legkorszerűbb optikai karakterfelismerési (OCR) algoritmusokat használja a szövegigényes dokumentumokhoz. Az Olvasási felület használatakor a válasz tartalmaz egy "Operation-Location" nevű mezőt. A "Operation-Location" mező tartalmazza azt az URL-címet, amelyet a GetReadResult művelethez az OCR-eredmények eléréséhez használnia kell..

recognize_printed_text

Az optikai karakterfelismerés (OCR) észleli a képeken lévő szöveget, és a felismert karaktereket egy géppel használható karakterfolyamba nyeri ki. A sikeresség után a rendszer visszaadja az OCR-eredményeket. Hiba esetén a rendszer a hibaüzenettel együtt adja vissza a hibakódot. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage vagy InternalServerError hibakód.

recognize_printed_text_in_stream

Az optikai karakterfelismerés (OCR) észleli a képeken lévő szöveget, és a felismert karaktereket egy géppel használható karakterfolyamba nyeri ki. A sikeresség után a rendszer visszaadja az OCR-eredményeket. Hiba esetén a rendszer a hibaüzenettel együtt adja vissza a hibakódot. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage vagy InternalServerError hibakód.

tag_image

Ez a művelet a megadott kép tartalmához kapcsolódó szavak vagy címkék listáját hozza létre. A Computer Vision API képes címkéket visszaadni a képeken található objektumok, élőlények, tájak vagy műveletek alapján. A kategóriáktól eltérően a címkék nem hierarchikus besorolási rendszer szerint vannak rendszerezve, hanem a képtartalomnak felelnek meg. A címkék tartalmazhatnak tippeket a kétértelműség elkerülése vagy a kontextus biztosítása érdekében, például az "ascomycete" címkét a "gomba" tipp kísérheti. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

tag_image_in_stream

Ez a művelet a megadott kép tartalmához kapcsolódó szavak vagy címkék listáját hozza létre. A Computer Vision API képes címkéket visszaadni a képeken található objektumok, élőlények, tájak vagy műveletek alapján. A kategóriáktól eltérően a címkék nem hierarchikus besorolási rendszer szerint vannak rendszerezve, hanem a képtartalomnak felelnek meg. A címkék tartalmazhatnak tippeket a kétértelműség elkerülése vagy a kontextus biztosítása érdekében, például az "ascomycete" címkét a "gomba" tipp kísérheti. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

analyze_image

Ez a művelet a képtartalom alapján számos vizuális funkciót nyer ki. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A kérésben van egy opcionális paraméter, amellyel kiválaszthatja, hogy mely szolgáltatásokat szeretné visszaadni. Alapértelmezés szerint a rendszer képkategóriákat ad vissza a válaszban. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Paraméterek

url
str
Kötelező

Egy kép nyilvánosan elérhető URL-címe.

visual_features
list[str vagy VisualFeatureTypes]
alapértelmezett érték: None

Egy sztring, amely azt jelzi, hogy milyen vizualizációs szolgáltatástípusokat kell visszaadni. Több értéket kell vesszővel elválasztani. Az érvényes vizualizációs funkciótípusok a következők: Kategóriák – a dokumentációban meghatározott osztályozás szerint kategorizálja a képtartalmakat. Címkék – címkézheti a képet a kép tartalmához kapcsolódó szavak részletes listájával. Leírás – a kép tartalmát egy teljes angol mondattal írja le. Arcok – észleli, hogy vannak-e arcok. Ha jelen van, hozzon létre koordinátákat, nemet és életkort. ImageType – azt észleli, hogy a kép ClipArt- vagy vonalrajz. Szín – meghatározza a hangsúlyos színt, a domináns színt, valamint azt, hogy egy kép fekete-fehér-e&. Felnőtt - észleli, ha a kép pornográf jellegű (meztelenséget vagy szexuális aktust ábrázol), vagy gory (szélsőséges erőszakot vagy vért ábrázol). A rendszer szexuálisan szuggesztív tartalmat (más néven kényes tartalmat) is észlel. Objektumok – észleli a képeken belüli különböző objektumokat, beleértve a hozzávetőleges helyet is. Az Objects argumentum csak angol nyelven érhető el. Márkák – észleli a képeken belüli különböző márkákat, beleértve a hozzávetőleges helyet is. A Brands argumentum csak angolul érhető el.

details
list[str vagy Details]
alapértelmezett érték: None

Egy sztring, amely azt jelzi, hogy mely tartományspecifikus adatokat kell visszaadni. Több értéket kell vesszővel elválasztani. Az érvényes vizualizációs funkciótípusok a következők: Hírességek – a képen észlelt hírességeket azonosítja, nevezetességek – a képen látható nevezetességeket azonosítja.

language
str
alapértelmezett érték: en

A kimeneti létrehozás kívánt nyelve. Ha ez a paraméter nincs megadva, az alapértelmezett érték az "en". Támogatott nyelvek:hu – angol, alapértelmezett. es - spanyol, ja - japán, pt - portugál, zh - egyszerűsített kínai. Lehetséges értékek: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str vagy DescriptionExclude]
alapértelmezett érték: None

A leírás létrehozásakor kapcsolja ki a megadott tartománymodelleket.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "latest" (legújabb) értékre van kapcsolva.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

Műveleti konfiguráció felülbírálásai.

Válaszok

ImageAnalysis vagy ClientRawResponse if raw=true

Visszatérési típus

Kivételek

analyze_image_by_domain

Ez a művelet egy tartományspecifikus modell alkalmazásával felismeri a képeken belüli tartalmat. Az Computer Vision API által támogatott tartományspecifikus modellek listája a /models GET kéréssel kérhető le. Az API jelenleg a következő tartományspecifikus modelleket biztosítja: hírességek, nevezetességek. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Paraméterek

model
str
Kötelező

A felismerni kívánt tartományspecifikus tartalom.

url
str
Kötelező

Egy kép nyilvánosan elérhető URL-címe.

language
str
alapértelmezett érték: en

A kimeneti létrehozás kívánt nyelve. Ha ez a paraméter nincs megadva, az alapértelmezett érték az "en". Támogatott nyelvek:hu – angol, alapértelmezett. es - spanyol, ja - japán, pt - portugál, zh - egyszerűsített kínai. Lehetséges értékek: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "latest" (legújabb) értékre van kapcsolva.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

Műveleti konfiguráció felülbírálásai.

Válaszok

DomainModelResults vagy ClientRawResponse if raw=true

Visszatérési típus

Kivételek

analyze_image_by_domain_in_stream

Ez a művelet egy tartományspecifikus modell alkalmazásával felismeri a képeken belüli tartalmat. Az Computer Vision API által támogatott tartományspecifikus modellek listája a /models GET kéréssel kérhető le. Az API jelenleg a következő tartományspecifikus modelleket biztosítja: hírességek, nevezetességek. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

model
str
Kötelező

A felismerni kívánt tartományspecifikus tartalom.

image
Generator
Kötelező

Képstream.

language
str
alapértelmezett érték: en

A kimeneti létrehozás kívánt nyelve. Ha ez a paraméter nincs megadva, az alapértelmezett érték az "en". Támogatott nyelvek:hu – angol, alapértelmezett. es - spanyol, ja - japán, pt - portugál, zh - egyszerűsített kínai. Lehetséges értékek: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "latest" (legújabb) értékre van kapcsolva.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtját és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

Műveleti konfiguráció felülbírálásai.

Válaszok

DomainModelResults vagy ClientRawResponse if raw=true

Visszatérési típus

Kivételek

analyze_image_in_stream

Ez a művelet a képtartalom alapján számos vizuális funkciót nyer ki. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A kérésben van egy opcionális paraméter, amellyel kiválaszthatja, hogy mely szolgáltatásokat szeretné visszaadni. Alapértelmezés szerint a rendszer képkategóriákat ad vissza a válaszban. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

image
Generator
Kötelező

Képstream.

visual_features
list[str vagy VisualFeatureTypes]
alapértelmezett érték: None

Egy sztring, amely azt jelzi, hogy milyen vizualizációs szolgáltatástípusokat kell visszaadni. Több értéket kell vesszővel elválasztani. Az érvényes vizualizációs funkciótípusok a következők: Kategóriák – a dokumentációban meghatározott osztályozás szerint kategorizálja a képtartalmakat. Címkék – címkézheti a képet a kép tartalmához kapcsolódó szavak részletes listájával. Leírás – a kép tartalmát egy teljes angol mondattal írja le. Arcok – észleli, hogy vannak-e arcok. Ha jelen van, hozzon létre koordinátákat, nemet és életkort. ImageType – azt észleli, hogy a kép ClipArt- vagy vonalrajz. Szín – meghatározza a hangsúlyos színt, a domináns színt, valamint azt, hogy egy kép fekete-fehér-e&. Felnőtt - észleli, ha a kép pornográf jellegű (meztelenséget vagy szexuális aktust ábrázol), vagy gory (szélsőséges erőszakot vagy vért ábrázol). A rendszer szexuálisan szuggesztív tartalmat (más néven kényes tartalmat) is észlel. Objektumok – észleli a képeken belüli különböző objektumokat, beleértve a hozzávetőleges helyet is. Az Objects argumentum csak angol nyelven érhető el. Márkák – észleli a képeken belüli különböző márkákat, beleértve a hozzávetőleges helyet is. A Brands argumentum csak angolul érhető el.

details
list[str vagy Details]
alapértelmezett érték: None

Egy sztring, amely azt jelzi, hogy mely tartományspecifikus adatokat kell visszaadni. Több értéket kell vesszővel elválasztani. Az érvényes vizualizációs funkciótípusok a következők: Hírességek – a képen észlelt hírességeket azonosítja, nevezetességek – a képen látható nevezetességeket azonosítja.

language
str
alapértelmezett érték: en

A kimeneti létrehozás kívánt nyelve. Ha ez a paraméter nincs megadva, az alapértelmezett érték az "en". Támogatott nyelvek:hu – angol, alapértelmezett. es - spanyol, ja - japán, pt - portugál, zh - egyszerűsített kínai. Lehetséges értékek: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str vagy DescriptionExclude]
alapértelmezett érték: None

A leírás létrehozásakor kapcsolja ki a megadott tartománymodelleket.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "latest" (legújabb) értékre van kapcsolva.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtját és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

Műveleti konfiguráció felülbírálásai.

Válaszok

ImageAnalysis vagy ClientRawResponse if raw=true

Visszatérési típus

Kivételek

close

Zárja be az ügyfelet, ha keep_alive igaz.

close() -> None

Kivételek

describe_image

Ez a művelet egy teljes mondatokat tartalmazó, emberi nyelven olvasható kép leírását hozza létre. A leírás tartalomcímkék gyűjteményén alapul, amelyeket a művelet szintén visszaad. Minden képhez több leírás is létrehozható. A leírások a megbízhatósági pontszámuk alapján vannak rendezve. A leírások között szerepelhetnek hírességek és nevezetességek tartománymodelljeiből származó eredmények, ha vannak ilyenek. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Paraméterek

url
str
Kötelező

Egy kép nyilvánosan elérhető URL-címe.

max_candidates
int
alapértelmezett érték: 1

A visszaadandó jelöltleírások maximális száma. Az alapértelmezett érték 1.

language
str
alapértelmezett érték: en

A kimeneti létrehozás kívánt nyelve. Ha ez a paraméter nincs megadva, az alapértelmezett érték az "en". Támogatott nyelvek:hu – angol, alapértelmezett. es - spanyol, ja - japán, pt - portugál, zh - egyszerűsített kínai. Lehetséges értékek: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str vagy DescriptionExclude]
alapértelmezett érték: None

A leírás létrehozásakor kapcsolja ki a megadott tartománymodelleket.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "latest" (legújabb) értékre van kapcsolva.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

Műveleti konfiguráció felülbírálásai.

Válaszok

ImageDescription vagy ClientRawResponse if raw=true

Visszatérési típus

Kivételek

describe_image_in_stream

Ez a művelet egy teljes mondatokat tartalmazó, emberi nyelven olvasható kép leírását hozza létre. A leírás tartalomcímkék gyűjteményén alapul, amelyeket a művelet szintén visszaad. Minden képhez több leírás is létrehozható. A leírások a megbízhatósági pontszámuk alapján vannak rendezve. A leírások között szerepelhetnek hírességek és nevezetességek tartománymodelljeiből származó eredmények, ha vannak ilyenek. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

image
Generator
Kötelező

Képstream.

max_candidates
int
alapértelmezett érték: 1

A visszaadandó jelöltleírások maximális száma. Az alapértelmezett érték 1.

language
str
alapértelmezett érték: en

A kimeneti létrehozás kívánt nyelve. Ha ez a paraméter nincs megadva, az alapértelmezett érték az "en". Támogatott nyelvek:hu – angol, alapértelmezett. es - spanyol, ja - japán, pt - portugál, zh - egyszerűsített kínai. Lehetséges értékek: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str vagy DescriptionExclude]
alapértelmezett érték: None

A leírás létrehozásakor kapcsolja ki a megadott tartománymodelleket.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "latest" (legújabb) értékre van kapcsolva.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtját és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

Műveleti konfiguráció felülbírálásai.

Válaszok

ImageDescription vagy ClientRawResponse if raw=true

Visszatérési típus

Kivételek

detect_objects

Objektumészlelést végez a megadott képen. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Paraméterek

url
str
Kötelező

Egy kép nyilvánosan elérhető URL-címe.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "latest" (legújabb) értékre van kapcsolva.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

Műveleti konfiguráció felülbírálásai.

Válaszok

DetectResult vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

detect_objects_in_stream

Objektumészlelést végez a megadott képen. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza a JSON-ban. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

image
Generator
Kötelező

Képstream.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "latest" (legújabb) értékre van kapcsolva.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtjait és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

DetectResult vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

generate_thumbnail

Ez a művelet létrehoz egy miniatűrképet a felhasználó által megadott szélességgel és magassággal. Alapértelmezés szerint a szolgáltatás elemzi a képet, azonosítja a releváns tartományt (ROI), és intelligens körbevágási koordinátákat hoz létre a tartomány alapján. Az intelligens körülvágás segít, ha a bemeneti kép méretarányától eltérő méretarányt ad meg. A sikeres válasz bináris formátumban tartalmazza a miniatűrképet. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít meghatározni, hogy mi történt. Hiba esetén a rendszer a hibakódot és egy hibaüzenetet ad vissza. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout vagy InternalServerError hibakód.

generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

width
int
Kötelező

A miniatűr szélessége képpontban. Ennek 1 és 1024 közöttinek kell lennie. Ajánlott minimum 50.

height
int
Kötelező

A miniatűr magassága képpontban. Ennek 1 és 1024 közöttinek kell lennie. Ajánlott minimum 50.

url
str
Kötelező

Egy kép nyilvánosan elérhető URL-címe.

smart_cropping
bool
alapértelmezett érték: False

Logikai jelző az intelligens körülvágás engedélyezéséhez.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "legújabb".

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtjait és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

object vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

generate_thumbnail_in_stream

Ez a művelet létrehoz egy miniatűrképet a felhasználó által megadott szélességgel és magassággal. Alapértelmezés szerint a szolgáltatás elemzi a képet, azonosítja a releváns tartományt (ROI), és intelligens körbevágási koordinátákat hoz létre a tartomány alapján. Az intelligens körülvágás segít, ha a bemeneti kép méretarányától eltérő méretarányt ad meg. A sikeres válasz bináris formátumban tartalmazza a miniatűrképet. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít meghatározni, hogy mi történt. Hiba esetén a rendszer a hibakódot és egy hibaüzenetet ad vissza. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout vagy InternalServerError hibakód.

generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

width
int
Kötelező

A miniatűr szélessége képpontban. Ennek 1 és 1024 közöttinek kell lennie. Ajánlott minimum 50.

height
int
Kötelező

A miniatűr magassága képpontban. Ennek 1 és 1024 közöttinek kell lennie. Ajánlott minimum 50.

image
Generator
Kötelező

Képstream.

smart_cropping
bool
alapértelmezett érték: False

Logikai jelző az intelligens körülvágás engedélyezéséhez.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "legújabb".

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtjait és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

object vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

get_area_of_interest

Ez a művelet egy határolókeretet ad vissza a kép legfontosabb területe körül. A rendszer sikeres választ ad vissza a JSON-ban. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít meghatározni, hogy mi történt. Hiba esetén a rendszer a hibakódot és egy hibaüzenetet ad vissza. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout vagy InternalServerError hibakód.

get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Paraméterek

url
str
Kötelező

Egy kép nyilvánosan elérhető URL-címe.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "legújabb".

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

AreaOfInterestResult vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

get_area_of_interest_in_stream

Ez a művelet egy határolókeretet ad vissza a kép legfontosabb területe körül. A rendszer sikeres választ ad vissza a JSON-ban. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít meghatározni, hogy mi történt. Hiba esetén a rendszer a hibakódot és egy hibaüzenetet ad vissza. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout vagy InternalServerError hibakód.

get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

image
Generator
Kötelező

Képstream.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "legújabb".

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtjait és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

AreaOfInterestResult vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

get_read_result

Ez az interfész az olvasási művelet OCR-eredményeinek lekérésére szolgál. A felület URL-címét az Olvasási felület "Operation-Location" mezőjéből kell lekérni.

get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)

Paraméterek

operation_id
str
Kötelező

Az "Olvasás" felület válaszában visszaadott olvasási művelet azonosítója.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

ReadOperationResult vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

list_models

Ez a művelet a Computer Vision API által támogatott tartományspecifikus modellek listáját adja vissza. Az API jelenleg a következő tartományspecifikus modelleket támogatja: celebrity recognizer, landmark recognizer. A rendszer sikeres választ ad vissza a JSON-ban. Ha a kérés sikertelen volt, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

list_models(custom_headers=None, raw=False, **operation_config)

Paraméterek

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

ListModelsResult vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

read

Ezzel a felülettel lekérheti az olvasási művelet eredményét, és a legkorszerűbb optikai karakterfelismerési (OCR) algoritmusokat használja a szövegigényes dokumentumokhoz. Az Olvasási felület használatakor a válasz tartalmaz egy "Operation-Location" nevű mezőt. A "Operation-Location" mező tartalmazza azt az URL-címet, amelyet a GetReadResult művelethez az OCR-eredmények eléréséhez használnia kell..

read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)

Paraméterek

url
str
Kötelező

Egy kép nyilvánosan elérhető URL-címe.

language
str vagy OcrDetectionLanguage
alapértelmezett érték: None

A dokumentum szövegének BCP-47 nyelvi kódja. Az Olvasás funkció támogatja az automatikus nyelvazonosítást és a többnyelvű dokumentumokat, ezért csak akkor adjon meg nyelvi kódot, ha a dokumentumot az adott nyelven szeretné feldolgozni. A támogatott nyelvek listáját itt találja https://aka.ms/ocr-languages . Lehetséges értékek: "af", "ast", "bi", "br", "ca", "ceb", "ch", "co", "crh", "cs", "csb", "da", "de", "en", "es", "et", "eu", "fi", "fil", "fj", "fr", "fur", "fy", "ga", "gd", "gil", "gl", "gv", "hni", "hsb", "ht", "hu", "ia", "id", "it", "iu", "ja", "jv", "kaa", "kac". , 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
alapértelmezett érték: None

Többoldalas dokumentumok egyéni oldalszámozása (PDF/TIFF), adja meg az OCR-eredményt lekérni kívánt lapok számát. Több oldal esetén használjon kötőjelet. Az egyes oldalakat vagy tartományokat vesszővel válassza el egymástól.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter a szövegkinyeréshez használt OCR-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "latest-preview", "2021-04-12". Alapértelmezés szerint a "legújabb".

reading_order
str
alapértelmezett érték: basic

Nem kötelező paraméter annak megadásához, hogy melyik olvasási sorrendi algoritmust kell alkalmazni a kinyert szövegelemek megrendelésekor. Lehet "alapszintű" vagy "természetes". Alapértelmezés szerint "alapszintű" lesz, ha nincs megadva

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

Nincs vagy ClientRawResponse, ha raw=true

Visszatérési típus

None,

Kivételek

read_in_stream

Ezzel a felülettel lekérheti az olvasási művelet eredményét, és a legkorszerűbb optikai karakterfelismerési (OCR) algoritmusokat használja a szövegigényes dokumentumokhoz. Az Olvasási felület használatakor a válasz tartalmaz egy "Operation-Location" nevű mezőt. A "Operation-Location" mező tartalmazza azt az URL-címet, amelyet a GetReadResult művelethez az OCR-eredmények eléréséhez használnia kell..

read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

image
Generator
Kötelező

Képstream.

language
str vagy OcrDetectionLanguage
alapértelmezett érték: None

A dokumentum szövegének BCP-47 nyelvi kódja. Az Olvasás funkció támogatja az automatikus nyelvazonosítást és a többnyelvű dokumentumokat, ezért csak akkor adjon meg nyelvi kódot, ha a dokumentumot az adott nyelven szeretné feldolgozni. A támogatott nyelvek listáját itt találja https://aka.ms/ocr-languages . Lehetséges értékek: "af", "ast", "bi", "br", "ca", "ceb", "ch", "co", "crh", "cs", "csb", "da", "de", "en", "es", "et", "eu", "fi", "fil", "fj", "fr", "fur", "fy", "ga", "gd", "gil", "gl", "gv", "hni", "hsb", "ht", "hu", "ia", "id", "it", "iu", "ja", "jv", "kaa", "kac". , 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
alapértelmezett érték: None

Többoldalas dokumentumok egyéni oldalszámozása (PDF/TIFF), adja meg az OCR-eredményt lekérni kívánt lapok számát. Több oldal esetén használjon kötőjelet. Az egyes oldalakat vagy tartományokat vesszővel válassza el egymástól.

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter a szövegkinyeréshez használt OCR-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "latest-preview", "2021-04-12". Alapértelmezés szerint a "legújabb".

reading_order
str
alapértelmezett érték: basic

Nem kötelező paraméter annak megadásához, hogy melyik olvasási sorrendi algoritmust kell alkalmazni a kinyert szövegelemek megrendelésekor. Lehet "alapszintű" vagy "természetes". Alapértelmezés szerint "alapszintű" lesz, ha nincs megadva

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtjait és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

Nincs vagy ClientRawResponse, ha raw=true

Visszatérési típus

None,

Kivételek

recognize_printed_text

Az optikai karakterfelismerés (OCR) észleli a képeken lévő szöveget, és a felismert karaktereket egy géppel használható karakterfolyamba nyeri ki. A sikeresség után a rendszer visszaadja az OCR-eredményeket. Hiba esetén a rendszer a hibaüzenettel együtt adja vissza a hibakódot. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage vagy InternalServerError hibakód.

recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)

Paraméterek

detect_orientation
bool
alapértelmezett érték: True

Azt jelzi, hogy észleli-e a szöveg tájolását a képen. A detectOrientation=true értékkel az OCR szolgáltatás megpróbálja észlelni a kép tájolását, és javítani a további feldolgozás előtt (például fejjel lefelé).

url
str
Kötelező

Egy kép nyilvánosan elérhető URL-címe.

language
str vagy OcrLanguages
alapértelmezett érték: unk

A képen észlelendő szöveg BCP-47 nyelvi kódja. Az alapértelmezett érték a "unk". Lehetséges értékek: "unk", "zh-Hans", "zh-Hant", "cs", 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "legújabb".

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

OcrResult vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

recognize_printed_text_in_stream

Az optikai karakterfelismerés (OCR) észleli a képeken lévő szöveget, és a felismert karaktereket egy géppel használható karakterfolyamba nyeri ki. A sikeresség után a rendszer visszaadja az OCR-eredményeket. Hiba esetén a rendszer a hibaüzenettel együtt adja vissza a hibakódot. A hibakód lehet az InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage vagy InternalServerError hibakód.

recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

detect_orientation
bool
alapértelmezett érték: True

Azt jelzi, hogy észleli-e a szöveg tájolását a képen. A detectOrientation=true értékkel az OCR szolgáltatás megpróbálja észlelni a kép tájolását, és javítani a további feldolgozás előtt (például fejjel lefelé).

image
Generator
Kötelező

Képstream.

language
str vagy OcrLanguages
alapértelmezett érték: unk

A képen észlelendő szöveg BCP-47 nyelvi kódja. Az alapértelmezett érték a "unk". Lehetséges értékek: "unk", "zh-Hans", "zh-Hant", "cs", 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "legújabb".

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtjait és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

OcrResult vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek

tag_image

Ez a művelet a megadott kép tartalmához kapcsolódó szavak vagy címkék listáját hozza létre. A Computer Vision API képes címkéket visszaadni a képeken található objektumok, élőlények, tájak vagy műveletek alapján. A kategóriáktól eltérően a címkék nem hierarchikus besorolási rendszer szerint vannak rendszerezve, hanem a képtartalomnak felelnek meg. A címkék tartalmazhatnak tippeket a kétértelműség elkerülése vagy a kontextus biztosítása érdekében, például az "ascomycete" címkét a "gomba" tipp kísérheti. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Paraméterek

url
str
Kötelező

Egy kép nyilvánosan elérhető URL-címe.

language
str
alapértelmezett érték: en

A kimeneti létrehozás kívánt nyelve. Ha ez a paraméter nincs megadva, az alapértelmezett érték az "en". Támogatott nyelvek:hu – angol, alapértelmezett. es - spanyol, ja - japán, pt - portugál, zh - egyszerűsített kínai. Lehetséges értékek: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "legújabb".

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

operation_config
Kötelező

A műveletkonfiguráció felülbírálása.

Válaszok

TagResult vagy ClientRawResponse if raw=true

Visszatérési típus

Kivételek

tag_image_in_stream

Ez a művelet a megadott kép tartalmához kapcsolódó szavak vagy címkék listáját hozza létre. A Computer Vision API képes címkéket visszaadni a képeken található objektumok, élőlények, tájak vagy műveletek alapján. A kategóriáktól eltérően a címkék nem hierarchikus besorolási rendszer szerint vannak rendszerezve, hanem a képtartalomnak felelnek meg. A címkék tartalmazhatnak tippeket a kétértelműség elkerülése vagy a kontextus biztosítása érdekében, például az "ascomycete" címkét a "gomba" tipp kísérheti. Két bemeneti módszer támogatott: (1) Kép feltöltése vagy (2) kép URL-címének megadása. A rendszer sikeres választ ad vissza A JSON-fájlban. Ha a kérés sikertelen, a válasz tartalmaz egy hibakódot és egy üzenetet, amely segít megérteni, hogy mi történt.

tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Paraméterek

image
Generator
Kötelező

Képstream.

language
str
alapértelmezett érték: en

A kimeneti létrehozás kívánt nyelve. Ha ez a paraméter nincs megadva, az alapértelmezett érték az "en". Támogatott nyelvek:hu – angol, alapértelmezett. es - spanyol, ja - japán, pt - portugál, zh - egyszerűsített kínai. Lehetséges értékek: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
alapértelmezett érték: latest

Nem kötelező paraméter az AI-modell verziójának megadásához. Az elfogadott értékek a következők: "latest", "2021-04-01". Alapértelmezés szerint a "latest" (legújabb) értékre van kapcsolva.

custom_headers
dict
alapértelmezett érték: None

a kérelemhez hozzáadandó fejlécek

raw
bool
alapértelmezett érték: False

a deszerializált válasz mellett a közvetlen választ adja vissza

callback
Callable[<xref:Bytes>, <xref:response=None>]
alapértelmezett érték: None

Ha meg van adva, a rendszer meghívja a rendszer a streamelt adatok minden egyes adattömbjével. A visszahívásnak két argumentumot kell figyelembe vennie: az aktuális adattömb bájtját és a válaszobjektumot. Ha az adatok feltöltése történik, a válasz Nem lesz.

operation_config
Kötelező

Műveleti konfiguráció felülbírálásai.

Válaszok

TagResult vagy ClientRawResponse, ha raw=true

Visszatérési típus

Kivételek