ComputerVisionClientOperationsMixin الفصل

توريث
builtins.object
ComputerVisionClientOperationsMixin

الدالمنشئ

ComputerVisionClientOperationsMixin()

الأساليب

analyze_image

تستخرج هذه العملية مجموعة غنية من الميزات المرئية استنادا إلى محتوى الصورة. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. ضمن طلبك، هناك معلمة اختيارية للسماح لك باختيار الميزات التي يجب إرجاعها. بشكل افتراضي، يتم إرجاع فئات الصور في الاستجابة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

analyze_image_by_domain

تتعرف هذه العملية على المحتوى داخل صورة من خلال تطبيق نموذج خاص بالمجال. يمكن استرداد قائمة النماذج الخاصة بالمجال التي تدعمها واجهة برمجة تطبيقات Computer Vision باستخدام طلب /models GET. حاليا، توفر واجهة برمجة التطبيقات النماذج التالية الخاصة بالمجال: المشاهير والمعالم. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

analyze_image_by_domain_in_stream

تتعرف هذه العملية على المحتوى داخل صورة من خلال تطبيق نموذج خاص بالمجال. يمكن استرداد قائمة النماذج الخاصة بالمجال التي تدعمها واجهة برمجة تطبيقات Computer Vision باستخدام طلب /models GET. حاليا، توفر واجهة برمجة التطبيقات النماذج التالية الخاصة بالمجال: المشاهير والمعالم. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

analyze_image_in_stream

تستخرج هذه العملية مجموعة غنية من الميزات المرئية استنادا إلى محتوى الصورة. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. ضمن طلبك، هناك معلمة اختيارية للسماح لك باختيار الميزات التي تريد إرجاعها. بشكل افتراضي، يتم إرجاع فئات الصور في الاستجابة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

describe_image

تنشئ هذه العملية وصفا لصورة بلغة يمكن للبشر قراءتها مع جمل كاملة. يستند الوصف إلى مجموعة من علامات المحتوى، والتي يتم إرجاعها أيضا بواسطة العملية. يمكن إنشاء أكثر من وصف واحد لكل صورة. يتم ترتيب الأوصاف حسب درجة الثقة الخاصة بها. قد تتضمن الأوصاف نتائج من نماذج المجال الشهيرة والمعالم، إن أمكن. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

describe_image_in_stream

تنشئ هذه العملية وصفا لصورة بلغة يمكن للبشر قراءتها مع جمل كاملة. يستند الوصف إلى مجموعة من علامات المحتوى، والتي يتم إرجاعها أيضا بواسطة العملية. يمكن إنشاء أكثر من وصف واحد لكل صورة. يتم ترتيب الأوصاف حسب درجة الثقة الخاصة بها. قد تتضمن الأوصاف نتائج من نماذج المجال الشهيرة والمعالم، إن أمكن. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

detect_objects

يقوم بالكشف عن العنصر على الصورة المحددة. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

detect_objects_in_stream

يقوم بالكشف عن العنصر على الصورة المحددة. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

generate_thumbnail

تنشئ هذه العملية صورة مصغرة بالعرض والارتفاع المحددين من قبل المستخدم. بشكل افتراضي، تحلل الخدمة الصورة، وتحدد منطقة الاهتمام (ROI)، وتعمل على إنشاء إحداثيات الاقتصاص الذكي استنادًا إلى ROI. يساعد الاقتصاص الذكي عند تحديد نسبة العرض إلى الارتفاع التي تختلف عن نسبة صورة الإدخال. تحتوي الاستجابة الناجحة على الصورة الثنائية للصورة المصغرة. إذا فشل الطلب، تحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في تحديد الخطأ الذي حدث. عند الفشل، يتم إرجاع رمز الخطأ ورسالة خطأ. قد يكون رمز الخطأ واحدا من InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو InvalidThumbnailSize أو NotSupportedImage أو FailedToProcess أو Timeout أو InternalServerError.

generate_thumbnail_in_stream

تنشئ هذه العملية صورة مصغرة بالعرض والارتفاع المحددين من قبل المستخدم. بشكل افتراضي، تحلل الخدمة الصورة، وتحدد منطقة الاهتمام (ROI)، وتعمل على إنشاء إحداثيات الاقتصاص الذكي استنادًا إلى ROI. يساعد الاقتصاص الذكي عند تحديد نسبة العرض إلى الارتفاع التي تختلف عن نسبة صورة الإدخال. تحتوي الاستجابة الناجحة على الصورة الثنائية للصورة المصغرة. إذا فشل الطلب، تحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في تحديد الخطأ الذي حدث. عند الفشل، يتم إرجاع رمز الخطأ ورسالة خطأ. قد يكون رمز الخطأ واحدا من InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو InvalidThumbnailSize أو NotSupportedImage أو FailedToProcess أو Timeout أو InternalServerError.

get_area_of_interest

تقوم هذه العملية بإرجاع مربع إحاطة حول المنطقة الأكثر أهمية للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، تحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في تحديد الخطأ الذي حدث. عند الفشل، يتم إرجاع رمز الخطأ ورسالة خطأ. قد يكون رمز الخطأ أحد InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو NotSupportedImage أو FailedToProcess أو Timeout أو InternalServerError.

get_area_of_interest_in_stream

تقوم هذه العملية بإرجاع مربع إحاطة حول المنطقة الأكثر أهمية للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، تحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في تحديد الخطأ الذي حدث. عند الفشل، يتم إرجاع رمز الخطأ ورسالة خطأ. قد يكون رمز الخطأ أحد InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو NotSupportedImage أو FailedToProcess أو Timeout أو InternalServerError.

get_read_result

تستخدم هذه الواجهة للحصول على نتائج التعرف البصري على الحروف لعملية القراءة. يجب استرداد عنوان URL لهذه الواجهة من حقل "Operation-Location" الذي تم إرجاعه من واجهة القراءة.

list_models

ترجع هذه العملية قائمة النماذج الخاصة بالمجال التي تدعمها واجهة برمجة تطبيقات Computer Vision. حاليا، تدعم واجهة برمجة التطبيقات النماذج التالية الخاصة بالمجال: أداة التعرف على المشاهير، وأداة التعرف على المعالم. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

read

استخدم هذه الواجهة للحصول على نتيجة عملية القراءة، باستخدام أحدث خوارزميات التعرف البصري على الحروف (OCR) المحسنة للمستندات كثيفة النصوص. عند استخدام واجهة القراءة، تحتوي الاستجابة على حقل يسمى "Operation-Location". يحتوي الحقل "Operation-Location" على عنوان URL الذي يجب استخدامه لعملية "GetReadResult" للوصول إلى نتائج التعرف البصري على الحروف..

read_in_stream

استخدم هذه الواجهة للحصول على نتيجة عملية القراءة، باستخدام أحدث خوارزميات التعرف البصري على الحروف (OCR) المحسنة للمستندات كثيفة النصوص. عند استخدام واجهة القراءة، تحتوي الاستجابة على حقل يسمى "Operation-Location". يحتوي الحقل "Operation-Location" على عنوان URL الذي يجب استخدامه لعملية "GetReadResult" للوصول إلى نتائج التعرف البصري على الحروف..

recognize_printed_text

يكتشف التعرف البصري على الحروف (OCR) النص في صورة ويستخرج الأحرف التي تم التعرف عليها في دفق أحرف قابل للاستخدام الآلي. عند النجاح، سيتم إرجاع نتائج التعرف البصري على الحروف. عند الفشل، سيتم إرجاع رمز الخطأ مع رسالة خطأ. يمكن أن يكون رمز الخطأ واحدا من InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو NotSupportedImage أو NotSupportedLanguage أو InternalServerError.

recognize_printed_text_in_stream

يكتشف التعرف البصري على الحروف (OCR) النص في صورة ويستخرج الأحرف التي تم التعرف عليها في دفق أحرف قابل للاستخدام الآلي. عند النجاح، سيتم إرجاع نتائج التعرف البصري على الحروف. عند الفشل، سيتم إرجاع رمز الخطأ مع رسالة خطأ. يمكن أن يكون رمز الخطأ واحدا من InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو NotSupportedImage أو NotSupportedLanguage أو InternalServerError.

tag_image

تنشئ هذه العملية قائمة بالكلمات أو العلامات ذات الصلة بمحتوى الصورة المتوفرة. يمكن لواجهة برمجة تطبيقات Computer Vision إرجاع العلامات استنادا إلى العناصر أو الكائنات الحية أو المناظر الطبيعية أو الإجراءات الموجودة في الصور. على عكس الفئات، لا يتم تنظيم العلامات وفقا لنظام تصنيف هرمي، ولكنها تتوافق مع محتوى الصورة. قد تحتوي العلامات على تلميحات لتجنب الغموض أو توفير السياق، على سبيل المثال قد تكون العلامة "ascomycete" مصحوبة بتلميح "الفطريات". يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

tag_image_in_stream

تنشئ هذه العملية قائمة بالكلمات أو العلامات ذات الصلة بمحتوى الصورة المتوفرة. يمكن لواجهة برمجة تطبيقات Computer Vision إرجاع العلامات استنادا إلى العناصر أو الكائنات الحية أو المناظر الطبيعية أو الإجراءات الموجودة في الصور. على عكس الفئات، لا يتم تنظيم العلامات وفقا لنظام تصنيف هرمي، ولكنها تتوافق مع محتوى الصورة. قد تحتوي العلامات على تلميحات لتجنب الغموض أو توفير السياق، على سبيل المثال قد تكون العلامة "ascomycete" مصحوبة بتلميح "الفطريات". يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

analyze_image

تستخرج هذه العملية مجموعة غنية من الميزات المرئية استنادا إلى محتوى الصورة. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. ضمن طلبك، هناك معلمة اختيارية للسماح لك باختيار الميزات التي يجب إرجاعها. بشكل افتراضي، يتم إرجاع فئات الصور في الاستجابة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

المعلمات

url
str
مطلوب

عنوان URL يمكن الوصول إليه بشكل عام لصورة.

visual_features
list[str أو VisualFeatureTypes]
القيمة الافتراضية: None

سلسلة تشير إلى أنواع الميزات المرئية التي يجب إرجاعها. يجب فصل قيم متعددة بفواصل. تتضمن أنواع الميزات المرئية الصالحة: الفئات - تصنف محتوى الصورة وفقا لتصنيف محدد في الوثائق. العلامات - وضع علامة على الصورة بقائمة مفصلة من الكلمات المتعلقة بمحتوى الصورة. الوصف - يصف محتوى الصورة بجملة إنجليزية كاملة. الوجوه - يكتشف ما إذا كانت الوجوه موجودة. في حالة وجودها، يقوم بإنشاء الإحداثيات، والجنس، والعمر. ImageType - يكتشف ما إذا كانت الصورة عبارة عن قصاصة أو رسم خط. اللون - يحدد لون التمييز واللون السائد وما إذا كانت الصورة باللون الأبيض الأسود&. البالغ - يكتشف ما إذا كانت الصورة إباحية في طبيعتها (تصور العري أو الفعل الجنسي)، أو هي gory (تصور العنف الشديد أو الدم). كما يتم الكشف عن المحتوى الموحي جنسياً (ويعرف أيضاً باسم المحتوى الجريء). الكائنات - يكتشف كائنات مختلفة داخل صورة، بما في ذلك الموقع التقريبي. تتوفر وسيطة الكائنات باللغة الإنجليزية فقط. العلامات التجارية - تكتشف علامات تجارية مختلفة داخل صورة، بما في ذلك الموقع التقريبي. تتوفر وسيطة العلامات التجارية باللغة الإنجليزية فقط.

details
list[str أو Details]
القيمة الافتراضية: None

سلسلة تشير إلى التفاصيل الخاصة بالمجال المراد إرجاعها. يجب فصل قيم متعددة بفواصل. تتضمن أنواع الميزات المرئية الصالحة: المشاهير - يحدد المشاهير إذا تم اكتشافهم في الصورة، والمعالم - يحدد المعالم البارزة في الصورة.

language
str
القيمة الافتراضية: en

اللغة المطلوبة لإنشاء الإخراج. إذا لم يتم تحديد هذه المعلمة، فإن القيمة الافتراضية هي "en". اللغات المدعومة:en - الإنجليزية، الافتراضية. es - الإسبانية، ja - اليابانية، pt - البرتغالية، zh - الصينية المبسطة. تتضمن القيم المحتملة: "en" و"es" و"ja" و"pt" و"zh"

description_exclude
list[str أو DescriptionExclude]
القيمة الافتراضية: None

قم بإيقاف تشغيل نماذج المجال المحددة عند إنشاء الوصف.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

ImageAnalysis أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

analyze_image_by_domain

تتعرف هذه العملية على المحتوى داخل صورة من خلال تطبيق نموذج خاص بالمجال. يمكن استرداد قائمة النماذج الخاصة بالمجال التي تدعمها واجهة برمجة تطبيقات Computer Vision باستخدام طلب /models GET. حاليا، توفر واجهة برمجة التطبيقات النماذج التالية الخاصة بالمجال: المشاهير والمعالم. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

المعلمات

model
str
مطلوب

المحتوى الخاص بالمجال المراد التعرف عليه.

url
str
مطلوب

عنوان URL يمكن الوصول إليه بشكل عام لصورة.

language
str
القيمة الافتراضية: en

اللغة المطلوبة لإنشاء الإخراج. إذا لم يتم تحديد هذه المعلمة، فإن القيمة الافتراضية هي "en". اللغات المدعومة:en - الإنجليزية، الافتراضية. es - الإسبانية، ja - اليابانية، pt - البرتغالية، zh - الصينية المبسطة. تتضمن القيم المحتملة: "en" و"es" و"ja" و"pt" و"zh"

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

DomainModelResults أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

analyze_image_by_domain_in_stream

تتعرف هذه العملية على المحتوى داخل صورة من خلال تطبيق نموذج خاص بالمجال. يمكن استرداد قائمة النماذج الخاصة بالمجال التي تدعمها واجهة برمجة تطبيقات Computer Vision باستخدام طلب /models GET. حاليا، توفر واجهة برمجة التطبيقات النماذج التالية الخاصة بالمجال: المشاهير والمعالم. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

model
str
مطلوب

المحتوى الخاص بالمجال المراد التعرف عليه.

image
Generator
مطلوب

دفق صورة.

language
str
القيمة الافتراضية: en

اللغة المطلوبة لإنشاء الإخراج. إذا لم يتم تحديد هذه المعلمة، فإن القيمة الافتراضية هي "en". اللغات المدعومة:en - الإنجليزية، الافتراضية. es - الإسبانية، ja - اليابانية، pt - البرتغالية، zh - الصينية المبسطة. تتضمن القيم المحتملة: "en" و"es" و"ja" و"pt" و"zh"

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

DomainModelResults أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

analyze_image_in_stream

تستخرج هذه العملية مجموعة غنية من الميزات المرئية استنادا إلى محتوى الصورة. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. ضمن طلبك، هناك معلمة اختيارية للسماح لك باختيار الميزات التي تريد إرجاعها. بشكل افتراضي، يتم إرجاع فئات الصور في الاستجابة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

image
Generator
مطلوب

دفق صورة.

visual_features
list[str أو VisualFeatureTypes]
القيمة الافتراضية: None

سلسلة تشير إلى أنواع الميزات المرئية التي يجب إرجاعها. يجب فصل قيم متعددة بفواصل. تتضمن أنواع الميزات المرئية الصالحة: الفئات - تصنف محتوى الصورة وفقا لتصنيف محدد في الوثائق. العلامات - وضع علامة على الصورة بقائمة مفصلة من الكلمات المتعلقة بمحتوى الصورة. الوصف - يصف محتوى الصورة بجملة إنجليزية كاملة. الوجوه - يكتشف ما إذا كانت الوجوه موجودة. في حالة وجودها، يقوم بإنشاء الإحداثيات، والجنس، والعمر. ImageType - يكتشف ما إذا كانت الصورة عبارة عن قصاصة أو رسم خط. اللون - يحدد لون التمييز واللون السائد وما إذا كانت الصورة باللون الأبيض الأسود&. البالغ - يكتشف ما إذا كانت الصورة إباحية في طبيعتها (تصور العري أو الفعل الجنسي)، أو هي gory (تصور العنف الشديد أو الدم). كما يتم الكشف عن المحتوى الموحي جنسياً (ويعرف أيضاً باسم المحتوى الجريء). الكائنات - يكتشف كائنات مختلفة داخل صورة، بما في ذلك الموقع التقريبي. تتوفر وسيطة الكائنات باللغة الإنجليزية فقط. العلامات التجارية - تكتشف علامات تجارية مختلفة داخل صورة، بما في ذلك الموقع التقريبي. تتوفر وسيطة العلامات التجارية باللغة الإنجليزية فقط.

details
list[str أو Details]
القيمة الافتراضية: None

سلسلة تشير إلى التفاصيل الخاصة بالمجال المراد إرجاعها. يجب فصل قيم متعددة بفواصل. تتضمن أنواع الميزات المرئية الصالحة: المشاهير - يحدد المشاهير إذا تم اكتشافهم في الصورة، المعالم - يحدد المعالم البارزة في الصورة.

language
str
القيمة الافتراضية: en

اللغة المطلوبة لتوليد الإخراج. إذا لم يتم تحديد هذه المعلمة، فإن القيمة الافتراضية هي "en". اللغات المدعومة:en - الإنجليزية، الافتراضية. es - الإسبانية، ja - اليابانية، نقطة - البرتغالية، zh - الصينية المبسطة. تتضمن القيم المحتملة: "en"، و"es"، و"ja"، و"pt"، و"zh"

description_exclude
list[str أو DescriptionExclude]
القيمة الافتراضية: None

قم بإيقاف تشغيل نماذج المجال المحددة عند إنشاء الوصف.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

ImageAnalysis أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

describe_image

تنشئ هذه العملية وصفا لصورة بلغة يمكن للبشر قراءتها مع جمل كاملة. يستند الوصف إلى مجموعة من علامات المحتوى، والتي يتم إرجاعها أيضا بواسطة العملية. يمكن إنشاء أكثر من وصف واحد لكل صورة. يتم ترتيب الأوصاف حسب درجة الثقة الخاصة بها. قد تتضمن الأوصاف نتائج من نماذج المجال الشهيرة والمعالم، إن أمكن. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

المعلمات

url
str
مطلوب

عنوان URL لصورة يمكن الوصول إليه بشكل عام.

max_candidates
int
القيمة الافتراضية: 1

الحد الأقصى لعدد أوصاف المرشحين التي سيتم إرجاعها. الإعداد الافتراضي هو 1.

language
str
القيمة الافتراضية: en

اللغة المطلوبة لتوليد الإخراج. إذا لم يتم تحديد هذه المعلمة، فإن القيمة الافتراضية هي "en". اللغات المدعومة:en - الإنجليزية، الافتراضية. es - الإسبانية، ja - اليابانية، نقطة - البرتغالية، zh - الصينية المبسطة. تتضمن القيم المحتملة: "en"، و"es"، و"ja"، و"pt"، و"zh"

description_exclude
list[str أو DescriptionExclude]
القيمة الافتراضية: None

قم بإيقاف تشغيل نماذج المجال المحددة عند إنشاء الوصف.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

ImageDescription أو ClientRawResponse إذا كان raw=true

نوع الإرجاع

استثناءات

describe_image_in_stream

تنشئ هذه العملية وصفا لصورة بلغة يمكن للبشر قراءتها مع جمل كاملة. يستند الوصف إلى مجموعة من علامات المحتوى، والتي يتم إرجاعها أيضا بواسطة العملية. يمكن إنشاء أكثر من وصف واحد لكل صورة. يتم ترتيب الأوصاف حسب درجة الثقة الخاصة بها. قد تتضمن الأوصاف نتائج من نماذج المجال الشهيرة والمعالم، إن أمكن. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

image
Generator
مطلوب

دفق صورة.

max_candidates
int
القيمة الافتراضية: 1

الحد الأقصى لعدد أوصاف المرشحين التي سيتم إرجاعها. الإعداد الافتراضي هو 1.

language
str
القيمة الافتراضية: en

اللغة المطلوبة لتوليد الإخراج. إذا لم يتم تحديد هذه المعلمة، فإن القيمة الافتراضية هي "en". اللغات المدعومة:en - الإنجليزية، الافتراضية. es - الإسبانية، ja - اليابانية، نقطة - البرتغالية، zh - الصينية المبسطة. تتضمن القيم المحتملة: "en"، و"es"، و"ja"، و"pt"، و"zh"

description_exclude
list[str أو DescriptionExclude]
القيمة الافتراضية: None

قم بإيقاف تشغيل نماذج المجال المحددة عند إنشاء الوصف.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

ImageDescription أو ClientRawResponse إذا كان raw=true

نوع الإرجاع

استثناءات

detect_objects

يقوم بالكشف عن العنصر على الصورة المحددة. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

المعلمات

url
str
مطلوب

عنوان URL لصورة يمكن الوصول إليه بشكل عام.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

DetectResult أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

detect_objects_in_stream

يقوم بالكشف عن العنصر على الصورة المحددة. يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

image
Generator
مطلوب

دفق صورة.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

DetectResult أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

generate_thumbnail

تنشئ هذه العملية صورة مصغرة بالعرض والارتفاع المحددين من قبل المستخدم. بشكل افتراضي، تحلل الخدمة الصورة، وتحدد منطقة الاهتمام (ROI)، وتعمل على إنشاء إحداثيات الاقتصاص الذكي استنادًا إلى ROI. يساعد الاقتصاص الذكي عند تحديد نسبة العرض إلى الارتفاع التي تختلف عن نسبة صورة الإدخال. تحتوي الاستجابة الناجحة على الصورة الثنائية للصورة المصغرة. إذا فشل الطلب، تحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في تحديد الخطأ الذي حدث. عند الفشل، يتم إرجاع رمز الخطأ ورسالة خطأ. قد يكون رمز الخطأ واحدا من InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو InvalidThumbnailSize أو NotSupportedImage أو FailedToProcess أو Timeout أو InternalServerError.

generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

width
int
مطلوب

عرض الصورة المصغرة، بالبكسل. يجب أن يكون بين 1 و1024. موصى به بحد أدنى 50.

height
int
مطلوب

ارتفاع الصورة المصغرة، بالبكسل. يجب أن يكون بين 1 و1024. موصى به بحد أدنى 50.

url
str
مطلوب

عنوان URL يمكن الوصول إليه بشكل عام لصورة.

smart_cropping
bool
القيمة الافتراضية: False

علامة منطقية لتمكين الاقتصاص الذكي.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

عنصر أو ClientRawResponse إذا كان raw=true

نوع الإرجاع

استثناءات

generate_thumbnail_in_stream

تنشئ هذه العملية صورة مصغرة بالعرض والارتفاع المحددين من قبل المستخدم. بشكل افتراضي، تحلل الخدمة الصورة، وتحدد منطقة الاهتمام (ROI)، وتعمل على إنشاء إحداثيات الاقتصاص الذكي استنادًا إلى ROI. يساعد الاقتصاص الذكي عند تحديد نسبة العرض إلى الارتفاع التي تختلف عن نسبة صورة الإدخال. تحتوي الاستجابة الناجحة على الصورة الثنائية للصورة المصغرة. إذا فشل الطلب، تحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في تحديد الخطأ الذي حدث. عند الفشل، يتم إرجاع رمز الخطأ ورسالة خطأ. قد يكون رمز الخطأ واحدا من InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو InvalidThumbnailSize أو NotSupportedImage أو FailedToProcess أو Timeout أو InternalServerError.

generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

width
int
مطلوب

عرض الصورة المصغرة، بالبكسل. يجب أن يكون بين 1 و1024. موصى به بحد أدنى 50.

height
int
مطلوب

ارتفاع الصورة المصغرة، بالبكسل. يجب أن يكون بين 1 و1024. موصى به بحد أدنى 50.

image
Generator
مطلوب

دفق صورة.

smart_cropping
bool
القيمة الافتراضية: False

علامة منطقية لتمكين الاقتصاص الذكي.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

عنصر أو ClientRawResponse إذا كان raw=true

نوع الإرجاع

استثناءات

get_area_of_interest

تقوم هذه العملية بإرجاع مربع إحاطة حول المنطقة الأكثر أهمية للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، تحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في تحديد الخطأ الذي حدث. عند الفشل، يتم إرجاع رمز الخطأ ورسالة خطأ. قد يكون رمز الخطأ أحد InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو NotSupportedImage أو FailedToProcess أو Timeout أو InternalServerError.

get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

المعلمات

url
str
مطلوب

عنوان URL يمكن الوصول إليه بشكل عام لصورة.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

AreaOfInterestResult أو ClientRawResponse إذا كان raw=true

نوع الإرجاع

استثناءات

get_area_of_interest_in_stream

تقوم هذه العملية بإرجاع مربع إحاطة حول المنطقة الأكثر أهمية للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، تحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في تحديد الخطأ الذي حدث. عند الفشل، يتم إرجاع رمز الخطأ ورسالة خطأ. قد يكون رمز الخطأ أحد InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو NotSupportedImage أو FailedToProcess أو Timeout أو InternalServerError.

get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

image
Generator
مطلوب

دفق صورة.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

AreaOfInterestResult أو ClientRawResponse إذا كان raw=true

نوع الإرجاع

استثناءات

get_read_result

تستخدم هذه الواجهة للحصول على نتائج التعرف البصري على الحروف لعملية القراءة. يجب استرداد عنوان URL لهذه الواجهة من حقل "Operation-Location" الذي تم إرجاعه من واجهة القراءة.

get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)

المعلمات

operation_id
str
مطلوب

تم إرجاع معرف عملية القراءة في استجابة واجهة "القراءة".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

ReadOperationResult أو ClientRawResponse إذا كان raw=true

نوع الإرجاع

استثناءات

list_models

ترجع هذه العملية قائمة النماذج الخاصة بالمجال التي تدعمها واجهة برمجة تطبيقات Computer Vision. حاليا، تدعم واجهة برمجة التطبيقات النماذج التالية الخاصة بالمجال: أداة التعرف على المشاهير، وأداة التعرف على المعالم. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

list_models(custom_headers=None, raw=False, **operation_config)

المعلمات

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

ListModelsResult أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

read

استخدم هذه الواجهة للحصول على نتيجة عملية القراءة، باستخدام أحدث خوارزميات التعرف البصري على الحروف (OCR) المحسنة للمستندات كثيفة النصوص. عند استخدام واجهة القراءة، تحتوي الاستجابة على حقل يسمى "Operation-Location". يحتوي الحقل "Operation-Location" على عنوان URL الذي يجب استخدامه لعملية "GetReadResult" للوصول إلى نتائج التعرف البصري على الحروف..

read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)

المعلمات

url
str
مطلوب

عنوان URL يمكن الوصول إليه بشكل عام لصورة.

language
str أو OcrDetectionLanguage
القيمة الافتراضية: None

رمز لغة BCP-47 للنص في المستند. يدعم Read تعريف اللغة التلقائي والمستندات متعددة اللغات، لذلك لا توفر سوى رمز لغة إذا كنت ترغب في فرض معالجة المستند بتلك اللغة المحددة. راجع https://aka.ms/ocr-languages للحصول على قائمة باللغات المدعومة. تتضمن القيم المحتملة: 'af'، 'ast'، 'bi'، 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
القيمة الافتراضية: None

أرقام الصفحات المخصصة للمستندات متعددة الصفحات (PDF/TIFF)، أدخل عدد الصفحات التي تريد الحصول على نتيجة التعرف البصري على الحروف. للحصول على مجموعة من الصفحات، استخدم واصلة. افصل كل صفحة أو نطاق بفاوصلة.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج التعرف البصري على الحروف المستخدم لاستخراج النص. القيم المقبولة هي: "الأحدث"، "أحدث معاينة"، "2021-04-12". الإعدادات الافتراضية إلى "الأحدث".

reading_order
str
القيمة الافتراضية: basic

معلمة اختيارية لتحديد خوارزمية ترتيب القراءة التي يجب تطبيقها عند ترتيب عناصر النص الاستخراج. يمكن أن يكون إما "أساسي" أو "طبيعي". سيتم تعيين الإعداد الافتراضي إلى "أساسي" إذا لم يتم تحديده

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

لا شيء أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

None,

استثناءات

read_in_stream

استخدم هذه الواجهة للحصول على نتيجة عملية القراءة، باستخدام أحدث خوارزميات التعرف البصري على الحروف (OCR) المحسنة للمستندات كثيفة النصوص. عند استخدام واجهة القراءة، تحتوي الاستجابة على حقل يسمى "Operation-Location". يحتوي الحقل "Operation-Location" على عنوان URL الذي يجب استخدامه لعملية "GetReadResult" للوصول إلى نتائج التعرف البصري على الحروف..

read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

image
Generator
مطلوب

دفق صورة.

language
str أو OcrDetectionLanguage
القيمة الافتراضية: None

رمز لغة BCP-47 للنص في المستند. يدعم Read تعريف اللغة التلقائي والمستندات متعددة اللغات، لذلك قم بتوفير رمز لغة فقط إذا كنت ترغب في فرض معالجة المستند بتلك اللغة المحددة. راجع https://aka.ms/ocr-languages للحصول على قائمة باللغات المدعومة. تتضمن القيم المحتملة: 'af'، 'ast'، 'bi'، 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'No', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
القيمة الافتراضية: None

أرقام الصفحات المخصصة للمستندات متعددة الصفحات (PDF/TIFF)، أدخل عدد الصفحات التي تريد الحصول على نتيجة التعرف البصري على الحروف. بالنسبة لمجموعة من الصفحات، استخدم واصلة. افصل كل صفحة أو نطاق بفاوصلة.

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج التعرف البصري على الحروف المستخدم لاستخراج النص. القيم المقبولة هي: "الأحدث"، "أحدث معاينة"، "2021-04-12". الإعدادات الافتراضية إلى "الأحدث".

reading_order
str
القيمة الافتراضية: basic

معلمة اختيارية لتحديد خوارزمية ترتيب القراءة التي يجب تطبيقها عند ترتيب عناصر النص الاستخراج. يمكن أن يكون إما "أساسي" أو "طبيعي". سيتم تعيين الإعداد الافتراضي إلى "أساسي" إذا لم يتم تحديده

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

لا شيء أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

None,

استثناءات

recognize_printed_text

يكتشف التعرف البصري على الحروف (OCR) النص في صورة ويستخرج الأحرف التي تم التعرف عليها في دفق أحرف قابل للاستخدام الآلي. عند النجاح، سيتم إرجاع نتائج التعرف البصري على الحروف. عند الفشل، سيتم إرجاع رمز الخطأ مع رسالة خطأ. يمكن أن يكون رمز الخطأ واحدا من InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو NotSupportedImage أو NotSupportedLanguage أو InternalServerError.

recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)

المعلمات

detect_orientation
bool
القيمة الافتراضية: True

ما إذا كان يتم الكشف عن اتجاه النص في الصورة. مع detectOrientation=true تحاول خدمة التعرف البصري على الحروف الكشف عن اتجاه الصورة وتصحيحها قبل المعالجة الإضافية (على سبيل المثال، إذا كانت مقلوبة).

url
str
مطلوب

عنوان URL لصورة يمكن الوصول إليه بشكل عام.

language
str أو OcrLanguages
القيمة الافتراضية: unk

رمز لغة BCP-47 للنص الذي سيتم اكتشافه في الصورة. القيمة الافتراضية هي "unk". تتضمن القيم المحتملة: "unk"، و"zh-Hans"، و"zh-Hant"، و"cs"، و"da"، 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

OcrResult أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

recognize_printed_text_in_stream

يكتشف التعرف البصري على الحروف (OCR) النص في صورة ويستخرج الأحرف التي تم التعرف عليها في دفق أحرف قابل للاستخدام الآلي. عند النجاح، سيتم إرجاع نتائج التعرف البصري على الحروف. عند الفشل، سيتم إرجاع رمز الخطأ مع رسالة خطأ. يمكن أن يكون رمز الخطأ واحدا من InvalidImageUrl أو InvalidImageFormat أو InvalidImageSize أو NotSupportedImage أو NotSupportedLanguage أو InternalServerError.

recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

detect_orientation
bool
القيمة الافتراضية: True

ما إذا كان يتم الكشف عن اتجاه النص في الصورة. مع detectOrientation=true تحاول خدمة التعرف البصري على الحروف الكشف عن اتجاه الصورة وتصحيحها قبل المعالجة الإضافية (على سبيل المثال، إذا كانت مقلوبة).

image
Generator
مطلوب

دفق صورة.

language
str أو OcrLanguages
القيمة الافتراضية: unk

رمز لغة BCP-47 للنص الذي سيتم اكتشافه في الصورة. القيمة الافتراضية هي "unk". تتضمن القيم المحتملة: "unk"، و"zh-Hans"، و"zh-Hant"، و"cs"، و"da"، 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

OcrResult أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

tag_image

تنشئ هذه العملية قائمة بالكلمات أو العلامات ذات الصلة بمحتوى الصورة المتوفرة. يمكن لواجهة برمجة تطبيقات Computer Vision إرجاع العلامات استنادا إلى العناصر أو الكائنات الحية أو المناظر الطبيعية أو الإجراءات الموجودة في الصور. على عكس الفئات، لا يتم تنظيم العلامات وفقا لنظام تصنيف هرمي، ولكنها تتوافق مع محتوى الصورة. قد تحتوي العلامات على تلميحات لتجنب الغموض أو توفير السياق، على سبيل المثال قد تكون العلامة "ascomycete" مصحوبة بتلميح "الفطريات". يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

المعلمات

url
str
مطلوب

عنوان URL لصورة يمكن الوصول إليه بشكل عام.

language
str
القيمة الافتراضية: en

اللغة المطلوبة لتوليد الإخراج. إذا لم يتم تحديد هذه المعلمة، فإن القيمة الافتراضية هي "en". اللغات المدعومة:en - الإنجليزية، الافتراضية. es - الإسبانية، ja - اليابانية، نقطة - البرتغالية، zh - الصينية المبسطة. تتضمن القيم المحتملة: "en"، و"es"، و"ja"، و"pt"، و"zh"

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

operation_config
مطلوب

تجاوزات تكوين العملية.

المرتجعات

TagResult أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات

tag_image_in_stream

تنشئ هذه العملية قائمة بالكلمات أو العلامات ذات الصلة بمحتوى الصورة المتوفرة. يمكن لواجهة برمجة تطبيقات Computer Vision إرجاع العلامات استنادا إلى العناصر أو الكائنات الحية أو المناظر الطبيعية أو الإجراءات الموجودة في الصور. على عكس الفئات، لا يتم تنظيم العلامات وفقا لنظام تصنيف هرمي، ولكنها تتوافق مع محتوى الصورة. قد تحتوي العلامات على تلميحات لتجنب الغموض أو توفير السياق، على سبيل المثال قد تكون العلامة "ascomycete" مصحوبة بتلميح "الفطريات". يتم دعم طريقتين للإدخال - (1) تحميل صورة أو (2) تحديد عنوان URL للصورة. سيتم إرجاع استجابة ناجحة في JSON. إذا فشل الطلب، فستحتوي الاستجابة على رمز خطأ ورسالة للمساعدة في فهم الخطأ الذي حدث.

tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

المعلمات

image
Generator
مطلوب

دفق صورة.

language
str
القيمة الافتراضية: en

اللغة المطلوبة لتوليد الإخراج. إذا لم يتم تحديد هذه المعلمة، فإن القيمة الافتراضية هي "en". اللغات المدعومة:en - الإنجليزية، الافتراضية. es - الإسبانية، ja - اليابانية، نقطة - البرتغالية، zh - الصينية المبسطة. تتضمن القيم المحتملة: "en"، و"es"، و"ja"، و"pt"، و"zh"

model_version
str
القيمة الافتراضية: latest

معلمة اختيارية لتحديد إصدار نموذج الذكاء الاصطناعي. القيم المقبولة هي: "الأحدث"، "2021-04-01". الإعدادات الافتراضية إلى "الأحدث".

custom_headers
dict
القيمة الافتراضية: None

الرؤوس التي ستتم إضافتها إلى الطلب

raw
bool
القيمة الافتراضية: False

إرجاع الاستجابة المباشرة جنبا إلى جنب مع الاستجابة التي تم إلغاء تسلسلها

callback
Callable[<xref:Bytes>, <xref:response=None>]
القيمة الافتراضية: None

عند تحديدها، سيتم استدعاؤها مع كل مجموعة من البيانات التي يتم دفقها. يجب أن يأخذ رد الاتصال وسيطتين، بايت المجموعة الحالية من البيانات وعنصر الاستجابة. إذا كانت البيانات قيد التحميل، ستكون الاستجابة بلا.

operation_config
مطلوب

تجاوز تكوين العملية.

المرتجعات

TagResult أو ClientRawResponse إذا كانت raw=true

نوع الإرجاع

استثناءات