نموذج عقد ذكاء المستند
هام
- توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
- قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
- إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
- يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
- شرق الولايات المتحدة
- غرب الولايات المتحدة 2
- غرب أوروبا
ينطبق هذا المحتوى على:v4.0 (معاينة) | الإصدار السابق:v3.1 (GA)
ينطبق هذا المحتوى على:v3.1 (GA) | أحدث إصدار:v4.0 (معاينة)
يستخدم نموذج عقد Document Intelligence إمكانات قوية للتعرف البصري على الحروف (OCR) لتحليل واستخراج الحقول الرئيسية وعناصر الخط من مجموعة محددة من كيانات العقد المهمة. يمكن أن تكون العقود من تنسيقات وجودة مختلفة بما في ذلك الصور المسجلة عبر الهاتف والمستندات الممسوحة ضوئيا وملفات PDF الرقمية. تقوم واجهة برمجة التطبيقات بتحليل نص المستند؛ يستخرج المعلومات الرئيسية مثل الأطراف، والولاية القضائية، ومعرف العقد، والعنوان؛ وإرجاع تمثيل بيانات JSON منظم. يدعم النموذج حاليا تنسيقات المستندات باللغة الإنجليزية.
معالجة العقود التلقائية
معالجة العقود الآلية هي عملية استخراج حقول العقود الرئيسية من الوثائق. تاريخيا، يتم تحقيق عملية تحليل العقد يدويا، وبالتالي، تستغرق وقتا طويلا جدا. عادة ما يكون الاستخراج الدقيق للبيانات الرئيسية من العقود هو أول وإحدى أهم الخطوات في عملية أتمتة العقد.
خيارات التطوير
يدعم Document Intelligence v4.0 (2024-02-29-preview) الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد | معرف النموذج |
---|---|---|
نموذج العقد | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
عقد مسبق الإنشاء |
يدعم Document Intelligence v3.1 الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد | معرف النموذج |
---|---|---|
نموذج العقد | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
عقد مسبق الإنشاء |
يدعم Document Intelligence v3.0 الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد | معرف النموذج |
---|---|---|
نموذج العقد | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
عقد مسبق الإنشاء |
متطلبات الإدخال
للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.
تنسيقات الملفات المعتمدة:
النموذج PDF الصورة:
JPEG/JPG، PNG، BMP، TIFF، HEIFMicrosoft Office:
Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTMLقراءة ✔ ✔ ✔ Layout ✔ ✔ ✔ (معاينة 2024-02-29، 2023-10-31-preview) مستند عام ✔ ✔ منشأ مسبقًا ✔ ✔ استخراج مخصص ✔ ✔ تصنيف مخصص ✔ ✔ ✔ (2024-02-29-preview) بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).
حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).
يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.
إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.
الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا
8
عند 150 نقطة لكل بوصة (DPI).بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.
لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.
بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات
1GB
التدريب بحد أقصى 10000 صفحة.
جرب استخراج بيانات مستند العقد
راجع كيفية استخراج البيانات، بما في ذلك معلومات العميل وتفاصيل المورد وعناصر السطر، من العقود. تحتاج إلى الموارد التالية:
اشتراك Azure - يمكنك إنشاء اشتراك مجانا.
مثيل Document Intelligence في مدخل Microsoft Azure. يمكنك استخدام طبقة التسعير المجانية
F0
() لتجربة الخدمة. بعد نشر المورد، حدد انتقال إلى المورد للحصول على المفتاح ونقطة النهاية.
Document Intelligence Studio
في الصفحة الرئيسية ل Document Intelligence Studio، حدد Tax Documents.
يمكنك تحليل نماذج المستندات الضريبية أو تحميل ملفاتك الخاصة.
حدد الزر Run analysis، وقم بتكوين خيارات Analyze، إذا لزم الأمر:
اللغات والإعدادات المحلية المدعومة
راجع صفحة دعم اللغة - النماذج التي تم إنشاؤها مسبقا للحصول على قائمة كاملة باللغات المدعومة.
استخراج ميداني
فيما يلي الحقول المستخرجة من عقد في استجابة إخراج JSON.
Name | كتابة | الوصف | مثال على الإخراج |
---|---|---|---|
المسمى الوظيفي | السلسلة | عنوان العقد | اتفاقية الخدمات |
معرف العقد | السلسلة | عنوان العقد | AB12956 |
الاطراف | صفيف | قائمة الأطراف القانونية | |
تاريخ التنفيذ | التاريخ | تاريخ التوقيع الكامل على الاتفاقية والاتفاق عليها من قبل جميع الأطراف | On this twenty-third day of February two thousand and twenty two |
ExpirationDate | التاريخ | تاريخ انتهاء سريان العقد | عام واحد |
تاريخ التجديد | التاريخ | تاريخ ضرورة تجديد العقد | On this twenty-third day of February two thousand and twenty two |
السلطات القضائية | صفيف | قائمة الولايات القضائية |
أزواج قيمة مفتاح العقد وعناصر السطر المستخرجة موجودة في documentResults
قسم من إخراج JSON.
الخطوات التالية
حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio.
أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.