نموذج عقد ذكاء المستند

هام

  • توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
  • قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
  • إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
  • يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
  • شرق الولايات المتحدة
  • غرب الولايات المتحدة 2
  • غرب أوروبا

ينطبق هذا المحتوى على:علامهv4.0 (معاينة) | الإصدار السابق:علامة اختيار زرقاءv3.1 (GA)

ينطبق هذا المحتوى على:علامهv3.1 (GA) | أحدث إصدار:علامة اختيار أرجوانيةv4.0 (معاينة)

يستخدم نموذج عقد Document Intelligence إمكانات قوية للتعرف البصري على الحروف (OCR) لتحليل واستخراج الحقول الرئيسية وعناصر الخط من مجموعة محددة من كيانات العقد المهمة. يمكن أن تكون العقود من تنسيقات وجودة مختلفة بما في ذلك الصور المسجلة عبر الهاتف والمستندات الممسوحة ضوئيا وملفات PDF الرقمية. تقوم واجهة برمجة التطبيقات بتحليل نص المستند؛ يستخرج المعلومات الرئيسية مثل الأطراف، والولاية القضائية، ومعرف العقد، والعنوان؛ وإرجاع تمثيل بيانات JSON منظم. يدعم النموذج حاليا تنسيقات المستندات باللغة الإنجليزية.

معالجة العقود التلقائية

معالجة العقود الآلية هي عملية استخراج حقول العقود الرئيسية من الوثائق. تاريخيا، يتم تحقيق عملية تحليل العقد يدويا، وبالتالي، تستغرق وقتا طويلا جدا. عادة ما يكون الاستخراج الدقيق للبيانات الرئيسية من العقود هو أول وإحدى أهم الخطوات في عملية أتمتة العقد.

خيارات التطوير

يدعم Document Intelligence v4.0 (2024-02-29-preview) الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد معرف النموذج
نموذج العقد Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
عقد مسبق الإنشاء

يدعم Document Intelligence v3.1 الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد معرف النموذج
نموذج العقد Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
عقد مسبق الإنشاء

يدعم Document Intelligence v3.0 الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد معرف النموذج
نموذج العقد Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
عقد مسبق الإنشاء

متطلبات الإدخال

  • للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.

  • تنسيقات الملفات المعتمدة:

    النموذج PDF الصورة:
    JPEG/JPG، PNG، BMP، TIFF، HEIF
    Microsoft Office:
    Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTML
    قراءة
    Layout ✔ (معاينة 2024-02-29، 2023-10-31-preview)
    مستند عام
    منشأ مسبقًا
    استخراج مخصص
    تصنيف مخصص ✔ (2024-02-29-preview)
  • بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).

  • حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).

  • يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.

  • إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.

  • الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا 8عند 150 نقطة لكل بوصة (DPI).

  • بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.

    • لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.

    • بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات 1GB التدريب بحد أقصى 10000 صفحة.

جرب استخراج بيانات مستند العقد

راجع كيفية استخراج البيانات، بما في ذلك معلومات العميل وتفاصيل المورد وعناصر السطر، من العقود. تحتاج إلى الموارد التالية:

  • اشتراك Azure - يمكنك إنشاء اشتراك مجانا.

  • مثيل Document Intelligence في مدخل Microsoft Azure. يمكنك استخدام طبقة التسعير المجانيةF0 () لتجربة الخدمة. بعد نشر المورد، حدد انتقال إلى المورد للحصول على المفتاح ونقطة النهاية.

لقطة شاشة للمفاتيح وموقع نقطة النهاية في مدخل Microsoft Azure.

Document Intelligence Studio

  1. في الصفحة الرئيسية ل Document Intelligence Studio، حدد Tax Documents.

  2. يمكنك تحليل نماذج المستندات الضريبية أو تحميل ملفاتك الخاصة.

  3. حدد الزر Run analysis، وقم بتكوين خيارات Analyze، إذا لزم الأمر:

    لقطة شاشة لأزرار خيارات تحليل التشغيل والتحليل في Document Intelligence Studio.

اللغات والإعدادات المحلية المدعومة

راجع صفحة دعم اللغة - النماذج التي تم إنشاؤها مسبقا للحصول على قائمة كاملة باللغات المدعومة.

استخراج ميداني

فيما يلي الحقول المستخرجة من عقد في استجابة إخراج JSON.

Name كتابة ‏‏الوصف مثال على الإخراج
‏‫المسمى الوظيفي السلسلة‬ عنوان العقد اتفاقية الخدمات
معرف العقد السلسلة‬ عنوان العقد AB12956
الاطراف صفيف قائمة الأطراف القانونية
تاريخ التنفيذ التاريخ تاريخ التوقيع الكامل على الاتفاقية والاتفاق عليها من قبل جميع الأطراف On this twenty-third day of February two thousand and twenty two
ExpirationDate التاريخ تاريخ انتهاء سريان العقد عام واحد
تاريخ التجديد التاريخ تاريخ ضرورة تجديد العقد On this twenty-third day of February two thousand and twenty two
السلطات القضائية صفيف قائمة الولايات القضائية

أزواج قيمة مفتاح العقد وعناصر السطر المستخرجة موجودة في documentResults قسم من إخراج JSON.

الخطوات التالية

  • حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio.

  • أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.