ما الجديد في Azure الذكاء الاصطناعي Document Intelligence

ينطبق هذا المحتوى على:علامهv4.0 (معاينة)علامهv3.1 (GA)علامهv3.0 (GA)علامهv2.1 (GA)

يتم تحديث خدمة Document Intelligence على أساس مستمر. ضع إشارة مرجعية على هذه الصفحة للبقاء على اطلاع بملاحظات الإصدار وتحسينات الميزات وأحدث وثائقنا.

هام

يتم إيقاف إصدارات واجهة برمجة تطبيقات المعاينة بمجرد إصدار واجهة برمجة تطبيقات GA. يتم إيقاف إصدار واجهة برمجة التطبيقات 2023-02-28-preview، إذا كنت لا تزال تستخدم واجهة برمجة تطبيقات المعاينة أو إصدارات SDK المقترنة، فيرجى تحديث التعليمات البرمجية لاستهداف أحدث إصدار من واجهة برمجة التطبيقات 2023-07-31 (GA).

مايو 2024

أضاف Document Intelligence Studio دعما لمصادقة Microsoft Entra (المعروف سابقا ب Azure Active Directory). لمزيد من المعلومات، راجعنظرة عامة على Document Intelligence Studio.

فبراير 2024

تتوفر الآن واجهة برمجة تطبيقات REST ل Document Intelligence 2024-02-29-preview. تقدم واجهة برمجة تطبيقات المعاينة هذه قدرات جديدة ومحدثة:

  • يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:

    • شرق الولايات المتحدة
    • غرب الولايات المتحدة 2
    • غرب أوروبا
  • يدعم نموذج التخطيط الآن الكشف عنالأرقام وتحليل بنية المستند الهرمي (المقاطع والأقسام الفرعية). كما تم تحسين جودة الذكاء الاصطناعي لترتيب القراءة واكتشاف الأدوار المنطقية.

  • نماذج استخراج مخصصة

    • تدعم نماذج الاستخراج المخصصة الآن درجات الثقة على مستوى الخلية والصف والجدول. تعرف على المزيد حول الجدول والصف وثقة الخلية.
    • تحتوي نماذج الاستخراج المخصصة على تحسينات جودة الذكاء الاصطناعي لاستخراج الحقل.
    • يدعم نموذج استخراج القالب المخصص الآن استخراج الحقول المتداخلة. تعرف على المزيد حول الحقول المتداخلة وكيفية استخدامها.
  • نموذج تصنيف مخصص

    • يدعم نموذج التصنيف المخصص الآن التدريب المتزايد للسيناريوهات التي تحتاج فيها إلى تحديث نموذج المصنف بنماذج إضافية أو فئات إضافية. تعرف على المزيد حول التدريب المتزايد.
    • يضيف نموذج التصنيف المخصص الدعم إلى أنواع مستندات Office (.docx .pptx .xls). تعرف على المزيد حول دعم نوع المستند الموسع.
  • نموذج الفاتورة

    • دعم لغة جديدة:
    اللغة المحلية الرمز
    العربية (ar)
    البلغارية (bg)
    اليونانية (el)
    العبرية (he)
    المقدونية (mk)
    الروسية (ru) السيريلية الصربية (sr-cyrl)
    الأوكرانية (uk)
    التايلاندية (th)
    التركية (tr)
    الفيتنامية (vi)
    • دعم رموز العملة الجديدة:
    ‏‏العملة اللغة المحلية رمز
    BAM علامة بوسنية قابلة للتحويل (ba)
    Bgn ليف بلغاري (bg)
    Ils شيكل جديد إسرائيلي (il)
    Mkd دينار المقدونية (mk)
    RUB روبل روسي (ru)
    Thb باهت التايلاندية (th)
    TRY الليرة التركية (tr)
    Uah الهريفنيا الأوكرانية (ua)
    Vnd الفيتنامية دونغ (vn)
    • البنود الضريبية دعم التوسع لألمانيا (de), إسبانيا (es),البرتغال (pt), الإنجليزية كندا en-CA.
  • نموذج المعرف

    • دعم ميداني موسع لمعرفات الاتحاد الأوروبي ورخصة القيادة.
  • 🆕 مستندات الرهن العقاري

    • استخراج المعلومات من طلب قرض سكني موحد (نموذج 1003).
    • استخراج المعلومات من الملخص الموحد للكتابة والإرسال أو النموذج 1008.
    • استخراج المعلومات من الكشف عن إغلاق الرهن العقاري.
  • 🆕 نموذج بطاقة الائتمان/الخصم

    • استخراج المعلومات من البطاقات المصرفية.
  • 🆕 شهادة زواج

    • تم بناء جديد مسبقا لاستخراج المعلومات من شهادات الزواج.

ديسمبر 2023

مكتبات عميل Document Intelligence التي تستهدف REST API 2023-10-31-preview متاحة الآن للاستخدام!

نوفمبر 2023

تتوفر الآن واجهة برمجة تطبيقات REST ل Document Intelligence 2023-10-31-preview. تقدم واجهة برمجة تطبيقات المعاينة هذه قدرات جديدة ومحدثة:

  • يتوفر إصدار المعاينة العامة 2023-10-31-preview حاليا فقط في مناطق Azure التالية:

    • شرق الولايات المتحدة
    • غرب الولايات المتحدة 2
    • غرب أوروبا
  • نموذج القراءة

    • توسيع اللغة للكتابة اليدوية: الروسية(ru)، العربية(ar)، التايلاندية(th).
    • الامتثال للأمر التنفيذي عبر الإنترنت (EO).
  • نموذج تخطيط

    • دعم ملفات OFFICE وHTML.
    • دعم إخراج Markdown.
    • تحسينات استخراج الجدول وترتيب القراءة والكشف عن عناوين المقاطع.
    • باستخدام Document Intelligence 2023-10-31-preview، يتم إهمال نموذج المستند العام (المستند الذي تم إنشاؤه مسبقا). من الآن فصاعدا، لاستخراج أزواج قيمة المفتاح من المستندات، استخدم prebuilt-layout النموذج مع تمكين معلمة features=keyValuePairs سلسلة الاستعلام الاختيارية.
  • نموذج الإيصال

    • الآن يستخرج العملة لجميع الحقول المتعلقة بالسعر.
  • نموذج بطاقة التأمين الصحي

    • دعم ميداني جديد لمعلومات Medicare وMedicaid.
  • نماذج المستندات الضريبية في الولايات المتحدة

    • نموذج ضريبة 1099 جديد. يدعم نموذج 1099 الأساسي والتباينات التالية: A، B، C، CAP، DIV، G، H، INT، K، LS، LTC، MISC، NEC، OID، PATR، Q، QA، R، S، SA، SB.
  • نموذج الفاتورة

    • KVK دعم الحقل.
    • BPAY دعم الحقل.
    • العديد من تحسينات الحقول.
  • تصنيف مخصص

    • دعم المستندات متعددة اللغات.
    • خيارات تقسيم الصفحة الجديدة: التقسيم التلقائي، والتقسيم دائما حسب الصفحة، وعدم التقسيم.
  • إمكانات الوظيفة الإضافية

    • تتوفر حقول الاستعلام مع 2023-10-31-preview الإصدار.
    • تتوفر قدرات الوظيفة الإضافية داخل جميع النماذج باستثناء نموذج القراءة.

إشعار

مع إصدار التوفر العام لواجهة برمجة التطبيقات 2022-08-31، يتم إهمال واجهات برمجة تطبيقات المعاينة المقترنة. إذا كنت تستخدم إصدارات 2021-09-30-preview أو إصدارات واجهة برمجة التطبيقات 2022-01-30 أو إصدارات واجهة برمجة التطبيقات 2022-06-30-preview، فيرجى تحديث تطبيقاتك لاستهداف إصدار واجهة برمجة التطبيقات 2022-08-31. هناك بعض التغييرات الطفيفة المعنية، لمزيد من المعلومات، راجعدليل الترحيل.

يوليو 2023

إشعار

Form Recognizer هو الآن Azure الذكاء الاصطناعي Document Intelligence!

  • المستند، تشمل خدمات Azure الذكاء الاصطناعي جميع ما كان يعرف سابقا بالخدمات المعرفية وخدمات الذكاء الاصطناعي التطبيقية من Azure.
  • لا توجد تغييرات على الأسعار.
  • يستمر استخدام الأسماء Cognitive Services وAzure Applied الذكاء الاصطناعي في فوترة Azure وتحليل التكلفة وقائمة الأسعار وواجهات برمجة التطبيقات للسعر.
  • لا توجد تغييرات فاصلة على واجهات برمجة التطبيقات (APIs) أو مكتبات العميل.
  • لا تزال بعض الأنظمة الأساسية تنتظر تحديث إعادة التسمية. تشير جميع إشارة Form Recognizer أو Document Intelligence في وثائقنا إلى نفس خدمة Azure.

Document Intelligence v3.1 (GA)

أصبحت واجهة برمجة تطبيقات Document Intelligence الإصدار 3.1 متاحة الآن بشكل عام (GA)! يتوافق إصدار واجهة برمجة التطبيقات مع 2023-07-31. تقدم واجهة برمجة تطبيقات الإصدار 3.1 قدرات جديدة ومحدثة:

  • أصبحت واجهات برمجة التطبيقات لذكاء المستند الآن أكثر نمطية ودعما للميزات الاختيارية. يمكنك الآن تخصيص الإخراج لتضمين الميزات التي تحتاج إليها على وجه التحديد. تعرف على المزيد حول المعلمات الاختيارية.
  • واجهة برمجة تطبيقات تصنيف المستندات لتقسيم ملف واحد إلى مستندات فردية. تعرف على المزيد حول تصنيف المستندات.
  • نموذج عقد تم إنشاؤه مسبقا.
  • نموذج ضريبة الولايات المتحدة 1098 الذي تم إنشاؤه مسبقا.
  • دعم أنواع ملفات Office باستخدام واجهة برمجة تطبيقات القراءة.
  • التعرف على الرمز الشريطي في المستندات.
  • إمكانية الوظيفة الإضافية للتعرف على الصيغة.
  • إمكانية الوظيفة الإضافية للتعرف على الخط.
  • دعم المستندات عالية الدقة.
  • تتطلب النماذج العصبية المخصصة الآن عينة واحدة مسماة للتدريب.
  • توسيع لغة النماذج العصبية المخصصة. تدريب نموذج عصبي للمستندات في 30 لغة. راجع دعم اللغة للحصول على القائمة الكاملة باللغات المدعومة.
  • 🆕 نموذج بطاقة التأمين الصحي التي تم إنشاؤها مسبقا.
  • توسيع الإعدادات المحلية لنموذج الفاتورة الذي تم إنشاؤه مسبقا.
  • لغة نموذج الإيصالات التي تم إنشاؤها مسبقا وتوسيع الإعدادات المحلية مع دعم أكثر من 100 لغة.
  • يدعم نموذج المعرف الذي تم إنشاؤه مسبقا الآن المعرف الأوروبي.

التحديثات UX ل Document Intelligence Studio

✔️ تحليل الخيارات

  • يدعم Document Intelligence الآن قدرات تحليل أكثر تعقيدا ويسمح Studio بنقطة إدخال واحدة (زر خيارات التحليل) لتكوين قدرات الوظيفة الإضافية بسهولة.

  • اعتمادا على سيناريو استخراج المستند، قم بتكوين نطاق التحليل ونطاق صفحة المستند والكشف الاختياري وميزات الكشف المتميزة.

    لقطة شاشة متحركة تعرض استخدام زر analyze-options لتكوين الخيارات في Studio.

    إشعار

    لم يتم تصور استخراج الخط في Document Intelligence Studio. ومع ذلك، يمكنك التحقق من قسم الأنماط في إخراج JSON لنتائج الكشف عن الخط.

✔️ تسمية المستندات تلقائيا باستخدام نماذج تم إنشاؤها مسبقا أو أحد النماذج الخاصة بك

  • في صفحة تسمية نموذج الاستخراج المخصص، يمكنك الآن تسمية مستنداتك تلقائيا باستخدام أحد النماذج أو النماذج التي تم إنشاؤها مسبقا لخدمة Document Intelligent Service التي قمت بتدريبها مسبقا.

    لقطة شاشة متحركة تعرض التسمية التلقائية في Studio.

  • بالنسبة لبعض المستندات، يمكن أن تكون هناك تسميات مكررة بعد تشغيل التسمية التلقائية. تأكد من تعديل التسميات بحيث لا توجد تسميات مكررة في صفحة التسمية بعد ذلك.

    لقطة شاشة تعرض تحذير تسمية مكررة بعد التسمية التلقائية.

✔️ جداول التسمية التلقائية

  • في صفحة تسمية نموذج الاستخراج المخصص، يمكنك الآن تسمية الجداول في المستند تلقائيا دون الحاجة إلى تسمية الجداول يدويا.

    لقطة شاشة متحركة تعرض تسمية الجدول التلقائي في Studio.

✔️ إضافة ملفات الاختبار مباشرة إلى مجموعة بيانات التدريب الخاصة بك

  • بمجرد تدريب نموذج استخراج مخصص، استخدم صفحة الاختبار لتحسين جودة النموذج الخاص بك عن طريق تحميل مستندات الاختبار إلى مجموعة بيانات التدريب إذا لزم الأمر.

  • إذا تم إرجاع درجة ثقة منخفضة لبعض التسميات، فتأكد من تسميتها بشكل صحيح. إذا لم يكن الأمر كما هو، أضفها إلى مجموعة بيانات التدريب وأعد تسميتها لتحسين جودة النموذج.

لقطة شاشة متحركة توضح كيفية إضافة ملفات الاختبار إلى مجموعة بيانات التدريب.

✔️ الاستفادة من خيارات قائمة المستندات وعوامل التصفية في المشاريع المخصصة

  • استخدم صفحة تسمية نموذج الاستخراج المخصص. يمكنك الآن التنقل عبر مستندات التدريب بسهولة من خلال الاستفادة من البحث والتصفية والفرز حسب الميزة.

  • استخدم طريقة عرض الشبكة لمعاينة المستندات أو استخدم طريقة عرض القائمة للتمرير عبر المستندات بسهولة أكبر.

    لقطة شاشة تعرض خيارات عرض قائمة المستندات وعوامل التصفية.

✔️ مشاركة المشروع

مايو 2023

تقديم الوثائق المحدثة للإصدار 2023

  • 🆕 قامت نظرة عامة على معلومات المستند بتحسين التنقل ونقاط الوصول المنظمة والصور المحسنة.

  • 🆕 اختيار نموذج تحليل معلومات المستند يوفر إرشادات لاختيار أفضل حل لذكاء المستند لمشاريعك ومهام سير العمل.

أبريل 2023

الإعلان عن أحدث إصدار معاينة عامة لمكتبة عميل معلومات المستند

مارس 2023

هام

2023-02-28-preview تتوفر القدرات حاليا فقط في المناطق التالية:

  • أوروبا الغربية
  • غرب الولايات المتحدة2
  • شرق الولايات المتحدة
  • نموذج التصنيف المخصص هو قدرة جديدة داخل Document Intelligence بدءا من 2023-02-28-preview واجهة برمجة التطبيقات. جرب إمكانية تصنيف المستند باستخدام Document Intelligence Studio أو REST API.
  • قدرات حقول الاستعلام المضافة إلى نموذج المستند العام، استخدم نماذج Azure OpenAI لاستخراج حقول معينة من المستندات. جرب ميزة المستندات العامة مع حقول الاستعلام باستخدام Document Intelligence Studio. حقول الاستعلام نشطة حاليا فقط للموارد في East US المنطقة.
  • قدرات الوظيفة الإضافية:
  • تحديثات نموذج الاستخراج المخصص:
    • يدعم النموذج العصبي المخصص الآن لغات إضافية للتدريب والتحليل. تدريب نماذج عصبية للهولندية والفرنسية والألمانية والإيطالية والإسبانية.
    • يحتوي نموذج القالب المخصص الآن على إمكانية محسنة للكشف عن التوقيع.
  • تحديثات Document Intelligence Studio :
    • بالإضافة إلى دعم جميع الميزات الجديدة مثل حقول التصنيف والاستعلام، يمكن Studio الآن مشاركة المشروع لمشاريع النموذج المخصصة.
    • إضافات نموذج جديد في المعاينة المسورة: بطاقات التطعيم والعقود والضريبة الأمريكية 1098 والضريبة الأمريكية 1098-E والضريبة الأمريكية 1098-T. لطلب الوصول إلى نماذج المعاينة المسورة، أكمل نموذج طلب المعاينة الخاصة ل Document Intelligence ثم أرسله.
  • تحديثات نموذج الإيصال:
    • يضيف نموذج الإيصال دعما للإيصالات الحرارية.
    • يضيف نموذج الإيصال الآن دعم اللغة ل 18 لغة وثلاث لغات إقليمية (الإنجليزية والفرنسية والبرتغالية).
    • يدعم TaxDetails نموذج الإيصال الآن الاستخراج.
  • يعمل نموذج التخطيط الآن على تحسين التعرف على الجدول.
  • يضيف نموذج القراءة الآن تحسينا للتعرف على الأحرف المكونة من رقم واحد.

2023 فبراير

  • حدد "Document Intelligence containers for v3.0" متوفرة الآن للاستخدام!

  • تتوفر حاليا حاويات Read v3.0 و Layout v3.0 .

    لمزيد من المعلومات، راجعتثبيت حاويات معلومات المستند وتشغيلها.


يناير 2023

  • نموذج إيصال تم إنشاؤه مسبقا - اللغات المضافة المدعومة. يدعم نموذج الإيصال الآن هذه اللغات واللغات المضافة

    • اليابانية - اليابان (ja-JP)
    • الفرنسية - كندا (fr-CA)
    • الهولندية - هولندا (nl-NL)
    • الإنجليزية - الإمارات العربية المتحدة (en-AE)
    • البرتغالية - البرازيل (pt-BR)
  • نموذج فاتورة تم إنشاؤه مسبقا - اللغات المضافة المدعومة. يدعم نموذج الفاتورة الآن هذه اللغات واللغات المضافة

    • الإنجليزية - الولايات المتحدة (en-US)، أستراليا (en-AU)، كندا (en-CA)، المملكة المتحدة (en-UK)، الهند (en-IN)
    • الأسبانية - إسبانيا (es-ES)
    • الفرنسية - فرنسا (fr-FR)
    • الإيطالية - إيطاليا (it-IT)
    • البرتغالية - البرتغال (pt-PT)
    • الهولندية - هولندا (nl-NL)
  • نموذج فاتورة تم إنشاؤه مسبقا - الحقول المضافة التي تم التعرف عليها. يتعرف نموذج الفاتورة الآن على هذه الحقول المضافة

    • ‏كود العملة
    • خيارات الدفع
    • الخصم الإجمالي
    • العناصر الضريبية (en-IN فقط)
  • نموذج معرف تم إنشاؤه مسبقا - أنواع المستندات المضافة مدعومة. يدعم نموذج المعرف الآن أنواع المستندات المضافة هذه

    • المعرف العسكري الأمريكي

تلميح

تتوفر جميع تحديثات يناير 2023 مع إصدار REST API 2022-08-31 (GA).

  • نموذج إيصال تم إنشاؤه مسبقا - دعم لغة إضافي:

    يضيف نموذج الإيصال الذي تم إنشاؤه مسبقا دعما للغات التالية:

    • الإنجليزية - الإمارات العربية المتحدة (en-AE)
    • الهولندية - هولندا (nl-NL)
    • الفرنسية - كندا (fr-CA)
    • الألمانية - (de-DE)
    • الإيطالية - (it-IT)
    • اليابانية - اليابان (ja-JP)
    • البرتغالية - البرازيل (pt-BR)
  • نموذج فاتورة تم إنشاؤه مسبقا - دعم اللغة الإضافية واستخراج الحقول

    يضيف نموذج الفاتورة الذي تم إنشاؤه مسبقا دعما للغات التالية:

    • الإنجليزية - أستراليا (en-AU)، كندا (en-CA)، المملكة المتحدة (en-UK)، الهند (en-IN)
    • البرتغالية - البرازيل (pt-BR)

    يضيف نموذج الفاتورة الذي تم إنشاؤه مسبقا الآن دعما لاستخراج الحقول التالية:

    • ‏كود العملة
    • خيارات الدفع
    • الخصم الإجمالي
    • العناصر الضريبية (en-IN فقط)
  • نموذج مستند المعرف الذي تم إنشاؤه مسبقا — دعم أنواع مستندات إضافية

    يضيف نموذج مستند المعرف الذي تم إنشاؤه مسبقا الآن دعما إلى أنواع المستندات التالية:

    • توسيع رخصة القيادة لدعم الهند وكندا والمملكة المتحدة وأستراليا
    • بطاقات هوية ومستندات عسكرية أمريكية
    • بطاقات هوية الهند ومستنداتها (PAN وAdhaar)
    • بطاقات هوية أستراليا ومستنداتها (بطاقة الصورة، معرف مفتاح المرور)
    • بطاقات هوية كندا ومستنداتها (بطاقة التعريف، بطاقة Maple)
    • بطاقات هوية المملكة المتحدة ومستنداتها (بطاقة هوية وطنية/إقليمية)

ديسمبر 2022

  • تحديثات Document Intelligence Studio

    يتضمن إصدار Document Intelligence Studio لشهر ديسمبر آخر التحديثات إلى Document Intelligence Studio. هناك تحسينات كبيرة على تجربة المستخدم، في المقام الأول مع دعم تسمية النموذج المخصص.

    • نطاق الصفحات. يدعم Studio الآن تحليل الصفحات المحددة من مستند.

    • تسمية النموذج المخصص:

      • تشغيل واجهة برمجة تطبيقات التخطيط تلقائيا. يمكنك اختيار تشغيل واجهة برمجة تطبيقات التخطيط لجميع المستندات تلقائيا في تخزين الكائن الثنائي كبير الحجم أثناء عملية إعداد النموذج المخصص.

      • بحث. يتضمن Studio الآن وظيفة البحث لتحديد موقع الكلمات داخل مستند. يسمح هذا التحسين بتنقل أسهل أثناء وضع العلامات.

      • التنقل يمكنك تحديد تسميات لاستهداف الكلمات المسماة داخل مستند.

      • تسمية الجدول التلقائي. بعد تحديد أيقونة الجدول داخل مستند، يمكنك اختيار تسمية الجدول المستخرج تلقائيا في طريقة عرض التسمية.

      • أنواع التسمية الفرعية والالأنواع الفرعية من المستوى الثاني يدعم Studio الآن الأنواع الفرعية لأعمدة الجدول وصفوف الجدول والالأنواع الفرعية من المستوى الثاني لأنواع مثل التواريخ والأرقام.

  • يتم الآن دعم بناء نماذج عصبية مخصصة في منطقة ولاية فرجينيا الأمريكية.

  • معاينة إصدارات 2022-01-30-preview2021-09-30-preview واجهة برمجة التطبيقات وسيتم إيقافها في 31 يناير 2023. 2022-08-31 قم بتحديث إصدار واجهة برمجة التطبيقات لتجنب أي انقطاع في الخدمة.


نوفمبر 2022

  • الإعلان عن أحدث إصدار مستقر من مكتبات Azure الذكاء الاصطناعي Document Intelligence
    • يتضمن هذا الإصدار تغييرات وتحديثات مهمة لمكتبات عميل .NET وJava وJavaScript وPython. لمزيد من المعلومات، راجعAzure SDK DevBlog.
    • أهم التحسينات هي إدخال عميلين جديدين، DocumentAnalysisClient و و DocumentModelAdministrationClient.

أكتوبر 2022

  • محتوى تم إصداره بواسطة تحليل معلومات المستند

    • يتم تحديث وثائق Document Intelligence لتقديم تجربة تم إصدارها. الآن، يمكنك اختيار عرض المحتوى الذي v3.0 GA يستهدف التجربة أو v2.1 GA التجربة. تجربة الإصدار 3.0 هي التجربة الافتراضية.

      لقطة شاشة للصفحة المقصودة ل Document Intelligence التي توضح القائمة المنسدلة للإصدار.

  • نموذج التعليمات البرمجية ل Document Intelligence Studio

    • يتوفر نموذج التعليمات البرمجية لتجربة تسمية Document Intelligence Studio الآن على GitHub. يمكن للعملاء تطوير ودمج Document Intelligence في تجربة المستخدم الخاصة بهم أو إنشاء تجربة مستخدم جديدة خاصة بهم باستخدام نموذج التعليمات البرمجية ل Document Intelligence Studio.
  • توسيع اللغة

    • مع أحدث إصدار معاينة، تدعم نماذج قوالب قراءة المعلومات المستندية (OCR) والتخطيط والقوالب المخصصة 134 لغة جديدة. وتشمل هذه الإضافات اللغوية اليونانية واللاتفية والصربية والتايلاندية والأوكرانية والفيتنامية، إلى جانب العديد من اللغات اللاتينية والسيريلية. يحتوي Document Intelligence الآن على إجمالي 299 لغة مدعومة عبر أحدث إصدارات التوفر العام والمعاينة الجديدة. راجع صفحة اللغات المعتمدة لمشاهدة جميع اللغات المدعومة.
    • استخدم معلمة api-version=2022-06-30-preview REST API عند استخدام واجهة برمجة التطبيقات أو SDK المطابق لدعم اللغات الجديدة في تطبيقاتك.
  • نموذج عقد جديد تم إنشاؤه مسبقا

    • جديد تم إنشاؤه مسبقا يستخرج المعلومات من عقود مثل الأطراف والملكية ومعرف العقد وتاريخ التنفيذ والمزيد. نموذج العقود قيد المعاينة حاليا، وطلب الوصول هنا.
  • توسيع المنطقة لتدريب النماذج العصبية المخصصة

    • تدريب نماذج عصبية مخصصة مدعومة الآن في المناطق المضافة.
      • شرق الولايات المتحدة
      • منطقة شرق الولايات المتحدة 2
      • US Gov – أريزونا

2022 سبتمبر

إشعار

بدءا من الإصدار 4.0.0، تم تقديم مجموعة جديدة من العملاء للاستفادة من أحدث ميزات خدمة Document Intelligence.

يتضمن إصدار SDK الإصدار 4.0.0 GA التحديثات التالية:

  • الإصدار 4.0.0 GA (2022-09-08)
  • يدعم عملاء REST API v3.0 وv2.0

حزمة (NuGet)

سجل التغيير/محفوظات الإصدار

دليل الترحيل

ReadMe

عينات

  • توسيع المنطقة لتدريب النماذج العصبية المخصصة المدعومة الآن في ست مناطق جديدة

    • شرق أستراليا
    • Central US
    • شرق آسيا
    • وسط فرنسا
    • جنوب المملكة المتحدة
    • غرب الولايات المتحدة2
    • للحصول على قائمة كاملة بالمناطق التي يُدعم فيها التدريب، راجع النماذج العصبية المخصصة.

    • إصدار Document Intelligence SDK 4.0.0 GA :

      • مكتبات عميل Document Intelligence الإصدار 4.0.0 (.NET/C# وJava وJavaScript) والإصدار 3.2.0 (Python) متوفرة بشكل عام وجاهزة للاستخدام في تطبيقات الإنتاج!.
      • لمزيد من المعلومات حول مكتبات عملاء Document Intelligence، راجع نظرة عامة على SDK.
      • قم بتحديث تطبيقاتك باستخدام دليل ترحيل لغة البرمجة.

أغسطس 2022

يتضمن إصدار معاينة Document Intelligence SDK بيتا أغسطس 2022 التحديثات التالية:

  • يتوفر Document Intelligence v3.0 بشكل عام

    • يتوفر الإصدار 3.0 من واجهة برمجة تطبيقات REST لذكاء المستند الآن بشكل عام وجاهز للاستخدام في تطبيقات الإنتاج! قم بتحديث تطبيقاتك باستخدام إصدار REST API 2022-08-31.
  • تحديثات Document Intelligence Studio

    • الخطوات التالية. ضمن كل صفحة نموذج، يحتوي Studio الآن على قسم "الخطوات التالية". يمكن للمستخدمين الرجوع بسرعة إلى نموذج التعليمات البرمجية وإرشادات استكشاف الأخطاء وإصلاحها ومعلومات التسعير.
    • النماذج المخصصة. يتضمن Studio الآن القدرة على إعادة ترتيب التسميات في مشاريع النموذج المخصص لتحسين كفاءة التسمية.
    • يمكن نسخ نماذج النسخ نماذج مخصصة عبر خدمات تحليل معلومات المستند من داخل Studio. تتيح العمليات ترقية نموذج مُدرب إلى بيئات ومناطق أخرى.
    • حذف المستندات. يدعم Studio الآن حذف المستندات من مجموعة البيانات المُسماة داخل المشاريع المخصصة.
  • تحديثات خدمة تحليل معلومات المستند

    • prebuilt-read. يتوفر الآن نموذج التعرف البصري على الحروف للقراءة أيضا في Document Intelligence مع الفقرات والكشف عن اللغة كميزتين جديدتين. تستهدف Document Intelligence Read سيناريوهات المستندات المتقدمة المتوافقة مع قدرات ذكاء المستند الأوسع في ذكاء المستند.
    • prebuilt-layout. يستخرج نموذج التخطيط الفقرات وما إذا كان النص المستخرج عبارة عن فقرة أو عنوان أو عنوان مقطع أو حاشية سفلية أو رأس صفحة أو تذييل الصفحة أو رقم الصفحة.
    • prebuilt-invoice. يتم الآن حل الحقلين TotalVAT و Line/VAT إلى الحقول الموجودة TotalTax و Line/Tax على التوالي.
    • prebuilt-idDocument. دعم استخراج البيانات لمعرّف حالة الولايات المتحدة والضمان الاجتماعي والبطاقات الخضراء. دعم معلومات تأشيرة جواز السفر.
    • prebuilt-receipt. دعم محلي موسع للغة الفرنسية (fr-FR) والإسبانية (es-ES) والبرتغالية (pt-PT) والإيطالية (it-IT) والألمانية (de-DE).
    • prebuilt-businessCard. دعم تحليل العنوان لاستخراج الحقول الفرعية لمكونات العنوان مثل العنوان والمدينة والولاية والبلد/المنطقة والرمز البريدي.
  • تحسينات جودة نظام التشغيل الذكاء الاصطناعي

    • prebuilt-read. دعم محسن للأحرف الفردية والتواريخ المكتوبة بخط اليد والمبالغ والأسماء والبيانات الرئيسية الأخرى الموجودة عادة في الإيصالات والفواتير وتحسين معالجة مستندات PDF الرقمية.
    • prebuilt-layout. دعم الكشف بشكل أفضل عن الجداول المقصوصة والجداول بلا حدود وتحسين التعرف على الخلايا الممتدة.
    • prebuilt-document. تحسين الكشف عن القيمة وخانة الاختيار.
    • custom-neural. دقة محسّنة للكشف عن الجدول واستخراجه.

يونيو 2022

  • يتضمن إصدار معاينة Document Intelligence SDK بيتا يونيو 2022 التحديثات التالية:

2022 فبراير

  • يقدم إصدار معاينة Document Intelligence v3.0 العديد من الميزات والقدرات والتحسينات الجديدة:

    • النموذج العصبي المخصص أو نموذج المستند المخصص هو نموذج مخصص جديد لاستخراج النصوص وعلامات التحديد من النماذج المنظمة والمستندات شبه المنظمة وغير المنظمة.
    • نموذج W-2 المُعد مسبقًا هو نموذج جديد مُعد مسبقًا لاستخراج الحقول من نماذج W-2 لإعداد التقارير الضريبية وسيناريوهات التحقق من الدخل.
    • Read API تستخرج خطوط النص المطبوعة والكلمات ومواقع النص واللغات المُكتشفة والنص المكتوب بخط اليد، إذا اُكتشفت.
    • يتم الآن تحديث نموذج المستند العام المدرب مسبقا لدعم علامات التحديد بالإضافة إلى نص واجهة برمجة التطبيقات والجداول والبنية وأزواج قيم المفاتيح من النماذج والمستندات.
    • واجهة برمجة تطبيقات الفاتورة يوسع نموذج الفاتورة الذي تم إنشاؤه مسبقًا الدعم إلى الفواتير الإسبانية.
    • يضيف Document Intelligence Studio عروضا توضيحية جديدة للقراءة وW2 وعينات إيصالات الفندق ودعم تدريب النماذج العصبية المخصصة الجديدة.
    • يضيف التحليل الذكي لمستندات توسيع اللغة للقراءة والتخطيط والنموذج المخصص دعما ل 42 لغة جديدة بما في ذلك اللغة العربية والهندية ولغات أخرى باستخدام البرامج النصية العربية وDevanagari لتوسيع التغطية إلى 164 لغة. يتوسع دعم اللغة المكتوبة بخط اليد إلى اليابانية والكورية.
  • ابدأ باستخدام واجهة برمجة تطبيقات REST أو Python أو .NET SDK الجديدة لواجهة برمجة تطبيقات الإصدار الأولي v3.0.

  • استخراج بيانات نموذج ذكاء المستند:

    النموذج استخراج النص أزواج قيم المفاتيح علامات التحديد الجداول التوقيعات
    قراءة
    المستند العام
    Layout
    الفاتورة
    الإيصال
    مستند معرف
    بطاقة العمل
    القالب المخصص
    عصبي مخصص.
  • يتضمن إصدار المعاينة التجريبية ل Document Intelligence SDK التحديثات التالية:


نوفمبر 2021

  • يتضمن تحديث إصدار معاينة SDK ل Document Intelligence v3.0 (beta.2) إصلاحات الأخطاء وتحديثات الميزات الثانوية.

أكتوبر 2021

  • يقدم إصدار معاينة Document Intelligence الإصدار 4.0.0-beta.1 (2021-10-07) العديد من الميزات والقدرات الجديدة:

    • نموذج المستند العام هو واجهة برمجة تطبيقات جديدة تستخدم نموذجا مدربا مسبقا لاستخراج النص والجداول والبنية وأزواج قيم المفاتيح من النماذج والمستندات.

    • تمت إضافة نموذج إيصال الفندق إلى معالجة الإيصالات التي تم إنشاؤها مسبقًا.

    • يدعم نموذج معرّف الحقول الموسعة لمستند المعرف المصادقات والقيود واستخراج تصنيف المركبات من تراخيص القيادة الأمريكية.

    • حقل التوقيع هو نوع حقل جديد في نماذج مخصصة للكشف عن وجود توقيع في حقل نموذج.

    • دعم توسيع اللغة لـ 122 لغة (طباعة) و7 لغات (مكتوبة بخط اليد). يقوم تخطيط ذكاء المستند والنموذج المخصص بتوسيع اللغات المدعومة إلى 122 مع أحدث معاينة لها. تتضمن المعاينة استخراج نص للنص المطبوع بـ 49 لغة جديدة بما في ذلك الروسية والبلغارية واللغات السيريلية الأخرى والمزيد من اللغات اللاتينية. بالإضافة إلى ذلك، يدعم استخراج النص المكتوب بخط اليد الآن سبع لغات تتضمن الإنجليزية، ومعاينات جديدة للصينية المبسطة والفرنسية والألمانية والإيطالية والبرتغالية والإسبانية.

    • تحسينات استخراج النص والجداول يدعم التخطيط الآن استخراج جداول صف واحد تسمى أيضًا جداول قيمة المفتاح. تتضمن تحسينات استخراج النص معالجة أفضل لملفات PDF الرقمية ونص المنطقة القابلة للقراءة الآلية (MRZ) في مستندات الهوية، جنبًا إلى جنب مع الأداء العام.

    • Document Intelligence Studio لتبسيط استخدام الخدمة، يمكنك الآن الوصول إلى Document Intelligence Studio لاختبار النماذج المختلفة التي تم إنشاؤها مسبقا أو تسمية نموذج مخصص وتدريبه.

    • ابدأ باستخدام واجهة برمجة تطبيقات REST أو Python أو .NET SDK الجديدة لواجهة برمجة تطبيقات الإصدار الأولي v3.0.

  • استخراج بيانات نموذج ذكاء المستند

    النموذج استخراج النص أزواج قيم المفاتيح علامات التحديد الجداول
    المستند العام
    Layout
    الفاتورة
    الإيصال
    مستند معرف
    بطاقة العمل
    مخصص

سبتمبر 2021

  • تتوفر الميزات المتقدمة لمستكشف مقاييس Azure في صفحة نظرة عامة على مورد Document Intelligence في مدخل Microsoft Azure.

  • قائمة المراقبة:

    لقطة شاشة تعرض قائمة المراقبة في مدخل Microsoft Azure.

  • المخططات:

    لقطة شاشة تعرض مخطط قياس مثال في مدخل Azure.

  • تحديث نموذج مستند المعرف: أسماء معينة تتضمن لاحقة، مع أو بدون نقطة، معالجة بنجاح:

    نص الإدخال النتيجة مع التحديث
    ويليام إسحاق كيربي جونيور FirstName: وليام إسحاق

    LastName: كيربي جونيور.
    هنري كاليب روس سينيور FirstName: هنري كاليب

    LastName: روس الأب.

يوليو 2021

  • دعم الهوية المدارة المعينة من قبل النظام: يمكنك الآن تمكين هوية مدارة معينة من قبل النظام لمنح Document Intelligence وصولا محدودا إلى حسابات التخزين الخاصة بما في ذلك الحسابات المحمية بواسطة شبكة ظاهرية أو جدار حماية أو تمكين إحضار التخزين الخاص بك (BYOS). راجعإنشاء هوية مدارة واستخدامها لمورد Document Intelligence لمعرفة المزيد.

يونيو 2021

  • تم إصدار حاويات معلومات المستند الإصدار 2.1 في المعاينة المسورة وهي الآن مدعومة بست حاويات ميزات - التخطيط وبطاقة العمل ومستند المعرف والإيصال والفاتورة والمخصصة. لاستخدامها، يجب عليك تقديم طلب عبر الإنترنت، والحصول على الموافقة.

  • تم إصدار موصل Document Intelligence في المعاينة: يتكامل موصل Document Intelligence مع Azure Logic Apps وMicrosoft Power Automate وMicrosoft Power Apps. يدعم الموصل إجراءات سير العمل ومشغلات لاستخراج وتحليل بيانات المستند وبنيته من النماذج والفواتير والإيصالات وبطاقات العمل ومستندات المعرف المخصصة والمبنية مسبقا.

  • تم تصحيح Document Intelligence SDK v3.1.0 إلى v3.1.1 ل C# وJava وPython. يعالج التصحيح الفواتير التي لا تحتوي على حقول عناصر خط فرعي تم اكتشافها مثل FormField مع Text ولكن ليس هناك معلومات BoundingBox أو Page.


مايو 2021

  • يتوفر Document Intelligence 2.1 بشكل عام. يمثل إصدار GA استقرار التغييرات التي تم إدخالها في إصدارات حزمة المعاينة السابقة 2.1. يمكنك هذا الإصدار من الكشف عن المعلومات والبيانات واستخراجها من أنواع المستندات التالية:

  • للبدء، جرب أداة نموذج ذكاء المستند واتبع التشغيل السريع.

  • تضيف ميزة جدول واجهة برمجة تطبيقات التخطيط المحدثة التعرف على العنوان باستخدام عناوين الأعمدة التي يمكن أن تمتد عبر صفوف متعددة. تحتوي كل خلية جدول على سمة تشير إلى ما إذا كانت جزءًا من عنوان أم لا. يمكن استخدام هذا التحديث لتحديد الصفوف التي تشكل عنوان الجدول.


2021 أبريل

  • إصدار حزمة NuGet 3.1.0-beta.4

  • سجل التغيير/محفوظات الإصدار.

  • أساليب جديدة لتحليل البيانات من مستندات الهوية:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    للحصول على قائمة بقيم الحقول، راجعالحقول المستخرجة في وثائق Document Intelligence.

  • تم توسيع مجموعة لغات المستندات التي يمكن توفيرها إلى الأسلوب StartRecognizeContent.

  • خاصية جديدةPages مدعومة من الفئات التالية:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions
    RecognizeInvoicesOptions
    RecognizeReceiptsOptions

    تسمح لك الخاصية Pages بتحديد صفحات فردية أو نطاق من الصفحات لمستندات PDF وTIFF متعددة الصفحات. بالنسبة للصفحات الفردية، أدخل رقم الصفحة، على سبيل المثال، 3. بالنسبة لنطاق من الصفحات (مثل الصفحة 2 والصفحات من 5 إلى 7) أدخل أرقام ونطاقات الصفحة مفصولة بفواصل: 2, 5-7.

  • خاصية جديدةReadingOrder مدعومة من الفئة التالية:

    RecognizeContentOptions

    الخاصية ReadingOrder هي معلمة اختيارية تسمح لك بتحديد خوارزمية ترتيب القراءة—basic أو natural—التي يجب تطبيقها لطلب استخراج عناصر النص. إذا لم يتم التحديد، فإن القيمة الافتراضية هي basic.

  • تقدم تحديثات معاينة SDK لإصدار 2.1-preview.3 واجهة برمجة التطبيقات تحديثات وتحسينات للميزات.

مارس 2021

تم إصدار معاينة عامة ل Document Intelligence v2.1 v2.1-preview.3 ويتضمن الميزات التالية:

  • نموذج معرف جديد تم إنشاؤه مسبقًا يمكن نموذج المعرف الجديد الذي تم إنشاؤه مسبقًا العملاء من أخذ المعرفات وإرجاع البيانات المنظمة للتشغيل التلقائي للمعالجة. هو يجمع بين إمكاناتنا القوية في التعرف البصري على الحروف (OCR) مع نماذج فهم المعرف لاستخراج المعلومات الرئيسية من جوازات السفر وتراخيص القيادة الأمريكية.

    تعرف على المزيد حول نموذج المعرف الذي تم إنشاؤه مسبقًا

    لقطة شاشة لنموذج جواز سفر.

  • استخراج عنصر السطر لنموذج الفاتورة - يدعم نموذج الفاتورة مسبق الإنشاء الآن استخراج عنصر السطر؛ فهو الآن يستخرج العناصر الكاملة وأجزائها - الوصف والمبلغ والكمية ومعرف المنتج والتاريخ والمزيد. باستخدام استدعاء API/SDK بسيط، يمكنك استخراج بيانات مفيدة من فواتيرك - النص والجدول وأزواج قيم المفاتيح وعناصر السطر.

    تعرف على المزيد حول نموذج الفاتورة.

  • تسمية الجدول الخاضع للإشراف والتدريب عليه، وتسمية القيمة الفارغة - بالإضافة إلى قدرات استخراج الجدول التلقائي للتعلم العميق المتطورة في Document Intelligence، فإنه يتيح الآن للعملاء تسمية الجداول والتدريب عليها. يتضمن هذا الإصدار الجديد إمكانية تسمية العناصر/الجداول الخطية والتدريب عليها (ديناميكية وثابتة) وتدريب نموذج مخصص لاستخراج أزواج قيم المفاتيح وعناصر الخط. بمجرد تدريب النموذج، يستخرج النموذج عناصر الخط كجزء من إخراج JSON في قسم documentResults.

    لقطة شاشة لميزة تسمية الجدول.

    بالإضافة إلى تسمية الجداول، يمكنك الآن تسمية القيم والمناطق الفارغة. إذا لم تكن بعض المستندات في مجموعة التدريب الخاصة بك تحتوي على قيم لحقول معينة، يمكنك تسميتها بحيث يعرف النموذج الخاص بك استخراج القيم بشكل صحيح من المستندات التي تم تحليلها.

  • دعم 66 لغة جديدة - تدعم واجهة برمجة تطبيقات التخطيط والنماذج المخصصة ل Document Intelligence الآن 73 لغة.

    تعرف على المزيد حول دعم لغة Document Intelligence.

  • ترتيب القراءة الطبيعية وتصنيف الكتابة اليدوية وتحديد الصفحة - باستخدام هذا التحديث، يمكنك اختيار الحصول على مخرجات سطر النص بترتيب القراءة الطبيعي بدلاً من الترتيب الافتراضي من اليسار إلى اليمين ومن أعلى إلى أسفل. استخدم معلمة استعلام readingOrder الجديدة وقم بتعيينها إلى قيمة "طبيعية" لإخراج ترتيب قراءة أكثر ملاءمة للإنسان. بالإضافة إلى ذلك، بالنسبة للغات اللاتينية، يصنف Document Intelligence الخطوط النصية كنمط مكتوب بخط اليد أم لا ويعطي درجة ثقة.

  • تحسينات جودة نموذج الإيصالات الذي تم إنشاؤه مسبقًا يتضمن هذا التحديث العديد من تحسينات الجودة لنموذج الإيصال الذي تم إنشاؤه مسبقًا، خاصة حول استخراج عنصر السطر.


نوفمبر 2020

  • تم إصدار Document Intelligence v2.1-preview.2 ويتضمن الميزات التالية:

    • نموذج فاتورة جديد تم إنشاؤه مسبقًا - يمكن نموذج الفاتورة الجديد الذي تم إنشاؤه مسبقًا العملاء من أخذ الفواتير بتنسيقات مختلفة وإرجاع البيانات المنظمة لتشغيل معالجة الفاتورة التلقائي. هو يجمع بين إمكاناتنا القوية في التعرف البصري على الحروف (OCR) مع نماذج التعلم العميق لفهم الفواتير لاستخراج المعلومات الرئيسية من الفواتير باللغة الإنجليزية. يستخرج النص الرئيسي والجداول والمعلومات مثل العميل والمورد ومعرف الفاتورة وتاريخ استحقاق الفاتورة والإجمالي والمبلغ المستحق والمبلغ الضريبي ومكان الشحن إلى ومكان استلام الفاتورة.

      تعرف على المزيد حول نموذج الفاتورة الذي تم إنشاؤه مسبقًا

      لقطة شاشة من عينة فاتورة.

    • استخراج الجدول المحسن - يوفر Document Intelligence الآن استخراجا محسنا للجداول، والذي يجمع بين قدرات التعرف البصري على الحروف (OCR) القوية مع نموذج استخراج جدول التعلم العميق. يمكن ل Document Intelligence استخراج البيانات من الجداول، بما في ذلك الجداول المعقدة ذات الأعمدة المدمجة والصفوف وعدم وجود حدود والمزيد.

      لقطة شاشة لتحليل الجداول.

      تعرف على المزيد حول استخراج التخطيط.

    • تحديث مكتبة العميل - تدعم أحدث إصدارات مكتبات العميل ل .NET وPython وJava وJavaScript واجهة برمجة تطبيقات Document Intelligence 2.1.

    • لغة جديدة مدعومة: اليابانية - اللغات الجديدة التالية مدعومة الآن: لـ AnalyzeLayout وAnalyzeCustomForm: اليابانية (ja). دعم اللغة.

    • إشارة نمط سطر النص (مكتوب بخط اليد/غيره) (اللغات اللاتينية فقط) - يقوم تحليل معلومات المستند الآن بإخراج عنصر appearance يصنف ما إذا كان كل سطر نص نمطا مكتوبا بخط اليد أم لا، إلى جانب درجة الثقة. هذه الميزة مدعومة فقط للغات اللاتينية.

    • تحسينات الجودة - تحسينات الاستخراج بما في ذلك تحسينات استخراج رقم واحد.

    • ميزة تجربة جديدة في نموذج ذكاء المستند وأداة التسمية - القدرة على تجربة نماذج الفاتورة والإيصال وبطاقة العمل التي تم إنشاؤها مسبقا وواجهة برمجة تطبيقات التخطيط باستخدام أداة تسمية نموذج ذكاء المستند. تعرف على كيفية استخراج بياناتك دون كتابة أي تعليمة برمجية.

    • جرب أداة تسمية نموذج تحليل معلومات المستند

      لقطة شاشة للصفحة الرئيسية لأداة تسمية العينة.

      • التكرار الحلقي للملاحظات - عند تحليل الملفات عبر أداة تسمية النموذج، يمكنك الآن أيضًا إضافتها إلى مجموعة التدريب وضبط التسميات إذا لزم الأمر والتدريب لتحسين النموذج.
      • مستندات التسمية التلقائية - تسميات المستندات المضافة تلقائيًا استنادًا إلى المستندات المسماة السابقة في المشروع.

أغسطس 2020

  • **يتضمن Document Intelligence v2.1-preview.1 الميزات التالية:

    • يتوفر مرجع واجهة برمجة تطبيقات REST - عرض v2.1-preview.1 reference.
    • اللغات الجديدة المدعومة بالإضافة إلى اللغة الإنجليزية، يتم الآن دعم اللغات التالية: لـ Layout وTrain Custom Model: الإنجليزية (en) والصينية (المبسطة) (zh-Hans) والهولندية (nl) والفرنسية (fr) والألمانية (de) والإيطالية (it) والبرتغالية (pt) والإسبانية (es).
    • خانة الاختيار / الكشف عن علامة التحديد – يدعم تحليل معلومات المستند الكشف عن علامات التحديد واستخراجها مثل خانات الاختيار والأزرار التبادلية. يتم استخراج علامات التحديد في Layout ويمكنك الآن أيضًا التسمية والتدريب في Train Custom Model - التدريب باستخدام التسميات لاستخراج أزواج قيم المفاتيح لعلامات التحديد.
    • إنشاء النموذج - يسمح بإنشاء نماذج متعددة واستدعائها بمعرف نموذج واحد. عند إرسال مستند لتحليله باستخدام معرف نموذج مكون، يتم أولاً تنفيذ خطوة تصنيف لتوجيهه إلى النموذج المخصص الصحيح. يتوفر إنشاء نموذج لـ Train Custom Model - التدريب باستخدام التسميات.
    • اسم النموذج - أضف اسمًا مألوفًا إلى نماذجك المخصصة لتسهيل الإدارة والتعقب.
    • نموذج جديد تم إنشاؤه مسبقا لبطاقات العمل لاستخراج الحقول الشائعة باللغة الإنجليزية وبطاقات العمل باللغة.
    • الإعدادات المحلية الجديدة للإيصالات التي تم إنشاؤها مسبقا بالإضافة إلى EN-US، يتوفر الدعم الآن ل EN-AU و EN-CA و EN-GB و EN-IN.
    • تحسينات الجودة لـ Layout، Train Custom Model - والتدريب بدون تسمياتوالتدريب باستخدام التسميات.
  • v2.0 يتضمن التحديث التالي:

    نماذج جديدة تتوفر على GitHub.

    • تجمع وصفات استخراج المعرفة - Forms Playbook أفضل الممارسات من تفاعلات عملاء Document Intelligence الحقيقية وتوفر نماذج تعليمات برمجية قابلة للاستخدام وقوائم اختيار ونماذج البنية الأساسية لبرنامج ربط العمليات التجارية المستخدمة في تطوير هذه المشاريع.
    • يتم تحديث أداة تسمية العينة لدعم وظيفة الإصدار 2.1 الجديدة. راجع هذا التشغيل السريع لبدء استخدام الأداة.
    • يوضح نموذج Intelligent Kiosk Document Intelligence كيفية التكامل Analyze Receipt والتدريبTrain Custom Model - بدون تسميات.

2020 يوليو

  • مرجع Document Intelligence v2.0 متوفر - عرض مرجع v2.0 API ومكتبات العميل المحدثة ل .NET وPython وJava وJavaScript.
    • تحسينات الجدول وتحسينات الاستخراج - بما في ذلك تحسينات الدقة وتحسينات استخراج الجدول، على وجه التحديد، إمكانية تعلم عناوين وبنى الجداول في التدريب المخصص دون تسميات.

    • دعم العملة - الكشف عن رموز العملة العالمية واستخراجها.

    • Azure Gov - معلومات المستند متاحة الآن أيضا في Azure Gov.

    • ميزات أمان محسنة:

      • إحضار المفتاح الخاص بك - تشفر ذكاء المستند بياناتك تلقائيا عند استمرارها في السحابة لحمايتها ولمساعدتك على الوفاء بالتزامات الأمان والتوافق التنظيمية. افتراضياً، يستخدم اشتراكك مفاتيح التشفير التي تديرها Microsoft. يمكنك الآن أيضًا إدارة اشتراكك باستخدام مفاتيح التشفير الخاصة بك. المفاتيح التي يديرها العميل، والمعروفة أيضًا باسم إحضار المفتاح الخاص بك (BYOK)، توفر قدرًا أكبر من المرونة لإنشاء عناصر التحكم في الوصول وتدويرها وتعطيلها وإبطالها. يمكنك أيضاً تدقيق مفاتيح التشفير المستخدمة لحماية بياناتك.
      • نقاط النهاية الخاصة – تمكنك على شبكة ظاهرية من الوصول بأمان إلى البيانات عبر Private Link.

يونيو 2020


2020 أبريل

  • دعم SDK لواجهة برمجة تطبيقات ذكاء المستندات الإصدار 2.0 من المعاينة العامة - قمنا هذا الشهر بتوسيع دعم الخدمة لتضمين معاينة SDK لإصدار Document Intelligence v2.0. استخدم هذه الارتباطات لبدء استخدام اللغة التي تختارها:
  • .NET SDK
  • Java SDK
  • Python SDK
  • JavaScript SDK

تدعم SDK الجديدة جميع ميزات واجهة برمجة تطبيقات REST v2.0 ل Document Intelligence. يمكنك مشاركة ملاحظاتك على مكتبات العميل من خلال نموذج ملاحظات SDK.

  • نسخ نموذج مخصص يمكنك الآن نسخ النماذج بين المناطق والاشتراكات باستخدام ميزة "نسخ نموذج مخصص" الجديدة. قبل استدعاء واجهة برمجة تطبيقات نسخ نموذج مخصص، يجب أولاً الحصول على تخويل للنسخ إلى المورد الهدف. يتم تأمين هذا التخويل عن طريق استدعاء عملية نسخ التخويل مقابل نقطة نهاية المورد الهدف.

  • إنشاء واجهة برمجة تطبيقات REST لمصادقة النسخ.

  • انسخ نموذج مخصص لواجهة برمجة تطبيقات REST.

  • تحسينات الأمان.

  • تتوفر الآن المفاتيح التي يديرها العميل لـ FormRecognizer. لمزيد من المعلومات، راجع تشفير البيانات الثابتة ل Document Intelligence.

  • استخدم الهويات المُدارة للوصول إلى موارد Azure باستخدام Azure Active Directory. لمزيد من المعلومات، راجع تخويل الوصول إلى الهويات المُدارة.


مارس 2020

  • أنواع القيم للتسمية يمكنك الآن تحديد أنواع القيم التي تقوم بتسميةها باستخدام أداة تسمية نموذج تحليل معلومات المستند. إن أنواع القيم والاختلافات التالية مدعومة حاليًا:
  • string
    • افتراضي، no-whitespaces وalphanumeric
  • number
    • الافتراضي، currency
  • date
    • الافتراضي، dmy، mdy، ymd
  • time
  • integer

راجع دليل أداة تسمية النموذج لمعرفة كيفية استخدام هذه الميزة.

  • عرض مصور للجدول تعرض أداة تسمية النموذج الآن الجداول التي تم التعرف عليها في المستند. تتيح لك هذه الميزة عرض الجداول التي تم التعرف عليها واستخراجها من المستند قبل وضع العلامات والتحليل. يمكن تشغيل/إيقاف تشغيل هذه الميزة باستخدام خيار الطبقات.

  • الصورة التالية هي مثال على كيفية التعرف على الجداول واستخراجها:

    لقطة شاشة لتصور الجدول باستخدام أداة تسمية العينة.

  • تتوفر الجداول المستخرجة في إخراج JSON ضمن "pageResults".

    هام

    جداول التسمية غير مدعومة. إذا لم يتم التعرف على الجداول واستخراجها تلقائيا، يمكنك فقط تسميتها كأزواج مفاتيح/قيمة. عند تسمية الجداول كأزواج قيم المفاتيح، قم بتسمية كل خلية كقيمة فريدة.

  • تحسينات الاستخراج.

  • يتضمن هذا الإصدار تحسينات الاستخراج وتحسينات الدقة، على وجه التحديد، إمكانية تسمية واستخراج أزواج قيم المفاتيح المتعددة في نفس سطر النص.

  • أصبحت أداة تسمية العينة مفتوحة المصدر الآن.

  • تتوفر الآن أداة تسمية نموذج تحليل معلومات المستند كمشروع مفتوح المصدر. يمكنك دمجه ضمن حلولك وإجراء تغييرات خاصة بالعميل لتلبية احتياجاتك.

  • لمزيد من المعلومات حول أداة تسمية نموذج معلومات المستند، راجع الوثائق المتوفرة على GitHub.

  • TLS 1.2 إنفاذ.

  • TLS يتم الآن فرض 1.2 لجميع طلبات HTTP لهذه الخدمة. لمزيد من المعلومات، راجع أمان خدمات Azure الذكاء الاصطناعي.


2020 يناير

يقدم هذا الإصدار Document Intelligence 2.0. في الأقسام التالية، ستجد المزيد من المعلومات حول الميزات والتحسينات والتغييرات الجديدة.

  • الميزات الجديدة

    • نموذج مخصص

      • التدريب باستخدام التسميات يمكنك الآن تدريب نموذج مخصص مع بيانات مسماة يدويًا. ينتج عن هذا الأسلوب نماذج ذات أداء أفضل ويمكن أن ينتج نماذج تعمل مع نماذج معقدة أو نماذج تحتوي على قيم بدون مفاتيح.
      • واجهة برمجة تطبيقات غير متزامنة يمكنك استخدام استدعاءات واجهة برمجة التطبيقات غير المتزامنة للتدريب باستخدام مجموعات البيانات الكبيرة والملفات وتحليلها.
      • دعم ملف TIFF يمكنك الآن التدريب باستخدام البيانات واستخراجها من مستندات TIFF.
      • تحسينات دقة الاستخراج.
    • نموذج إيصال مسبق الإنشاء

      • مقدار التلميح يمكنك الآن استخراج مقدار التلميح والقيم الأخرى المكتوبة بخط اليد.
      • استخراج عنصر السطر يمكنك استخراج قيم عنصر السطر من الإيصالات.
      • قيم الثقة يمكنك عرض ثقة النموذج لكل قيمة مستخرجة.
      • تحسينات دقة الاستخراج.
      • استخراج التخطيط يمكنك الآن استخدام واجهة برمجة تطبيقات التخطيط لاستخراج بيانات النص وبيانات الجدول من النماذج.
  • تغييرات واجهة برمجة تطبيقات النموذج المخصص

    تتم إعادة تسمية جميع واجهات برمجة التطبيقات للتدريب واستخدام النماذج المخصصة، وأصبحت بعض الأساليب المتزامنة الآن غير متزامنة. فيما يلي التغييرات الرئيسية:

    • عملية تدريب نموذج غير متزامنة الآن. يمكنك بدء التدريب من خلال استدعاء واجهة برمجة التطبيقات /custom/models. يقوم هذا الاستدعاء بإرجاع معرف العملية، والذي يمكنك تمريره إلى custom/models/{modelID} لإرجاع نتائج التدريب.
    • يتم الآن بدء استخراج المفتاح/القيمة بواسطة استدعاء واجهة برمجة تطبيقات /custom/models/{modelID}/analyze. يقوم هذا الاستدعاء بإرجاع معرف عملية، والذي يمكنك تمريره إلى custom/models/{modelID}/analyzeResults/{resultID} لإرجاع نتائج الاستخراج.
    • يتم الآن العثور على معرفات العملية لعملية التدريب في عنوان الموقع لاستجابات HTTP، وليس عنوان موقع العملية.
  • تغييرات واجهة برمجة تطبيقات الإيصال

    • تتم إعادة تسمية واجهات برمجة التطبيقات لقراءة إيصالات المبيعات.

    • يتم الآن بدء استخراج بيانات الإيصال بواسطة استدعاء واجهة برمجة التطبيقات /prebuilt/receipt/analyze. يقوم هذا الاستدعاء بإرجاع معرف عملية، والذي يمكنك تمريره إلى /prebuilt/receipt/analyzeResults/{resultID} لإرجاع نتائج الاستخراج.

  • تغييرات تنسيق الإخراج

    • استجابات JSON لكافة استدعاءات واجهة برمجة التطبيقات لها تنسيقات جديدة. تتم إضافة بعض المفاتيح والقيم أو إزالتها أو إعادة تسميتها. راجع عمليات التشغيل السريع للحصول على أمثلة لتنسيقات JSON الحالية.

الخطوات التالية

  • حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio.

  • أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.

  • حاول معالجة النماذج والمستندات الخاصة بك باستخدام أداة تسمية نموذج تحليل معلومات المستند.

  • أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.