ما الجديد في Azure الذكاء الاصطناعي Document Intelligence
ينطبق هذا المحتوى على:v4.0 (معاينة)v3.1 (GA)v3.0 (GA)v2.1 (GA)
يتم تحديث خدمة Document Intelligence على أساس مستمر. ضع إشارة مرجعية على هذه الصفحة للبقاء على اطلاع بملاحظات الإصدار وتحسينات الميزات وأحدث وثائقنا.
هام
يتم إيقاف إصدارات واجهة برمجة تطبيقات المعاينة بمجرد إصدار واجهة برمجة تطبيقات GA. يتم إيقاف إصدار واجهة برمجة التطبيقات 2023-02-28-preview، إذا كنت لا تزال تستخدم واجهة برمجة تطبيقات المعاينة أو إصدارات SDK المقترنة، فيرجى تحديث التعليمات البرمجية لاستهداف أحدث إصدار من واجهة برمجة التطبيقات 2023-07-31 (GA).
مايو 2024
أضاف Document Intelligence Studio دعما لمصادقة Microsoft Entra (المعروف سابقا ب Azure Active Directory). لمزيد من المعلومات، راجعنظرة عامة على Document Intelligence Studio.
فبراير 2024
تتوفر الآن واجهة برمجة تطبيقات REST ل Document Intelligence 2024-02-29-preview. تقدم واجهة برمجة تطبيقات المعاينة هذه قدرات جديدة ومحدثة:
يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
- شرق الولايات المتحدة
- غرب الولايات المتحدة 2
- غرب أوروبا
يدعم نموذج التخطيط الآن الكشف عنالأرقام وتحليل بنية المستند الهرمي (المقاطع والأقسام الفرعية). كما تم تحسين جودة الذكاء الاصطناعي لترتيب القراءة واكتشاف الأدوار المنطقية.
-
- تدعم نماذج الاستخراج المخصصة الآن درجات الثقة على مستوى الخلية والصف والجدول. تعرف على المزيد حول الجدول والصف وثقة الخلية.
- تحتوي نماذج الاستخراج المخصصة على تحسينات جودة الذكاء الاصطناعي لاستخراج الحقل.
- يدعم نموذج استخراج القالب المخصص الآن استخراج الحقول المتداخلة. تعرف على المزيد حول الحقول المتداخلة وكيفية استخدامها.
-
- دعم لغة جديدة:
اللغة المحلية الرمز العربية ( ar
)البلغارية ( bg
)اليونانية ( el
)العبرية ( he
)المقدونية ( mk
)الروسية ( ru
)السيريلية الصربية ( sr-cyrl
)الأوكرانية ( uk
)التايلاندية ( th
)التركية ( tr
)الفيتنامية ( vi
)- دعم رموز العملة الجديدة:
العملة اللغة المحلية رمز BAM علامة بوسنية قابلة للتحويل ( ba
)Bgn ليف بلغاري ( bg
)Ils شيكل جديد إسرائيلي ( il
)Mkd دينار المقدونية ( mk
)RUB روبل روسي ( ru
)Thb باهت التايلاندية ( th
)TRY الليرة التركية ( tr
)Uah الهريفنيا الأوكرانية ( ua
)Vnd الفيتنامية دونغ ( vn
)- البنود الضريبية دعم التوسع لألمانيا (
de
), إسبانيا (es
),البرتغال (pt
), الإنجليزية كنداen-CA
.
-
- دعم ميداني موسع لمعرفات الاتحاد الأوروبي ورخصة القيادة.
-
- استخراج المعلومات من طلب قرض سكني موحد (نموذج 1003).
- استخراج المعلومات من الملخص الموحد للكتابة والإرسال أو النموذج 1008.
- استخراج المعلومات من الكشف عن إغلاق الرهن العقاري.
-
- استخراج المعلومات من البطاقات المصرفية.
-
- تم بناء جديد مسبقا لاستخراج المعلومات من شهادات الزواج.
ديسمبر 2023
مكتبات عميل Document Intelligence التي تستهدف REST API 2023-10-31-preview متاحة الآن للاستخدام!
نوفمبر 2023
تتوفر الآن واجهة برمجة تطبيقات REST ل Document Intelligence 2023-10-31-preview. تقدم واجهة برمجة تطبيقات المعاينة هذه قدرات جديدة ومحدثة:
يتوفر إصدار المعاينة العامة 2023-10-31-preview حاليا فقط في مناطق Azure التالية:
- شرق الولايات المتحدة
- غرب الولايات المتحدة 2
- غرب أوروبا
-
- توسيع اللغة للكتابة اليدوية: الروسية(
ru
)، العربية(ar
)، التايلاندية(th
). - الامتثال للأمر التنفيذي عبر الإنترنت (EO).
- توسيع اللغة للكتابة اليدوية: الروسية(
-
- دعم ملفات OFFICE وHTML.
- دعم إخراج Markdown.
- تحسينات استخراج الجدول وترتيب القراءة والكشف عن عناوين المقاطع.
- باستخدام Document Intelligence 2023-10-31-preview، يتم إهمال نموذج المستند العام (المستند الذي تم إنشاؤه مسبقا). من الآن فصاعدا، لاستخراج أزواج قيمة المفتاح من المستندات، استخدم
prebuilt-layout
النموذج مع تمكين معلمةfeatures=keyValuePairs
سلسلة الاستعلام الاختيارية.
-
- الآن يستخرج العملة لجميع الحقول المتعلقة بالسعر.
-
- دعم ميداني جديد لمعلومات Medicare وMedicaid.
نماذج المستندات الضريبية في الولايات المتحدة
- نموذج ضريبة 1099 جديد. يدعم نموذج 1099 الأساسي والتباينات التالية: A، B، C، CAP، DIV، G، H، INT، K، LS، LTC، MISC، NEC، OID، PATR، Q، QA، R، S، SA، SB.
-
KVK
دعم الحقل.BPAY
دعم الحقل.- العديد من تحسينات الحقول.
-
- دعم المستندات متعددة اللغات.
- خيارات تقسيم الصفحة الجديدة: التقسيم التلقائي، والتقسيم دائما حسب الصفحة، وعدم التقسيم.
-
- تتوفر حقول الاستعلام مع
2023-10-31-preview
الإصدار. - تتوفر قدرات الوظيفة الإضافية داخل جميع النماذج باستثناء نموذج القراءة.
- تتوفر حقول الاستعلام مع
إشعار
مع إصدار التوفر العام لواجهة برمجة التطبيقات 2022-08-31، يتم إهمال واجهات برمجة تطبيقات المعاينة المقترنة. إذا كنت تستخدم إصدارات 2021-09-30-preview أو إصدارات واجهة برمجة التطبيقات 2022-01-30 أو إصدارات واجهة برمجة التطبيقات 2022-06-30-preview، فيرجى تحديث تطبيقاتك لاستهداف إصدار واجهة برمجة التطبيقات 2022-08-31. هناك بعض التغييرات الطفيفة المعنية، لمزيد من المعلومات، راجعدليل الترحيل.
يوليو 2023
إشعار
Form Recognizer هو الآن Azure الذكاء الاصطناعي Document Intelligence!
- المستند، تشمل خدمات Azure الذكاء الاصطناعي جميع ما كان يعرف سابقا بالخدمات المعرفية وخدمات الذكاء الاصطناعي التطبيقية من Azure.
- لا توجد تغييرات على الأسعار.
- يستمر استخدام الأسماء Cognitive Services وAzure Applied الذكاء الاصطناعي في فوترة Azure وتحليل التكلفة وقائمة الأسعار وواجهات برمجة التطبيقات للسعر.
- لا توجد تغييرات فاصلة على واجهات برمجة التطبيقات (APIs) أو مكتبات العميل.
- لا تزال بعض الأنظمة الأساسية تنتظر تحديث إعادة التسمية. تشير جميع إشارة Form Recognizer أو Document Intelligence في وثائقنا إلى نفس خدمة Azure.
Document Intelligence v3.1 (GA)
أصبحت واجهة برمجة تطبيقات Document Intelligence الإصدار 3.1 متاحة الآن بشكل عام (GA)! يتوافق إصدار واجهة برمجة التطبيقات مع 2023-07-31
.
تقدم واجهة برمجة تطبيقات الإصدار 3.1 قدرات جديدة ومحدثة:
- أصبحت واجهات برمجة التطبيقات لذكاء المستند الآن أكثر نمطية ودعما للميزات الاختيارية. يمكنك الآن تخصيص الإخراج لتضمين الميزات التي تحتاج إليها على وجه التحديد. تعرف على المزيد حول المعلمات الاختيارية.
- واجهة برمجة تطبيقات تصنيف المستندات لتقسيم ملف واحد إلى مستندات فردية. تعرف على المزيد حول تصنيف المستندات.
- نموذج عقد تم إنشاؤه مسبقا.
- نموذج ضريبة الولايات المتحدة 1098 الذي تم إنشاؤه مسبقا.
- دعم أنواع ملفات Office باستخدام واجهة برمجة تطبيقات القراءة.
- التعرف على الرمز الشريطي في المستندات.
- إمكانية الوظيفة الإضافية للتعرف على الصيغة.
- إمكانية الوظيفة الإضافية للتعرف على الخط.
- دعم المستندات عالية الدقة.
- تتطلب النماذج العصبية المخصصة الآن عينة واحدة مسماة للتدريب.
- توسيع لغة النماذج العصبية المخصصة. تدريب نموذج عصبي للمستندات في 30 لغة. راجع دعم اللغة للحصول على القائمة الكاملة باللغات المدعومة.
- 🆕 نموذج بطاقة التأمين الصحي التي تم إنشاؤها مسبقا.
- توسيع الإعدادات المحلية لنموذج الفاتورة الذي تم إنشاؤه مسبقا.
- لغة نموذج الإيصالات التي تم إنشاؤها مسبقا وتوسيع الإعدادات المحلية مع دعم أكثر من 100 لغة.
- يدعم نموذج المعرف الذي تم إنشاؤه مسبقا الآن المعرف الأوروبي.
التحديثات UX ل Document Intelligence Studio
✔️ تحليل الخيارات
يدعم Document Intelligence الآن قدرات تحليل أكثر تعقيدا ويسمح Studio بنقطة إدخال واحدة (زر خيارات التحليل) لتكوين قدرات الوظيفة الإضافية بسهولة.
اعتمادا على سيناريو استخراج المستند، قم بتكوين نطاق التحليل ونطاق صفحة المستند والكشف الاختياري وميزات الكشف المتميزة.
إشعار
لم يتم تصور استخراج الخط في Document Intelligence Studio. ومع ذلك، يمكنك التحقق من قسم الأنماط في إخراج JSON لنتائج الكشف عن الخط.
✔️ تسمية المستندات تلقائيا باستخدام نماذج تم إنشاؤها مسبقا أو أحد النماذج الخاصة بك
في صفحة تسمية نموذج الاستخراج المخصص، يمكنك الآن تسمية مستنداتك تلقائيا باستخدام أحد النماذج أو النماذج التي تم إنشاؤها مسبقا لخدمة Document Intelligent Service التي قمت بتدريبها مسبقا.
بالنسبة لبعض المستندات، يمكن أن تكون هناك تسميات مكررة بعد تشغيل التسمية التلقائية. تأكد من تعديل التسميات بحيث لا توجد تسميات مكررة في صفحة التسمية بعد ذلك.
✔️ جداول التسمية التلقائية
في صفحة تسمية نموذج الاستخراج المخصص، يمكنك الآن تسمية الجداول في المستند تلقائيا دون الحاجة إلى تسمية الجداول يدويا.
✔️ إضافة ملفات الاختبار مباشرة إلى مجموعة بيانات التدريب الخاصة بك
بمجرد تدريب نموذج استخراج مخصص، استخدم صفحة الاختبار لتحسين جودة النموذج الخاص بك عن طريق تحميل مستندات الاختبار إلى مجموعة بيانات التدريب إذا لزم الأمر.
إذا تم إرجاع درجة ثقة منخفضة لبعض التسميات، فتأكد من تسميتها بشكل صحيح. إذا لم يكن الأمر كما هو، أضفها إلى مجموعة بيانات التدريب وأعد تسميتها لتحسين جودة النموذج.
✔️ الاستفادة من خيارات قائمة المستندات وعوامل التصفية في المشاريع المخصصة
استخدم صفحة تسمية نموذج الاستخراج المخصص. يمكنك الآن التنقل عبر مستندات التدريب بسهولة من خلال الاستفادة من البحث والتصفية والفرز حسب الميزة.
استخدم طريقة عرض الشبكة لمعاينة المستندات أو استخدم طريقة عرض القائمة للتمرير عبر المستندات بسهولة أكبر.
✔️ مشاركة المشروع
- مشاركة مشاريع الاستخراج المخصصة بسهولة. لمزيد من المعلومات، راجع مشاركة المشروع مع النماذج المخصصة.
مايو 2023
تقديم الوثائق المحدثة للإصدار 2023
🆕 قامت نظرة عامة على معلومات المستند بتحسين التنقل ونقاط الوصول المنظمة والصور المحسنة.
🆕 اختيار نموذج تحليل معلومات المستند يوفر إرشادات لاختيار أفضل حل لذكاء المستند لمشاريعك ومهام سير العمل.
أبريل 2023
الإعلان عن أحدث إصدار معاينة عامة لمكتبة عميل معلومات المستند
يدعم Document Intelligence REST API الإصدار 2023-02-28-preview مكتبات عميل إصدار المعاينة العامة. يتضمن هذا الإصدار الميزات والإمكانيات الجديدة التالية المتوفرة ل .NET/C# (4.1.0-beta-1) وJava (4.1.0-beta-1) وJavaScript (4.1.0-beta-1) وPython (3.3.0b.1) مكتبات العميل:
لمزيد من المعلومات، راجعDocument Intelligence SDK (معاينة عامة) وملاحظات إصدار مارس 2023
مارس 2023
هام
2023-02-28-preview
تتوفر القدرات حاليا فقط في المناطق التالية:
- أوروبا الغربية
- غرب الولايات المتحدة2
- شرق الولايات المتحدة
- نموذج التصنيف المخصص هو قدرة جديدة داخل Document Intelligence بدءا من
2023-02-28-preview
واجهة برمجة التطبيقات. جرب إمكانية تصنيف المستند باستخدام Document Intelligence Studio أو REST API. - قدرات حقول الاستعلام المضافة إلى نموذج المستند العام، استخدم نماذج Azure OpenAI لاستخراج حقول معينة من المستندات. جرب ميزة المستندات العامة مع حقول الاستعلام باستخدام Document Intelligence Studio. حقول الاستعلام نشطة حاليا فقط للموارد في
East US
المنطقة. - قدرات الوظيفة الإضافية:
- يتم التعرف الآن على
2023-02-28-preview
استخراج الخط باستخدام واجهة برمجة التطبيقات. - يتم التعرف الآن على استخراج الصيغة
2023-02-28-preview
باستخدام واجهة برمجة التطبيقات. - يتم التعرف الآن على
2023-02-28-preview
استخراج الدقة العالية مع واجهة برمجة التطبيقات.
- يتم التعرف الآن على
- تحديثات نموذج الاستخراج المخصص:
- يدعم النموذج العصبي المخصص الآن لغات إضافية للتدريب والتحليل. تدريب نماذج عصبية للهولندية والفرنسية والألمانية والإيطالية والإسبانية.
- يحتوي نموذج القالب المخصص الآن على إمكانية محسنة للكشف عن التوقيع.
- تحديثات Document Intelligence Studio :
- بالإضافة إلى دعم جميع الميزات الجديدة مثل حقول التصنيف والاستعلام، يمكن Studio الآن مشاركة المشروع لمشاريع النموذج المخصصة.
- إضافات نموذج جديد في المعاينة المسورة: بطاقات التطعيم والعقود والضريبة الأمريكية 1098 والضريبة الأمريكية 1098-E والضريبة الأمريكية 1098-T. لطلب الوصول إلى نماذج المعاينة المسورة، أكمل نموذج طلب المعاينة الخاصة ل Document Intelligence ثم أرسله.
- تحديثات نموذج الإيصال:
- يضيف نموذج الإيصال دعما للإيصالات الحرارية.
- يضيف نموذج الإيصال الآن دعم اللغة ل 18 لغة وثلاث لغات إقليمية (الإنجليزية والفرنسية والبرتغالية).
- يدعم
TaxDetails
نموذج الإيصال الآن الاستخراج.
- يعمل نموذج التخطيط الآن على تحسين التعرف على الجدول.
- يضيف نموذج القراءة الآن تحسينا للتعرف على الأحرف المكونة من رقم واحد.
2023 فبراير
حدد "Document Intelligence containers for v3.0" متوفرة الآن للاستخدام!
تتوفر حاليا حاويات Read v3.0 و Layout v3.0 .
لمزيد من المعلومات، راجعتثبيت حاويات معلومات المستند وتشغيلها.
يناير 2023
نموذج إيصال تم إنشاؤه مسبقا - اللغات المضافة المدعومة. يدعم نموذج الإيصال الآن هذه اللغات واللغات المضافة
- اليابانية - اليابان (ja-JP)
- الفرنسية - كندا (fr-CA)
- الهولندية - هولندا (nl-NL)
- الإنجليزية - الإمارات العربية المتحدة (en-AE)
- البرتغالية - البرازيل (pt-BR)
نموذج فاتورة تم إنشاؤه مسبقا - اللغات المضافة المدعومة. يدعم نموذج الفاتورة الآن هذه اللغات واللغات المضافة
- الإنجليزية - الولايات المتحدة (en-US)، أستراليا (en-AU)، كندا (en-CA)، المملكة المتحدة (en-UK)، الهند (en-IN)
- الأسبانية - إسبانيا (es-ES)
- الفرنسية - فرنسا (fr-FR)
- الإيطالية - إيطاليا (it-IT)
- البرتغالية - البرتغال (pt-PT)
- الهولندية - هولندا (nl-NL)
نموذج فاتورة تم إنشاؤه مسبقا - الحقول المضافة التي تم التعرف عليها. يتعرف نموذج الفاتورة الآن على هذه الحقول المضافة
- كود العملة
- خيارات الدفع
- الخصم الإجمالي
- العناصر الضريبية (en-IN فقط)
نموذج معرف تم إنشاؤه مسبقا - أنواع المستندات المضافة مدعومة. يدعم نموذج المعرف الآن أنواع المستندات المضافة هذه
- المعرف العسكري الأمريكي
تلميح
تتوفر جميع تحديثات يناير 2023 مع إصدار REST API 2022-08-31 (GA).
نموذج إيصال تم إنشاؤه مسبقا - دعم لغة إضافي:
يضيف نموذج الإيصال الذي تم إنشاؤه مسبقا دعما للغات التالية:
- الإنجليزية - الإمارات العربية المتحدة (en-AE)
- الهولندية - هولندا (nl-NL)
- الفرنسية - كندا (fr-CA)
- الألمانية - (de-DE)
- الإيطالية - (it-IT)
- اليابانية - اليابان (ja-JP)
- البرتغالية - البرازيل (pt-BR)
نموذج فاتورة تم إنشاؤه مسبقا - دعم اللغة الإضافية واستخراج الحقول
يضيف نموذج الفاتورة الذي تم إنشاؤه مسبقا دعما للغات التالية:
- الإنجليزية - أستراليا (en-AU)، كندا (en-CA)، المملكة المتحدة (en-UK)، الهند (en-IN)
- البرتغالية - البرازيل (pt-BR)
يضيف نموذج الفاتورة الذي تم إنشاؤه مسبقا الآن دعما لاستخراج الحقول التالية:
- كود العملة
- خيارات الدفع
- الخصم الإجمالي
- العناصر الضريبية (en-IN فقط)
نموذج مستند المعرف الذي تم إنشاؤه مسبقا — دعم أنواع مستندات إضافية
يضيف نموذج مستند المعرف الذي تم إنشاؤه مسبقا الآن دعما إلى أنواع المستندات التالية:
- توسيع رخصة القيادة لدعم الهند وكندا والمملكة المتحدة وأستراليا
- بطاقات هوية ومستندات عسكرية أمريكية
- بطاقات هوية الهند ومستنداتها (PAN وAdhaar)
- بطاقات هوية أستراليا ومستنداتها (بطاقة الصورة، معرف مفتاح المرور)
- بطاقات هوية كندا ومستنداتها (بطاقة التعريف، بطاقة Maple)
- بطاقات هوية المملكة المتحدة ومستنداتها (بطاقة هوية وطنية/إقليمية)
ديسمبر 2022
تحديثات Document Intelligence Studio
يتضمن إصدار Document Intelligence Studio لشهر ديسمبر آخر التحديثات إلى Document Intelligence Studio. هناك تحسينات كبيرة على تجربة المستخدم، في المقام الأول مع دعم تسمية النموذج المخصص.
نطاق الصفحات. يدعم Studio الآن تحليل الصفحات المحددة من مستند.
تسمية النموذج المخصص:
تشغيل واجهة برمجة تطبيقات التخطيط تلقائيا. يمكنك اختيار تشغيل واجهة برمجة تطبيقات التخطيط لجميع المستندات تلقائيا في تخزين الكائن الثنائي كبير الحجم أثناء عملية إعداد النموذج المخصص.
بحث. يتضمن Studio الآن وظيفة البحث لتحديد موقع الكلمات داخل مستند. يسمح هذا التحسين بتنقل أسهل أثناء وضع العلامات.
التنقل يمكنك تحديد تسميات لاستهداف الكلمات المسماة داخل مستند.
تسمية الجدول التلقائي. بعد تحديد أيقونة الجدول داخل مستند، يمكنك اختيار تسمية الجدول المستخرج تلقائيا في طريقة عرض التسمية.
أنواع التسمية الفرعية والالأنواع الفرعية من المستوى الثاني يدعم Studio الآن الأنواع الفرعية لأعمدة الجدول وصفوف الجدول والالأنواع الفرعية من المستوى الثاني لأنواع مثل التواريخ والأرقام.
يتم الآن دعم بناء نماذج عصبية مخصصة في منطقة ولاية فرجينيا الأمريكية.
معاينة إصدارات
2022-01-30-preview
2021-09-30-preview
واجهة برمجة التطبيقات وسيتم إيقافها في 31 يناير 2023.2022-08-31
قم بتحديث إصدار واجهة برمجة التطبيقات لتجنب أي انقطاع في الخدمة.
نوفمبر 2022
- الإعلان عن أحدث إصدار مستقر من مكتبات Azure الذكاء الاصطناعي Document Intelligence
- يتضمن هذا الإصدار تغييرات وتحديثات مهمة لمكتبات عميل .NET وJava وJavaScript وPython. لمزيد من المعلومات، راجعAzure SDK DevBlog.
- أهم التحسينات هي إدخال عميلين جديدين،
DocumentAnalysisClient
و وDocumentModelAdministrationClient
.
أكتوبر 2022
محتوى تم إصداره بواسطة تحليل معلومات المستند
يتم تحديث وثائق Document Intelligence لتقديم تجربة تم إصدارها. الآن، يمكنك اختيار عرض المحتوى الذي
v3.0 GA
يستهدف التجربة أوv2.1 GA
التجربة. تجربة الإصدار 3.0 هي التجربة الافتراضية.
نموذج التعليمات البرمجية ل Document Intelligence Studio
- يتوفر نموذج التعليمات البرمجية لتجربة تسمية Document Intelligence Studio الآن على GitHub. يمكن للعملاء تطوير ودمج Document Intelligence في تجربة المستخدم الخاصة بهم أو إنشاء تجربة مستخدم جديدة خاصة بهم باستخدام نموذج التعليمات البرمجية ل Document Intelligence Studio.
توسيع اللغة
- مع أحدث إصدار معاينة، تدعم نماذج قوالب قراءة المعلومات المستندية (OCR) والتخطيط والقوالب المخصصة 134 لغة جديدة. وتشمل هذه الإضافات اللغوية اليونانية واللاتفية والصربية والتايلاندية والأوكرانية والفيتنامية، إلى جانب العديد من اللغات اللاتينية والسيريلية. يحتوي Document Intelligence الآن على إجمالي 299 لغة مدعومة عبر أحدث إصدارات التوفر العام والمعاينة الجديدة. راجع صفحة اللغات المعتمدة لمشاهدة جميع اللغات المدعومة.
- استخدم معلمة
api-version=2022-06-30-preview
REST API عند استخدام واجهة برمجة التطبيقات أو SDK المطابق لدعم اللغات الجديدة في تطبيقاتك.
نموذج عقد جديد تم إنشاؤه مسبقا
توسيع المنطقة لتدريب النماذج العصبية المخصصة
- تدريب نماذج عصبية مخصصة مدعومة الآن في المناطق المضافة.
- شرق الولايات المتحدة
- منطقة شرق الولايات المتحدة 2
- US Gov – أريزونا
- تدريب نماذج عصبية مخصصة مدعومة الآن في المناطق المضافة.
2022 سبتمبر
إشعار
بدءا من الإصدار 4.0.0، تم تقديم مجموعة جديدة من العملاء للاستفادة من أحدث ميزات خدمة Document Intelligence.
يتضمن إصدار SDK الإصدار 4.0.0 GA التحديثات التالية:
- الإصدار 4.0.0 GA (2022-09-08)
- يدعم عملاء REST API v3.0 وv2.0
توسيع المنطقة لتدريب النماذج العصبية المخصصة المدعومة الآن في ست مناطق جديدة
- شرق أستراليا
- Central US
- شرق آسيا
- وسط فرنسا
- جنوب المملكة المتحدة
- غرب الولايات المتحدة2
للحصول على قائمة كاملة بالمناطق التي يُدعم فيها التدريب، راجع النماذج العصبية المخصصة.
إصدار Document Intelligence SDK
4.0.0 GA
:- مكتبات عميل Document Intelligence الإصدار 4.0.0 (.NET/C# وJava وJavaScript) والإصدار 3.2.0 (Python) متوفرة بشكل عام وجاهزة للاستخدام في تطبيقات الإنتاج!.
- لمزيد من المعلومات حول مكتبات عملاء Document Intelligence، راجع نظرة عامة على SDK.
- قم بتحديث تطبيقاتك باستخدام دليل ترحيل لغة البرمجة.
أغسطس 2022
يتضمن إصدار معاينة Document Intelligence SDK بيتا أغسطس 2022 التحديثات التالية:
الإصدار 4.0.0-beta.5 (2022-08-09)
يتوفر Document Intelligence v3.0 بشكل عام
- يتوفر الإصدار 3.0 من واجهة برمجة تطبيقات REST لذكاء المستند الآن بشكل عام وجاهز للاستخدام في تطبيقات الإنتاج! قم بتحديث تطبيقاتك باستخدام إصدار REST API 2022-08-31.
تحديثات Document Intelligence Studio
- الخطوات التالية. ضمن كل صفحة نموذج، يحتوي Studio الآن على قسم "الخطوات التالية". يمكن للمستخدمين الرجوع بسرعة إلى نموذج التعليمات البرمجية وإرشادات استكشاف الأخطاء وإصلاحها ومعلومات التسعير.
- النماذج المخصصة. يتضمن Studio الآن القدرة على إعادة ترتيب التسميات في مشاريع النموذج المخصص لتحسين كفاءة التسمية.
- يمكن نسخ نماذج النسخ نماذج مخصصة عبر خدمات تحليل معلومات المستند من داخل Studio. تتيح العمليات ترقية نموذج مُدرب إلى بيئات ومناطق أخرى.
- حذف المستندات. يدعم Studio الآن حذف المستندات من مجموعة البيانات المُسماة داخل المشاريع المخصصة.
تحديثات خدمة تحليل معلومات المستند
- prebuilt-read. يتوفر الآن نموذج التعرف البصري على الحروف للقراءة أيضا في Document Intelligence مع الفقرات والكشف عن اللغة كميزتين جديدتين. تستهدف Document Intelligence Read سيناريوهات المستندات المتقدمة المتوافقة مع قدرات ذكاء المستند الأوسع في ذكاء المستند.
- prebuilt-layout. يستخرج نموذج التخطيط الفقرات وما إذا كان النص المستخرج عبارة عن فقرة أو عنوان أو عنوان مقطع أو حاشية سفلية أو رأس صفحة أو تذييل الصفحة أو رقم الصفحة.
- prebuilt-invoice. يتم الآن حل الحقلين TotalVAT و Line/VAT إلى الحقول الموجودة TotalTax و Line/Tax على التوالي.
- prebuilt-idDocument. دعم استخراج البيانات لمعرّف حالة الولايات المتحدة والضمان الاجتماعي والبطاقات الخضراء. دعم معلومات تأشيرة جواز السفر.
- prebuilt-receipt. دعم محلي موسع للغة الفرنسية (fr-FR) والإسبانية (es-ES) والبرتغالية (pt-PT) والإيطالية (it-IT) والألمانية (de-DE).
- prebuilt-businessCard. دعم تحليل العنوان لاستخراج الحقول الفرعية لمكونات العنوان مثل العنوان والمدينة والولاية والبلد/المنطقة والرمز البريدي.
تحسينات جودة نظام التشغيل الذكاء الاصطناعي
- prebuilt-read. دعم محسن للأحرف الفردية والتواريخ المكتوبة بخط اليد والمبالغ والأسماء والبيانات الرئيسية الأخرى الموجودة عادة في الإيصالات والفواتير وتحسين معالجة مستندات PDF الرقمية.
- prebuilt-layout. دعم الكشف بشكل أفضل عن الجداول المقصوصة والجداول بلا حدود وتحسين التعرف على الخلايا الممتدة.
- prebuilt-document. تحسين الكشف عن القيمة وخانة الاختيار.
- custom-neural. دقة محسّنة للكشف عن الجدول واستخراجه.
يونيو 2022
- يتضمن إصدار معاينة Document Intelligence SDK بيتا يونيو 2022 التحديثات التالية:
الإصدار 4.0.0-beta.4 (2022-06-08)
إصدار Document Intelligence Studio يونيو هو آخر تحديث ل Document Intelligence Studio. هناك تحسينات ملحوظة على تجربة المستخدم وإمكانية الوصول في هذا التحديث:
- نموذج التعليمات البرمجية ل JavaScript وC#. تضيف علامة تبويب "التعليمات البرمجية لـ Studio" الآن نماذج التعليمات البرمجية Javascript وC# بالإضافة إلى تعليمات Python البرمجية الموجودة.
- واجهة مستخدم جديدة لتحميل المستند. يدعم Studio الآن تحميل مستند مع السحب والإفلات في واجهة مستخدم التحميل الجديدة.
- ميزة جديدة للمشاريع المخصصة. تدعم المشاريع المخصصة الآن إنشاء حساب تخزين والكائنات الثنائية كبيرة الحجم عند تكوين المشروع. بالإضافة إلى ذلك، يدعم المشروع المخصص الآن تحميل ملفات التدريب مباشرة داخل Studio ونسخ النموذج المخصص الموجود.
يقدم إصدار Document Intelligence v3.0 2022-06-30-preview تحديثات شاملة عبر واجهات برمجة التطبيقات للميزة:
- يوسع التخطيط استخراج البنية. يتضمن التخطيط الآن عناصر بنية مضافة بما في ذلك الأقسام وعناوين الأقسام والفقرات. يمكن هذا التحديث سيناريوهات تجزئة المستندات الدقيقة. للحصول على قائمة كاملة بعناصر البنية المحددة، راجعالبنية المحسنة.
- دعم الحقول الجدولية لنموذج عصبي مخصص. تدعم نماذج المستندات المخصصة الآن الحقول الجدولية. الحقول الجدولية بشكل افتراضي هي أيضًا متعددة الصفحات. لمعرفة المزيد حول الحقول الجدولية في النماذج العصبية المخصصة، راجعالحقول الجدولية.
- دعم الحقول الجدولية لنموذج قالب مخصص لجداول عبر الصفحات. تدعم النماذج المخصصة الآن الحقول الجدولية عبر الصفحات. لمعرفة المزيد حول الحقول الجدولية في نماذج القالب المخصصة، راجعالحقول الجدولية.
- يتضمن إخراج نموذج الفاتورة الآن أزواج قيم المفاتيح للمستند العام. عندما تحتوي الفواتير على حقول مطلوبة تتجاوز الحقول المضمنة في النموذج الذي تم إنشاؤه مسبقًا، فإن نموذج المستند العام يكمل الإخراج بأزواج قيم المفاتيح. راجعأزواج قيم المفاتيح.
- توسيع لغة الفاتورة. يتضمن نموذج الفاتورة دعمًا موسعًا للغة. راجعاللغات المدعومة.
- بطاقة العمل المُعدة مسبقًا تتضمن الآن دعم اللغة اليابانية. راجعاللغات المدعومة.
- نموذج مستند المعرّف المُعد مسبقًا. يقوم نموذج مستند المعرف الآن باستخراج DateOfIssue وHeight وWeight وEyeColor وHairColor وDocumentDiscriminator من تراخيص القيادة الأمريكية. راجعاستخراج الحقل.
- يدعم نموذج القراءة الآن أنواع مستندات Microsoft Office الشائعة. يتم الآن دعم أنواع المستندات مثل Word (docx) وExcel (xlsx) وPowerPoint (pptx) مع واجهة برمجة تطبيقات Read. راجع قراءة استخراج البيانات.
2022 فبراير
الإصدار 4.0.0-beta.3 (2022-02-10)
يقدم إصدار معاينة Document Intelligence v3.0 العديد من الميزات والقدرات والتحسينات الجديدة:
- النموذج العصبي المخصص أو نموذج المستند المخصص هو نموذج مخصص جديد لاستخراج النصوص وعلامات التحديد من النماذج المنظمة والمستندات شبه المنظمة وغير المنظمة.
- نموذج W-2 المُعد مسبقًا هو نموذج جديد مُعد مسبقًا لاستخراج الحقول من نماذج W-2 لإعداد التقارير الضريبية وسيناريوهات التحقق من الدخل.
- Read API تستخرج خطوط النص المطبوعة والكلمات ومواقع النص واللغات المُكتشفة والنص المكتوب بخط اليد، إذا اُكتشفت.
- يتم الآن تحديث نموذج المستند العام المدرب مسبقا لدعم علامات التحديد بالإضافة إلى نص واجهة برمجة التطبيقات والجداول والبنية وأزواج قيم المفاتيح من النماذج والمستندات.
- واجهة برمجة تطبيقات الفاتورة يوسع نموذج الفاتورة الذي تم إنشاؤه مسبقًا الدعم إلى الفواتير الإسبانية.
- يضيف Document Intelligence Studio عروضا توضيحية جديدة للقراءة وW2 وعينات إيصالات الفندق ودعم تدريب النماذج العصبية المخصصة الجديدة.
- يضيف التحليل الذكي لمستندات توسيع اللغة للقراءة والتخطيط والنموذج المخصص دعما ل 42 لغة جديدة بما في ذلك اللغة العربية والهندية ولغات أخرى باستخدام البرامج النصية العربية وDevanagari لتوسيع التغطية إلى 164 لغة. يتوسع دعم اللغة المكتوبة بخط اليد إلى اليابانية والكورية.
ابدأ باستخدام واجهة برمجة تطبيقات REST أو Python أو .NET SDK الجديدة لواجهة برمجة تطبيقات الإصدار الأولي v3.0.
استخراج بيانات نموذج ذكاء المستند:
النموذج استخراج النص أزواج قيم المفاتيح علامات التحديد الجداول التوقيعات قراءة √ المستند العام √ √ √ √ Layout √ √ √ الفاتورة √ √ √ √ الإيصال √ √ √ مستند معرف √ √ بطاقة العمل √ √ القالب المخصص √ √ √ √ √ عصبي مخصص. √ √ √ √ يتضمن إصدار المعاينة التجريبية ل Document Intelligence SDK التحديثات التالية:
-
- قالب مخصص (نموذج مخصص سابقا).
- النموذج العصبي المخصص.
- نموذج مخصص - وضع الإنشاء.
نموذج W-2 المُعد مسبقًا (prebuilt-tax.us.w2).
نموذج القراءة المُعد مسبقًا (prebuilt-read).
نموذج الفاتورة المُعد مسبقًا (الإسبانية) (prebuilt-invoice).
-
نوفمبر 2021
الإصدار 4.0.0-beta.2 (2021-11-09)
| الحزمة (NuGet) | وثائق مرجع Changelog/Release History | API
- يتضمن تحديث إصدار معاينة SDK ل Document Intelligence v3.0 (beta.2) إصلاحات الأخطاء وتحديثات الميزات الثانوية.
أكتوبر 2021
يقدم إصدار معاينة Document Intelligence الإصدار 4.0.0-beta.1 (2021-10-07) العديد من الميزات والقدرات الجديدة:
نموذج المستند العام هو واجهة برمجة تطبيقات جديدة تستخدم نموذجا مدربا مسبقا لاستخراج النص والجداول والبنية وأزواج قيم المفاتيح من النماذج والمستندات.
تمت إضافة نموذج إيصال الفندق إلى معالجة الإيصالات التي تم إنشاؤها مسبقًا.
يدعم نموذج معرّف الحقول الموسعة لمستند المعرف المصادقات والقيود واستخراج تصنيف المركبات من تراخيص القيادة الأمريكية.
حقل التوقيع هو نوع حقل جديد في نماذج مخصصة للكشف عن وجود توقيع في حقل نموذج.
دعم توسيع اللغة لـ 122 لغة (طباعة) و7 لغات (مكتوبة بخط اليد). يقوم تخطيط ذكاء المستند والنموذج المخصص بتوسيع اللغات المدعومة إلى 122 مع أحدث معاينة لها. تتضمن المعاينة استخراج نص للنص المطبوع بـ 49 لغة جديدة بما في ذلك الروسية والبلغارية واللغات السيريلية الأخرى والمزيد من اللغات اللاتينية. بالإضافة إلى ذلك، يدعم استخراج النص المكتوب بخط اليد الآن سبع لغات تتضمن الإنجليزية، ومعاينات جديدة للصينية المبسطة والفرنسية والألمانية والإيطالية والبرتغالية والإسبانية.
تحسينات استخراج النص والجداول يدعم التخطيط الآن استخراج جداول صف واحد تسمى أيضًا جداول قيمة المفتاح. تتضمن تحسينات استخراج النص معالجة أفضل لملفات PDF الرقمية ونص المنطقة القابلة للقراءة الآلية (MRZ) في مستندات الهوية، جنبًا إلى جنب مع الأداء العام.
Document Intelligence Studio لتبسيط استخدام الخدمة، يمكنك الآن الوصول إلى Document Intelligence Studio لاختبار النماذج المختلفة التي تم إنشاؤها مسبقا أو تسمية نموذج مخصص وتدريبه.
ابدأ باستخدام واجهة برمجة تطبيقات REST أو Python أو .NET SDK الجديدة لواجهة برمجة تطبيقات الإصدار الأولي v3.0.
استخراج بيانات نموذج ذكاء المستند
النموذج استخراج النص أزواج قيم المفاتيح علامات التحديد الجداول المستند العام √ √ √ √ Layout √ √ √ الفاتورة √ √ √ √ الإيصال √ √ مستند معرف √ √ بطاقة العمل √ √ مخصص √ √ √ √
سبتمبر 2021
تتوفر الميزات المتقدمة لمستكشف مقاييس Azure في صفحة نظرة عامة على مورد Document Intelligence في مدخل Microsoft Azure.
قائمة المراقبة:
المخططات:
تحديث نموذج مستند المعرف: أسماء معينة تتضمن لاحقة، مع أو بدون نقطة، معالجة بنجاح:
نص الإدخال النتيجة مع التحديث ويليام إسحاق كيربي جونيور FirstName: وليام إسحاق
LastName: كيربي جونيور.هنري كاليب روس سينيور FirstName: هنري كاليب
LastName: روس الأب.
يوليو 2021
- دعم الهوية المدارة المعينة من قبل النظام: يمكنك الآن تمكين هوية مدارة معينة من قبل النظام لمنح Document Intelligence وصولا محدودا إلى حسابات التخزين الخاصة بما في ذلك الحسابات المحمية بواسطة شبكة ظاهرية أو جدار حماية أو تمكين إحضار التخزين الخاص بك (BYOS). راجعإنشاء هوية مدارة واستخدامها لمورد Document Intelligence لمعرفة المزيد.
يونيو 2021
تم إصدار حاويات معلومات المستند الإصدار 2.1 في المعاينة المسورة وهي الآن مدعومة بست حاويات ميزات - التخطيط وبطاقة العمل ومستند المعرف والإيصال والفاتورة والمخصصة. لاستخدامها، يجب عليك تقديم طلب عبر الإنترنت، والحصول على الموافقة.
تم إصدار موصل Document Intelligence في المعاينة: يتكامل موصل Document Intelligence مع Azure Logic Apps وMicrosoft Power Automate وMicrosoft Power Apps. يدعم الموصل إجراءات سير العمل ومشغلات لاستخراج وتحليل بيانات المستند وبنيته من النماذج والفواتير والإيصالات وبطاقات العمل ومستندات المعرف المخصصة والمبنية مسبقا.
تم تصحيح Document Intelligence SDK v3.1.0 إلى v3.1.1 ل C# وJava وPython. يعالج التصحيح الفواتير التي لا تحتوي على حقول عناصر خط فرعي تم اكتشافها مثل
FormField
معText
ولكن ليس هناك معلوماتBoundingBox
أوPage
.
مايو 2021
- الإصدار 3.1.0 (2021-05-26)
وثائق Changelog/Release History| Reference للإصدار | 3.0.1 من حزمة NuGet |
يتوفر Document Intelligence 2.1 بشكل عام. يمثل إصدار GA استقرار التغييرات التي تم إدخالها في إصدارات حزمة المعاينة السابقة 2.1. يمكنك هذا الإصدار من الكشف عن المعلومات والبيانات واستخراجها من أنواع المستندات التالية:
للبدء، جرب أداة نموذج ذكاء المستند واتبع التشغيل السريع.
تضيف ميزة جدول واجهة برمجة تطبيقات التخطيط المحدثة التعرف على العنوان باستخدام عناوين الأعمدة التي يمكن أن تمتد عبر صفوف متعددة. تحتوي كل خلية جدول على سمة تشير إلى ما إذا كانت جزءًا من عنوان أم لا. يمكن استخدام هذا التحديث لتحديد الصفوف التي تشكل عنوان الجدول.
2021 أبريل
إصدار حزمة NuGet 3.1.0-beta.4
سجل التغيير/محفوظات الإصدار.
أساليب جديدة لتحليل البيانات من مستندات الهوية:
StartRecognizeIdDocumentsFromUriAsync
StartRecognizeIdDocumentsAsync
للحصول على قائمة بقيم الحقول، راجعالحقول المستخرجة في وثائق Document Intelligence.
تم توسيع مجموعة لغات المستندات التي يمكن توفيرها إلى الأسلوب StartRecognizeContent.
خاصية جديدة
Pages
مدعومة من الفئات التالية:RecognizeBusinessCardsOptions
RecognizeCustomFormsOptions
RecognizeInvoicesOptions
RecognizeReceiptsOptionsتسمح لك الخاصية
Pages
بتحديد صفحات فردية أو نطاق من الصفحات لمستندات PDF وTIFF متعددة الصفحات. بالنسبة للصفحات الفردية، أدخل رقم الصفحة، على سبيل المثال،3
. بالنسبة لنطاق من الصفحات (مثل الصفحة 2 والصفحات من 5 إلى 7) أدخل أرقام ونطاقات الصفحة مفصولة بفواصل:2, 5-7
.خاصية جديدة
ReadingOrder
مدعومة من الفئة التالية:الخاصية
ReadingOrder
هي معلمة اختيارية تسمح لك بتحديد خوارزمية ترتيب القراءة—basic
أوnatural
—التي يجب تطبيقها لطلب استخراج عناصر النص. إذا لم يتم التحديد، فإن القيمة الافتراضية هيbasic
.
- تقدم تحديثات معاينة SDK لإصدار
2.1-preview.3
واجهة برمجة التطبيقات تحديثات وتحسينات للميزات.
مارس 2021
تم إصدار معاينة عامة ل Document Intelligence v2.1 v2.1-preview.3 ويتضمن الميزات التالية:
نموذج معرف جديد تم إنشاؤه مسبقًا يمكن نموذج المعرف الجديد الذي تم إنشاؤه مسبقًا العملاء من أخذ المعرفات وإرجاع البيانات المنظمة للتشغيل التلقائي للمعالجة. هو يجمع بين إمكاناتنا القوية في التعرف البصري على الحروف (OCR) مع نماذج فهم المعرف لاستخراج المعلومات الرئيسية من جوازات السفر وتراخيص القيادة الأمريكية.
استخراج عنصر السطر لنموذج الفاتورة - يدعم نموذج الفاتورة مسبق الإنشاء الآن استخراج عنصر السطر؛ فهو الآن يستخرج العناصر الكاملة وأجزائها - الوصف والمبلغ والكمية ومعرف المنتج والتاريخ والمزيد. باستخدام استدعاء API/SDK بسيط، يمكنك استخراج بيانات مفيدة من فواتيرك - النص والجدول وأزواج قيم المفاتيح وعناصر السطر.
تعرف على المزيد حول نموذج الفاتورة.
تسمية الجدول الخاضع للإشراف والتدريب عليه، وتسمية القيمة الفارغة - بالإضافة إلى قدرات استخراج الجدول التلقائي للتعلم العميق المتطورة في Document Intelligence، فإنه يتيح الآن للعملاء تسمية الجداول والتدريب عليها. يتضمن هذا الإصدار الجديد إمكانية تسمية العناصر/الجداول الخطية والتدريب عليها (ديناميكية وثابتة) وتدريب نموذج مخصص لاستخراج أزواج قيم المفاتيح وعناصر الخط. بمجرد تدريب النموذج، يستخرج النموذج عناصر الخط كجزء من إخراج JSON في قسم documentResults.
بالإضافة إلى تسمية الجداول، يمكنك الآن تسمية القيم والمناطق الفارغة. إذا لم تكن بعض المستندات في مجموعة التدريب الخاصة بك تحتوي على قيم لحقول معينة، يمكنك تسميتها بحيث يعرف النموذج الخاص بك استخراج القيم بشكل صحيح من المستندات التي تم تحليلها.
دعم 66 لغة جديدة - تدعم واجهة برمجة تطبيقات التخطيط والنماذج المخصصة ل Document Intelligence الآن 73 لغة.
تعرف على المزيد حول دعم لغة Document Intelligence.
ترتيب القراءة الطبيعية وتصنيف الكتابة اليدوية وتحديد الصفحة - باستخدام هذا التحديث، يمكنك اختيار الحصول على مخرجات سطر النص بترتيب القراءة الطبيعي بدلاً من الترتيب الافتراضي من اليسار إلى اليمين ومن أعلى إلى أسفل. استخدم معلمة استعلام readingOrder الجديدة وقم بتعيينها إلى قيمة "طبيعية" لإخراج ترتيب قراءة أكثر ملاءمة للإنسان. بالإضافة إلى ذلك، بالنسبة للغات اللاتينية، يصنف Document Intelligence الخطوط النصية كنمط مكتوب بخط اليد أم لا ويعطي درجة ثقة.
تحسينات جودة نموذج الإيصالات الذي تم إنشاؤه مسبقًا يتضمن هذا التحديث العديد من تحسينات الجودة لنموذج الإيصال الذي تم إنشاؤه مسبقًا، خاصة حول استخراج عنصر السطر.
نوفمبر 2020
تم إصدار Document Intelligence v2.1-preview.2 ويتضمن الميزات التالية:
نموذج فاتورة جديد تم إنشاؤه مسبقًا - يمكن نموذج الفاتورة الجديد الذي تم إنشاؤه مسبقًا العملاء من أخذ الفواتير بتنسيقات مختلفة وإرجاع البيانات المنظمة لتشغيل معالجة الفاتورة التلقائي. هو يجمع بين إمكاناتنا القوية في التعرف البصري على الحروف (OCR) مع نماذج التعلم العميق لفهم الفواتير لاستخراج المعلومات الرئيسية من الفواتير باللغة الإنجليزية. يستخرج النص الرئيسي والجداول والمعلومات مثل العميل والمورد ومعرف الفاتورة وتاريخ استحقاق الفاتورة والإجمالي والمبلغ المستحق والمبلغ الضريبي ومكان الشحن إلى ومكان استلام الفاتورة.
استخراج الجدول المحسن - يوفر Document Intelligence الآن استخراجا محسنا للجداول، والذي يجمع بين قدرات التعرف البصري على الحروف (OCR) القوية مع نموذج استخراج جدول التعلم العميق. يمكن ل Document Intelligence استخراج البيانات من الجداول، بما في ذلك الجداول المعقدة ذات الأعمدة المدمجة والصفوف وعدم وجود حدود والمزيد.
تعرف على المزيد حول استخراج التخطيط.
تحديث مكتبة العميل - تدعم أحدث إصدارات مكتبات العميل ل .NET وPython وJava وJavaScript واجهة برمجة تطبيقات Document Intelligence 2.1.
لغة جديدة مدعومة: اليابانية - اللغات الجديدة التالية مدعومة الآن: لـ
AnalyzeLayout
وAnalyzeCustomForm
: اليابانية (ja
). دعم اللغة.إشارة نمط سطر النص (مكتوب بخط اليد/غيره) (اللغات اللاتينية فقط) - يقوم تحليل معلومات المستند الآن بإخراج عنصر
appearance
يصنف ما إذا كان كل سطر نص نمطا مكتوبا بخط اليد أم لا، إلى جانب درجة الثقة. هذه الميزة مدعومة فقط للغات اللاتينية.تحسينات الجودة - تحسينات الاستخراج بما في ذلك تحسينات استخراج رقم واحد.
ميزة تجربة جديدة في نموذج ذكاء المستند وأداة التسمية - القدرة على تجربة نماذج الفاتورة والإيصال وبطاقة العمل التي تم إنشاؤها مسبقا وواجهة برمجة تطبيقات التخطيط باستخدام أداة تسمية نموذج ذكاء المستند. تعرف على كيفية استخراج بياناتك دون كتابة أي تعليمة برمجية.
جرب أداة تسمية نموذج تحليل معلومات المستند
- التكرار الحلقي للملاحظات - عند تحليل الملفات عبر أداة تسمية النموذج، يمكنك الآن أيضًا إضافتها إلى مجموعة التدريب وضبط التسميات إذا لزم الأمر والتدريب لتحسين النموذج.
- مستندات التسمية التلقائية - تسميات المستندات المضافة تلقائيًا استنادًا إلى المستندات المسماة السابقة في المشروع.
أغسطس 2020
**يتضمن Document Intelligence
v2.1-preview.1
الميزات التالية:- يتوفر مرجع واجهة برمجة تطبيقات REST - عرض
v2.1-preview.1 reference
. - اللغات الجديدة المدعومة بالإضافة إلى اللغة الإنجليزية، يتم الآن دعم اللغات التالية: لـ
Layout
وTrain Custom Model
: الإنجليزية (en
) والصينية (المبسطة) (zh-Hans
) والهولندية (nl
) والفرنسية (fr
) والألمانية (de
) والإيطالية (it
) والبرتغالية (pt
) والإسبانية (es
). - خانة الاختيار / الكشف عن علامة التحديد – يدعم تحليل معلومات المستند الكشف عن علامات التحديد واستخراجها مثل خانات الاختيار والأزرار التبادلية. يتم استخراج علامات التحديد في
Layout
ويمكنك الآن أيضًا التسمية والتدريب فيTrain Custom Model
- التدريب باستخدام التسميات لاستخراج أزواج قيم المفاتيح لعلامات التحديد. - إنشاء النموذج - يسمح بإنشاء نماذج متعددة واستدعائها بمعرف نموذج واحد. عند إرسال مستند لتحليله باستخدام معرف نموذج مكون، يتم أولاً تنفيذ خطوة تصنيف لتوجيهه إلى النموذج المخصص الصحيح. يتوفر إنشاء نموذج لـ
Train Custom Model
- التدريب باستخدام التسميات. - اسم النموذج - أضف اسمًا مألوفًا إلى نماذجك المخصصة لتسهيل الإدارة والتعقب.
- نموذج جديد تم إنشاؤه مسبقا لبطاقات العمل لاستخراج الحقول الشائعة باللغة الإنجليزية وبطاقات العمل باللغة.
- الإعدادات المحلية الجديدة للإيصالات التي تم إنشاؤها مسبقا بالإضافة إلى EN-US، يتوفر الدعم الآن ل EN-AU و EN-CA و EN-GB و EN-IN.
- تحسينات الجودة لـ
Layout
،Train Custom Model
- والتدريب بدون تسمياتوالتدريب باستخدام التسميات.
- يتوفر مرجع واجهة برمجة تطبيقات REST - عرض
v2.0 يتضمن التحديث التالي:
- تتوفر مكتبات العميل ل NET وPython وJava وJavaScript بشكل عام.
نماذج جديدة تتوفر على GitHub.
- تجمع وصفات استخراج المعرفة - Forms Playbook أفضل الممارسات من تفاعلات عملاء Document Intelligence الحقيقية وتوفر نماذج تعليمات برمجية قابلة للاستخدام وقوائم اختيار ونماذج البنية الأساسية لبرنامج ربط العمليات التجارية المستخدمة في تطوير هذه المشاريع.
- يتم تحديث أداة تسمية العينة لدعم وظيفة الإصدار 2.1 الجديدة. راجع هذا التشغيل السريع لبدء استخدام الأداة.
- يوضح نموذج Intelligent Kiosk Document Intelligence كيفية التكامل
Analyze Receipt
والتدريبTrain Custom Model
- بدون تسميات.
2020 يوليو
- مرجع Document Intelligence v2.0 متوفر - عرض مرجع v2.0 API ومكتبات العميل المحدثة ل .NET وPython وJava وJavaScript.
تحسينات الجدول وتحسينات الاستخراج - بما في ذلك تحسينات الدقة وتحسينات استخراج الجدول، على وجه التحديد، إمكانية تعلم عناوين وبنى الجداول في التدريب المخصص دون تسميات.
دعم العملة - الكشف عن رموز العملة العالمية واستخراجها.
Azure Gov - معلومات المستند متاحة الآن أيضا في Azure Gov.
ميزات أمان محسنة:
- إحضار المفتاح الخاص بك - تشفر ذكاء المستند بياناتك تلقائيا عند استمرارها في السحابة لحمايتها ولمساعدتك على الوفاء بالتزامات الأمان والتوافق التنظيمية. افتراضياً، يستخدم اشتراكك مفاتيح التشفير التي تديرها Microsoft. يمكنك الآن أيضًا إدارة اشتراكك باستخدام مفاتيح التشفير الخاصة بك. المفاتيح التي يديرها العميل، والمعروفة أيضًا باسم إحضار المفتاح الخاص بك (BYOK)، توفر قدرًا أكبر من المرونة لإنشاء عناصر التحكم في الوصول وتدويرها وتعطيلها وإبطالها. يمكنك أيضاً تدقيق مفاتيح التشفير المستخدمة لحماية بياناتك.
- نقاط النهاية الخاصة – تمكنك على شبكة ظاهرية من الوصول بأمان إلى البيانات عبر Private Link.
يونيو 2020
- تمت إضافة CopyModel API إلى مكتبات العميل - يمكنك الآن استخدام مكتبات العميل لنسخ النماذج من اشتراك إلى آخر. راجع النسخ الاحتياطي واسترداد النماذج للحصول على معلومات عامة حول هذه الميزة.
- تكامل Azure Active Directory - يمكنك الآن استخدام بيانات اعتماد Azure AD لمصادقة كائنات عميل Document Intelligence في مكتبات العميل.
- التغييرات الخاصة بـ SDK - يتضمن هذا التغيير كل من إضافات الميزات الثانوية والتغييرات الطارئة. لمزيد من المعلومات، راجع سجلات تغيير SDK.
2020 أبريل
- دعم SDK لواجهة برمجة تطبيقات ذكاء المستندات الإصدار 2.0 من المعاينة العامة - قمنا هذا الشهر بتوسيع دعم الخدمة لتضمين معاينة SDK لإصدار Document Intelligence v2.0. استخدم هذه الارتباطات لبدء استخدام اللغة التي تختارها:
- .NET SDK
- Java SDK
- Python SDK
- JavaScript SDK
تدعم SDK الجديدة جميع ميزات واجهة برمجة تطبيقات REST v2.0 ل Document Intelligence. يمكنك مشاركة ملاحظاتك على مكتبات العميل من خلال نموذج ملاحظات SDK.
نسخ نموذج مخصص يمكنك الآن نسخ النماذج بين المناطق والاشتراكات باستخدام ميزة "نسخ نموذج مخصص" الجديدة. قبل استدعاء واجهة برمجة تطبيقات نسخ نموذج مخصص، يجب أولاً الحصول على تخويل للنسخ إلى المورد الهدف. يتم تأمين هذا التخويل عن طريق استدعاء عملية نسخ التخويل مقابل نقطة نهاية المورد الهدف.
انسخ نموذج مخصص لواجهة برمجة تطبيقات REST.
تحسينات الأمان.
تتوفر الآن المفاتيح التي يديرها العميل لـ FormRecognizer. لمزيد من المعلومات، راجع تشفير البيانات الثابتة ل Document Intelligence.
استخدم الهويات المُدارة للوصول إلى موارد Azure باستخدام Azure Active Directory. لمزيد من المعلومات، راجع تخويل الوصول إلى الهويات المُدارة.
مارس 2020
- أنواع القيم للتسمية يمكنك الآن تحديد أنواع القيم التي تقوم بتسميةها باستخدام أداة تسمية نموذج تحليل معلومات المستند. إن أنواع القيم والاختلافات التالية مدعومة حاليًا:
string
- افتراضي،
no-whitespaces
وalphanumeric
- افتراضي،
number
- الافتراضي،
currency
- الافتراضي،
date
- الافتراضي،
dmy
،mdy
،ymd
- الافتراضي،
time
integer
راجع دليل أداة تسمية النموذج لمعرفة كيفية استخدام هذه الميزة.
عرض مصور للجدول تعرض أداة تسمية النموذج الآن الجداول التي تم التعرف عليها في المستند. تتيح لك هذه الميزة عرض الجداول التي تم التعرف عليها واستخراجها من المستند قبل وضع العلامات والتحليل. يمكن تشغيل/إيقاف تشغيل هذه الميزة باستخدام خيار الطبقات.
الصورة التالية هي مثال على كيفية التعرف على الجداول واستخراجها:
تتوفر الجداول المستخرجة في إخراج JSON ضمن
"pageResults"
.هام
جداول التسمية غير مدعومة. إذا لم يتم التعرف على الجداول واستخراجها تلقائيا، يمكنك فقط تسميتها كأزواج مفاتيح/قيمة. عند تسمية الجداول كأزواج قيم المفاتيح، قم بتسمية كل خلية كقيمة فريدة.
تحسينات الاستخراج.
يتضمن هذا الإصدار تحسينات الاستخراج وتحسينات الدقة، على وجه التحديد، إمكانية تسمية واستخراج أزواج قيم المفاتيح المتعددة في نفس سطر النص.
أصبحت أداة تسمية العينة مفتوحة المصدر الآن.
تتوفر الآن أداة تسمية نموذج تحليل معلومات المستند كمشروع مفتوح المصدر. يمكنك دمجه ضمن حلولك وإجراء تغييرات خاصة بالعميل لتلبية احتياجاتك.
لمزيد من المعلومات حول أداة تسمية نموذج معلومات المستند، راجع الوثائق المتوفرة على GitHub.
TLS
1.2 إنفاذ.TLS
يتم الآن فرض 1.2 لجميع طلبات HTTP لهذه الخدمة. لمزيد من المعلومات، راجع أمان خدمات Azure الذكاء الاصطناعي.
2020 يناير
يقدم هذا الإصدار Document Intelligence 2.0. في الأقسام التالية، ستجد المزيد من المعلومات حول الميزات والتحسينات والتغييرات الجديدة.
الميزات الجديدة
نموذج مخصص
- التدريب باستخدام التسميات يمكنك الآن تدريب نموذج مخصص مع بيانات مسماة يدويًا. ينتج عن هذا الأسلوب نماذج ذات أداء أفضل ويمكن أن ينتج نماذج تعمل مع نماذج معقدة أو نماذج تحتوي على قيم بدون مفاتيح.
- واجهة برمجة تطبيقات غير متزامنة يمكنك استخدام استدعاءات واجهة برمجة التطبيقات غير المتزامنة للتدريب باستخدام مجموعات البيانات الكبيرة والملفات وتحليلها.
- دعم ملف TIFF يمكنك الآن التدريب باستخدام البيانات واستخراجها من مستندات TIFF.
- تحسينات دقة الاستخراج.
نموذج إيصال مسبق الإنشاء
- مقدار التلميح يمكنك الآن استخراج مقدار التلميح والقيم الأخرى المكتوبة بخط اليد.
- استخراج عنصر السطر يمكنك استخراج قيم عنصر السطر من الإيصالات.
- قيم الثقة يمكنك عرض ثقة النموذج لكل قيمة مستخرجة.
- تحسينات دقة الاستخراج.
- استخراج التخطيط يمكنك الآن استخدام واجهة برمجة تطبيقات التخطيط لاستخراج بيانات النص وبيانات الجدول من النماذج.
تغييرات واجهة برمجة تطبيقات النموذج المخصص
تتم إعادة تسمية جميع واجهات برمجة التطبيقات للتدريب واستخدام النماذج المخصصة، وأصبحت بعض الأساليب المتزامنة الآن غير متزامنة. فيما يلي التغييرات الرئيسية:
- عملية تدريب نموذج غير متزامنة الآن. يمكنك بدء التدريب من خلال استدعاء واجهة برمجة التطبيقات /custom/models. يقوم هذا الاستدعاء بإرجاع معرف العملية، والذي يمكنك تمريره إلى custom/models/{modelID} لإرجاع نتائج التدريب.
- يتم الآن بدء استخراج المفتاح/القيمة بواسطة استدعاء واجهة برمجة تطبيقات /custom/models/{modelID}/analyze. يقوم هذا الاستدعاء بإرجاع معرف عملية، والذي يمكنك تمريره إلى custom/models/{modelID}/analyzeResults/{resultID} لإرجاع نتائج الاستخراج.
- يتم الآن العثور على معرفات العملية لعملية التدريب في عنوان الموقع لاستجابات HTTP، وليس عنوان موقع العملية.
تغييرات واجهة برمجة تطبيقات الإيصال
تتم إعادة تسمية واجهات برمجة التطبيقات لقراءة إيصالات المبيعات.
يتم الآن بدء استخراج بيانات الإيصال بواسطة استدعاء واجهة برمجة التطبيقات /prebuilt/receipt/analyze. يقوم هذا الاستدعاء بإرجاع معرف عملية، والذي يمكنك تمريره إلى /prebuilt/receipt/analyzeResults/{resultID} لإرجاع نتائج الاستخراج.
تغييرات تنسيق الإخراج
- استجابات JSON لكافة استدعاءات واجهة برمجة التطبيقات لها تنسيقات جديدة. تتم إضافة بعض المفاتيح والقيم أو إزالتها أو إعادة تسميتها. راجع عمليات التشغيل السريع للحصول على أمثلة لتنسيقات JSON الحالية.
الخطوات التالية
حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio.
أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.