الأسئلة المتداولة حول Azure الذكاء الاصطناعي Document Intelligence

ينطبق هذا المحتوى على:علامهv4.0 (معاينة)علامهv3.1 (GA)علامهv3.0 (GA)علامهv2.1 (GA)

المفاهيم العامة

ما هو Azure الذكاء الاصطناعي Document Intelligence، وماذا حدث ل Azure الذكاء الاصطناعي Form Recognizer؟

Azure الذكاء الاصطناعي Document Intelligence هي خدمة مستندة إلى السحابة تستخدم نماذج التعلم الآلي لاستخراج أزواج المفاتيح/القيم والنصوص والجداول من مستنداتك. النتيجة التي تم إرجاعها هي إخراج صيغة JSON منظمة. تتضمن حالات استخدام ذكاء المستند معالجة البيانات التلقائية، والاستراتيجيات المحسنة المستندة إلى البيانات، وقدرات البحث المحسنة في المستندات.

يعد Document Intelligence جزءا من خدمات Azure الذكاء الاصطناعي. تشمل خدمات Azure الذكاء الاصطناعي جميع ما كان يعرف سابقا باسم Azure Cognitive Services وAzure Applied الذكاء الاصطناعي Services.

الاسم السابق ل Document Intelligence كان Azure الذكاء الاصطناعي Form Recognizer. أصبح Form Recognizer رسميا ذكاء المستندات في يوليو 2023.

لا توجد تغييرات على الأسعار. يستمر استخدام الأسماء Cognitive Services و Applied الذكاء الاصطناعي Services في فوترة Azure وتحليل التكلفة وقوائم الأسعار وواجهات برمجة تطبيقات الأسعار.

لا توجد تغييرات فاصلة على واجهات برمجة التطبيقات أو مكتبات العميل (SDKs). تتم إعادة تسمية document intelligenceواجهات برمجة تطبيقات REST وإصدارات SDK 2024-02-29 و2023-10-31-preview والإصدارات الأحدث .

لا تزال بعض الأنظمة الأساسية تنتظر تحديث إعادة التسمية. في وثائق Microsoft، تشير جميع إشارات Form Recognizer و Document Intelligence إلى نفس خدمة Azure.

كيف يرتبط تحليل معلومات المستند الذكاء الاصطناعي إنشاء المستند؟

يمكنك استخدام حل الذكاء الاصطناعي إنشاء المستندات للدردشة مع مستنداتك، وإنشاء محتوى ملفت من تلك المستندات، والوصول إلى نماذج خدمة Azure OpenAI على بياناتك. مع دمج Azure الذكاء الاصطناعي Document Intelligence وAzure OpenAI، يمكنك إنشاء تطبيق مؤسسة للتفاعل بسلاسة مع مستنداتك باستخدام اللغات الطبيعية، والعثور بسهولة على الإجابات واكتساب رؤى قيمة، وإنشاء محتوى جديد وجذاب من مستنداتك الحالية. ابحث عن مزيد من التفاصيل في مدونة المجتمع التقني.

كيف ترتبط ميزة Document Intelligence بالجيل المعزز باسترداد البيانات؟

يعد التقسيم الدلالي خطوة رئيسية في الجيل المعزز باسترداد (RAG) لضمان تخزينه واسترداده بكفاءة. يوفر نموذج تخطيط Document Intelligence حلا شاملا لقدرات استخراج المحتوى المتقدم وتحليل بنية المستند.

باستخدام نموذج التخطيط، يمكنك بسهولة استخراج النص والعناصر الهيكلية لتقسيم النصوص الكبيرة إلى أجزاء أصغر وذات معنى استنادا إلى المحتوى الدلالي بدلا من التقسيمات العشوائية. يمكنك بعد ذلك إخراج المعلومات المستخرجة بسهولة إلى تنسيق Markdown، بحيث يمكنك تحديد استراتيجية التقسيم الدلالي استنادا إلى كتل الإنشاء المقدمة. ابحث عن مزيد من التفاصيل في نظرة عامة على RAG في Document Intelligence.

ما هي حالات استخدام ذكاء المستند التي تتطلب اعتبارات خاصة؟

ادرس بعناية مشاريع معالجة المستندات التي تشمل البيانات المالية أو البيانات الصحية المحمية أو البيانات الشخصية أو البيانات الحساسة للغاية.

تأكد من الامتثال لجميع المتطلبات الوطنية/الإقليمية والمتطلبات الخاصة بالصناعة.

ما هي اللغات التي يدعمها Document Intelligence؟

تدعم النماذج العالمية المستندة إلى التعلم العميق في Document Intelligence العديد من اللغات التي يمكنها استخراج نص متعدد اللغات من الصور والمستندات، بما في ذلك خطوط النص باللغات المختلطة.

يختلف دعم اللغة حسب وظيفة خدمة Document Intelligence. للحصول على قائمة كاملة بالنص المكتوب بخط اليد والمطبوع الذي يدعمه Document Intelligence، راجع دعم اللغة.

هل يتوفر Document Intelligence في منطقة Azure؟

يتوفر Document Intelligence بشكل عام في العديد من مناطق البنية الأساسية العالمية ل Azure التي تبلغ أكثر من 60 منطقة.

اختر المنطقة الأفضل لك ولزبائنك.

هل يتكامل Document Intelligence مع خدمات Microsoft الأخرى؟

"نعم، يتكامل Document Intelligence مع الخدمات التالية:"

كيف يرتبط Document Intelligence بالتعرف البصري على الأحرف؟

Document Intelligence هي خدمة مستندة إلى السحابة تتضمن التعرف البصري على الحروف (OCR) وتحليلات النص وتصنيف النص المخصص من خدمات Azure الذكاء الاصطناعي.

يستخدم Document Intelligence التعرف البصري على الحروف (OCR) للكشف عن المعلومات واستخراجها من المستندات النصية المكتوبة بخط اليد والمحرفة التي تدعمها الذكاء الاصطناعي لتوفير المزيد من البنية والمعلومات لاستخراج النص.

كم من الوقت يتوفر النموذج المخصص للاستخدام؟

يحتوي النموذج على نفس دورة حياة إصدار واجهة برمجة التطبيقات الذي تستخدمه لتدريبه. النماذج المخصصة المدربة مع إصدار التوفر العام (GA) من واجهة برمجة التطبيقات لها نفس دورة حياة إصدار واجهة برمجة التطبيقات. عند إهمال إصدار واجهة برمجة التطبيقات، لم يعد النموذج متاحا للاستدلال. تتمتع النماذج المدربة باستخدام إصدار معاينة من واجهة برمجة التطبيقات أيضا بنفس دورة حياة واجهة برمجة تطبيقات المعاينة.

توقع إهمال واجهة برمجة تطبيقات المعاينة في غضون ثلاثة أشهر من إصدار واجهة برمجة تطبيقات المعاينة المحدثة أو إصدار واجهة برمجة تطبيقات GA الأحدث.

ما هي درجة الدقة، وكيف يتم حسابها؟

يتضمن إخراج build عملية النموذج المخصص (الإصدار 3.0 والإصدارات الأحدث) أو train (v2.1) درجة الدقة المقدرة. تمثل هذه النتيجة قدرة النموذج على التنبؤ بدقة بالقيمة المسماة في مستند مشابه بصرياً.

يتم قياس الدقة ضمن نطاق قيمة نسبة مئوية من 0٪ (منخفض) إلى 100٪ (مرتفع).

لمزيد من المعلومات، راجع درجات الدقة والثقة.

كيف يمكنني تحسين درجات الدقة؟

يمكن أن تؤثر التباينات في البنية المرئية لمستنداتك على دقة النموذج. إليك بعض النصائح:

  • قم بتضمين كافة تباينات المستند في مجموعة بيانات التدريب. تتضمن التباينات تنسيقات مختلفة؛ على سبيل المثال، ملفات PDF الرقمية مقابل ملفات PDF الممسوحة ضوئيا.

  • افصل أنواع المستندات المميزة بصرياً وتدريب نماذج مختلفة.

  • تأكد من عدم وجود تسميات غريبة.

  • بالنسبة إلى التوقيع وتسمية المنطقة، لا تقم بتضمين النص المحيط.

لمزيد من المعلومات، راجع درجات الدقة والثقة.

ما هي درجة الثقة، وكيف يتم حسابها؟

تشير درجة الثقة إلى الاحتمال عن طريق قياس درجة اليقين الإحصائي التي تم اكتشاف النتيجة المستخرجة بشكل صحيح.

نطاق قيمة الثقة هو نسبة مئوية من 0٪ (منخفض) إلى 100٪ (مرتفع). من الأفضل استهداف درجة 80٪ أو أعلى. بالنسبة للحالات الأكثر حساسية، مثل السجلات المالية أو الطبية، نوصي بنقاط قريبة من 100٪. يمكنك أيضا طلب مراجعة بشرية.

لمزيد من المعلومات، راجع درجات الدقة والثقة.

كيف يمكنني تحسين درجات الثقة؟

بعد عملية التحليل، راجع إخراج JSON. فحص confidence القيم لكل نتيجة مفتاح/قيمة تحت pageResults العقدة. يجب عليك أيضاً أن تنظر إلى درجة الثقة في readResults العقدة، والتي تتوافق مع عملية قراءة النص. لا تؤثر ثقة نتائج القراءة على ثقة نتائج استخراج المفتاح/القيمة، لذلك يجب عليك التحقق من كليهما. إليك بعض النصائح:

  • إذا كانت درجة الثقة للهدف readResults منخفضة، فقم بتحسين جودة مستندات الإدخال.

  • إذا كانت درجة الثقة للكائن pageResults منخفضة، فتأكد من أن المستندات التي تقوم بتحليلها من نفس النوع.

  • ضع في اعتبارك دمج المراجعة البشرية في مهام سير العمل الخاصة بك.

  • استخدم النماذج التي تحتوي على قيم مختلفة في كل حقل.

  • بالنسبة للنماذج المخصصة، استخدم مجموعة أكبر من مستندات التدريب. وضع علامات على المزيد من المستندات يعلم النموذج الخاص بك التعرف على الحقول بدقة أكبر.

لمزيد من المعلومات، راجع درجات الدقة والثقة.

ما هو المربع المحيط؟

المربع المحيط (polygon في الإصدار 3.0 والإصدارات الأحدث) هو مستطيل مجرد يحيط بعناصر النص في مستند أو نموذج. يتم استخدامه كنقطة مرجعية للكشف عن الأهداف.

يحدد المربع المحيط الموضع باستخدام مستوى الإحداثيات x وy المقدم في صفيف مكون من أربعة أزواج رقمية. يمثل كل زوج زاوية من المربع بالترتيب التالي: أعلى اليسار، أعلى اليمين، أسفل اليمين، أسفل اليسار.

بالنسبة للصورة، تكون الإحداثيات بالبكسل. بالنسبة إلى ملف PDF، تكون الإحداثيات بالبوصة.

هل يمكن ل Document Intelligence مساعدتي في تصنيف المستندات؟

يوفر Document Intelligence نماذج تصنيف مخصصة يمكنها تحليل مستندات ذات ملف واحد أو ملفات متعددة لتحديد ما إذا كان ملف الإدخال يحتوي على أي من أنواع المستندات المدربة. تدعم الخدمة السيناريوهات التالية:

  • ملف واحد يحتوي على نوع مستند واحد، مثل نموذج طلب قرض.

  • ملف واحد يحتوي على مستندات متعددة. مثال على ذلك هو حزمة طلب قرض تحتوي على نموذج طلب قرض و payslip و كشف حساب بنكي.

  • ملف واحد يحتوي على مثيلات متعددة لنفس المستند. مثال على ذلك هو مجموعة من الفواتير الممسوحة ضوئيا.

لمزيد من المعلومات، راجع نظرة عامة على نماذج التصنيف المخصصة.

Document Intelligence Studio

ما هي الأذونات التي أحتاجها للوصول إلى Document Intelligence Studio؟

تحتاج إلى حساب Azure نشط واشتراك مع دور قارئ على الأقل للوصول إلى Document Intelligence Studio.

لتحليل المستندات والنماذج التي تم إنشاؤها مسبقا، فيما يلي متطلبات الدور لسيناريوهات المستخدم:

  • أساسي

  • خيارات متقدمة

    • المساهم: تحتاج إلى هذا الدور لإنشاء مجموعة موارد أو مورد تحليل معلومات المستند. لا يسمح لك دور المساهم بإدراج مفاتيح الخدمات المعرفية ولا يمنحك حق الوصول لاستخدام الموارد أو التخزين التي تم إنشاؤها، بل يسمح فقط للمستخدم بقراءة/كتابة المورد نفسه. لاستخدام Document Intelligence Studio، لا تزال بحاجة إلى دور مستخدم الخدمات المعرفية.

بالنسبة لمشاريع النموذج المخصص، فيما يلي متطلبات الدور لسيناريوهات المستخدم:

  • أساسي

    • مستخدم الخدمات المعرفية: تحتاج إلى هذا الدور لمورد ذكاء المستند أو الخدمات المعرفية متعددة الخدمات لقراءة/كتابة البيانات وهو مطلوب لاستدعاء واجهة برمجة التطبيقات. هذا الدور هو أيضا الحد الأدنى اللازم لتدريب نموذج مخصص أو التحليل باستخدام نماذج مدربة.

    • Storage Blob Data Contributor: تحتاج إلى هذا الدور لحساب تخزين لإنشاء بيانات المشروع والتسمية.

  • خيارات متقدمة

    • مساهم حساب التخزين: تحتاج إلى هذا الدور لحساب التخزين لإعداد إعدادات مشاركة الموارد عبر المنشأ (CORS). إنه جهد لمرة واحدة إذا قمت بإعادة استخدام نفس حساب التخزين.

      لا يسمح لك دور المساهم بالوصول إلى البيانات في الكائن الثنائي كبير الحجم. لاستخدام Document Intelligence Studio، لا تزال بحاجة إلى دور Storage Blob Data Contributor.

    • المساهم: تحتاج إلى هذا الدور لإنشاء مجموعة موارد وموارد. لا يمنحك دور المساهم حق الوصول لاستخدام الموارد أو التخزين الذي تم إنشاؤه، بل يسمح فقط للمستخدم بقراءة/كتابة المورد نفسه. لاستخدام Document Intelligence Studio، لا تزال بحاجة إلى الأدوار الأساسية.

لمزيد من المعلومات، راجع الأدوار المضمنة في Microsoft Entra والأقسام حول تعيينات أدوار Azure في التشغيل السريع ل Document Intelligence Studio.

لدي صفحات متعددة في مستند. لماذا يتم تحليل صفحتين فقط في Document Intelligence Studio؟

بالنسبة لموارد الطبقة الحرة (F0)، يتم تحليل أول صفحتين فقط سواء كنت تستخدم Document Intelligence Studio أو REST API أو SDKs.

في Document Intelligence Studio، حدد زر الإعدادات (الترس)، وحدد علامة التبويب Resources، وتحقق من مستوى السعر الذي تستخدمه لتحليل المستندات. إذا كنت تريد تحليل كافة الصفحات في مستند، فقم بالتغيير إلى مورد مدفوع (S0).

كيف يمكنني تغيير الدلائل أو الاشتراكات في Document Intelligence Studio؟

لتغيير دليل في Document Intelligence Studio، حدد زر الإعدادات (الترس). ضمن Directory، حدد الدليل من القائمة، ثم حدد Switch Directory. تتم مطالبتك بتسجيل الدخول مرة أخرى بعد تبديل الدليل.

لتغيير اشتراك أو مورد، انتقل إلى علامة التبويب Resource ضمن الإعدادات.

لماذا أتلقى خطأ تخزين على مشاركة مشروع أو تسمية تلقائية أو عملية ترقية التعرف البصري على الحروف عند تكوين مورد حساب التخزين الخاص بي باستخدام جدار حماية أو شبكة ظاهرية؟

لماذا أتلقى الخطأ "تم رفض الوصول بسبب قواعد الشبكة الظاهرية/جدار الحماية" في عملية تسمية تلقائية أو عملية ترقية التعرف البصري على الحروف عند تكوين مورد تحليل معلومات المستند الخاص بي باستخدام جدار حماية أو شبكة ظاهرية؟

تحتاج إلى إضافة عنوان IP المخصص 20.3.165.95 إلى قائمة السماح لجدار الحماية لمورد Document Intelligence.

هل يمكنني إعادة استخدام تجربة التسمية أو تخصيصها من Document Intelligence Studio وبنائه في تطبيقي الخاص؟

نعم. يتم مصدر مفتوح تجربة التسمية من Document Intelligence Studio في مستودع Toolkit.

لماذا أتلقى الخطأ "لم يتم العثور على Form Recognizer" عند فتح مشروعي المخصص؟

تم حذف مورد Document Intelligence المرتبط بهذا المشروع المخصص أو نقله إلى مجموعة موارد أخرى. هناك طريقتان لحل هذه المشكلة:

  • أعد إنشاء مورد Document Intelligence ضمن نفس الاشتراك ومجموعة الموارد بنفس الاسم.

  • أعد إنشاء مشروع مخصص باستخدام مورد Document Intelligence الذي تم ترحيله وحدد نفس حساب التخزين.

هل هناك نقاط نهاية URL منفصلة لمناطق السحابة ذات السيادة ل Document Intelligence؟

"نعم. يحتوي Document Intelligence Studio على نقاط نهاية URL منفصلة لمناطق السحابة السيادية:"

تطوير التطبيق

ما هي خيارات التطوير ل Document Intelligence؟

يقدم Document Intelligence أحدث خيارات التطوير ضمن الأنظمة الأساسية التالية:

أين يمكنني العثور على إصدار واجهة برمجة التطبيقات المدعوم لأحدث حزم تطوير برمجيات SDK للغة البرمجة؟

يوفر هذا الجدول ارتباطات إلى أحدث إصدارات SDK ويعرض العلاقة بين إصدارات SDK لذكاء المستند المدعومة وواجهة برمجة التطبيقات:

مرجع Azure SDK للغة المدعومة إصدارات واجهة برمجة التطبيقات المعتمدة
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
معاينة 2023-10-31
v3.0
v2.1
v2.0

لمزيد من المعلومات، راجع العملاء المعتمدين ل v4.0 والعملاء المعتمدين ل v3.1.

ما الفرق بين Document Intelligence v3.0 وv2.1، وكيف يمكنني الترحيل إلى أحدث إصدار؟

لتحسين قابلية الاستخدام، يقدم Document Intelligence v3.0 مكتبة عميل معاد تصميمها بالكامل. لاستخدام أحدث ميزات واجهة برمجة تطبيقات ذكاء المستند بنجاح، تحتاج إلى أحدث SDK، ويجب تحديث التعليمات البرمجية للتطبيق الخاص بك لاستخدام العملاء الجدد.

يوفر هذا الجدول ارتباطات إلى إرشادات مفصلة للترحيل إلى أحدث إصدار من Document Intelligence:

اللغة/واجهة برمجة التطبيقات دليل الترحيل
واجهة برمجة تطبيقات REST الإصدار 3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

ما تنسيقات الملفات التي يدعمها Document Intelligence؟ هل هناك قيود على حجم مستندات الإدخال؟

للحصول على أفضل النتائج، راجع متطلبات الإدخال.

كيف يمكنني تحديد مجموعة من الصفحات التي سيتم تحليلها في مستند؟

استخدم المعلمة pages (المدعومة في الإصدار 2.1 وv3.0 والإصدارات الأحدث من واجهة برمجة تطبيقات REST) لتحديد صفحات لمستندات PDF وTIFF متعددة الصفحات. يتضمن الإدخال المقبول النطاقات التالية:

  • صفحات مفردة. على سبيل المثال، إذا قمت بتحديد 1, 2، تتم معالجة الصفحتين 1 و2.
  • نطاقات محدودة. على سبيل المثال، إذا قمت بتحديد 2-5، تتم معالجة الصفحات من 2 إلى 5.
  • نطاقات مفتوحة. على سبيل المثال، إذا قمت بتحديد 5-، تتم معالجة جميع الصفحات من الصفحة 5. إذا قمت بتحديد -10، تتم معالجة الصفحات من 1 إلى 10.

يمكنك مزج هذه المعلمات معا، ويمكن أن تتداخل النطاقات. على سبيل المثال، إذا قمت بتحديد -5, 1, 3, 5-10، تتم معالجة الصفحات من 1 إلى 10.

تقبل الخدمة الطلب إذا كان يمكنها معالجة صفحة واحدة على الأقل من المستند. على سبيل المثال، يعد استخدام 5-100 مستند من خمس صفحات إدخالا صالحا يعني معالجة الصفحة 5.

إذا لم توفر نطاق صفحات، تتم معالجة المستند بأكمله.

يتوفر كل من Document Intelligence Studio وأداة تسمية نموذج FOTT. أي حزم تطوير برمجيات SDK ينبغي لي استخدامها؟

في معظم الأحيان، نوصي ب Document Intelligence Studio لأنه يمكن أن يقلل من وقتك لتكوين موارد Document Intelligence وخدمات التخزين.

ضع في اعتبارك استخدام أداة اختبار التعرف البصري على الحروف للنموذج (FOTT) للسيناريوهات التالية:

  • يجب أن تظل البيانات الخاصة بك داخل جهاز واحد. استخدم أداة تسمية نموذج FOTT وحاوية تحليل معلومات المستند.

  • يعتمد مشروعك بشكل كبير على Document Intelligence v2.1، وتريد الاستمرار في استخدام واجهات برمجة التطبيقات v2.1.

حدود الخدمة والتسعير

هل إصدار واجهة برمجة تطبيقات REST للذكاء المستندي 2024-02-29 متوفر في منطقتي؟

يتوفر إصدار REST API 2024-02-29-preview في المناطق التالية:

  • شرق الولايات المتحدة
  • غرب الولايات المتحدة2
  • أوروبا الغربية

كيف يحسب Azure سعر استخدام Document Intelligence؟

يتم حساب فوترة تحليل معلومات المستند شهريا استنادا إلى نوع النموذج وعدد الصفحات التي تم تحليلها. فيما يلي بعض التفاصيل:

  • عند إرسال مستند للتحليل، تحلل الخدمة جميع الصفحات ما لم تحدد نطاق صفحات باستخدام المعلمة pages في طلبك. عندما تحلل الخدمة مستندات Microsoft Excel وPowerPoint من خلال نموذج القراءة أو التعرف البصري على الحروف أو التخطيط، فإنها تحسب كل ورقة عمل Excel وشريحة PowerPoint كصفحة واحدة.

  • عندما تحلل الخدمة ملفات PDF وTIFF، فإنها تحسب كل صفحة في ملف PDF أو كل صورة في ملف TIFF كصفحة واحدة بدون حدود للأحرف القصوى.

  • عندما تحلل الخدمة ملفات Microsoft Word وHTML التي تدعمها نماذج القراءة والتخطيط، فإنها تحسب الصفحات في كتل من 3000 حرف لكل منهما. على سبيل المثال، إذا كان المستند يحتوي على 7000 حرف، فإن الصفحتين المكونتين من 3000 حرف لكل منهما وصفحة واحدة تحتوي على 1000 حرف تضيف ما يصل إلى ثلاث صفحات.

  • عندما تستخدم نموذج القراءة أو التخطيط لتحليل ملفات Microsoft Word وExcel وPowerPoint وHTML، لا يتم دعم الصور المضمنة أو المرتبطة. لذلك لا تحسبها الخدمة كصور مضافة.

  • تدريب نموذج مخصص مجاني دائما باستخدام Document Intelligence. يتم تحصيل رسوم منك فقط عندما تستخدم الخدمة نموذجا لتحليل مستند.

  • تسعير الحاوية هو نفس تسعير الخدمة السحابية.

  • يوفر Document Intelligence طبقة مجانية (F0) حيث يمكنك اختبار جميع ميزات Document Intelligence.

  • يحتوي Document Intelligence على نموذج تسعير قائم على الالتزام لأحمال العمل الكبيرة.

تعرف على المزيد حول خيارات تسعير Azure الذكاء الاصطناعي Document Intelligence.

كيف يمكنني التحقق من استخدام ذكاء المستند وتقدير السعر؟

يمكنك العثور على مقاييس الاستخدام على لوحة معلومات المقاييس في مدخل Microsoft Azure. تعرض لوحة المعلومات عدد الصفحات التي الذكاء الاصطناعي Azure Document Intelligence. يمكنك التحقق من التكلفة المقدرة التي تم إنفاقها على المورد باستخدام حاسبة تسعير Azure. للحصول على إرشادات مفصلة، راجع التحقق من الاستخدام وتقدير التكلفة.

ما هي أفضل الممارسات للتخفيف من التقييد؟

يستخدم Document Intelligence التحجيم التلقائي لتوفير الموارد الحسابية المطلوبة عند الطلب، مع الحفاظ على انخفاض تكاليف العملاء. للتخفيف من التقييد خلال التحجيم التلقائي، نوصي باتباع النهج التالي:

  • تنفيذ منطق إعادة المحاولة في التطبيق الخاص بك.

  • إذا وجدت أنك مقيد بعدد POST الطلبات، ففكر في إضافة تأخير بين الطلبات.

  • زيادة حمل العمل تدريجيًا. تجنب التغييرات الحادة.

  • إنشاء طلب دعم لزيادة حد المعاملات في الثانية (TPS).

تعرف على المزيد حول الحصص النسبية وحدود خدمة Document Intelligence.

كم من الوقت يستغرق تحليل مستند؟

يعتمد وقت تحليل المستند على الحجم (على سبيل المثال، عدد الصفحات) والمحتوى المتعلق في كل صفحة.

Document Intelligence هي خدمة متعددة المستأجرين حيث يكون زمن الانتقال للمستندات المماثلة قابلا للمقارنة ولكنه ليس متطابقا دائما. زمن الانتقال هو مقدار الوقت الذي يستغرقه خادم واجهة برمجة التطبيقات للتعامل مع طلب وارد ومعالجته وتسليم الاستجابة الصادرة للعميل. يعد التغير العرضي في زمن الانتقال والأداء متأصلا في أي خدمة مستندة إلى الخدمات المصغرة عديمة الحالة وغير متزامنة تعالج الصور والمستندات الكبيرة على نطاق واسع.

على الرغم من أننا نعمل باستمرار على زيادة حجم الأجهزة والسعة وقدرات التحجيم، فقد لا تزال تواجه مشكلات في زمن الانتقال في وقت التشغيل.

النماذج المخصصة

كيف أقوم بتجميع أفضل بيانات التدريب؟

عند استخدام نموذج Document Intelligence المخصص، فإنك توفر بيانات التدريب الخاصة بك. فيما يلي بعض النصائح للمساعدة في تدريب النماذج الخاصة بك بشكل فعال:

  • استخدم ملفات PDF التي تحتوي على نص بدلاً من ملفات PDF التي تحتوي على الصور عندما يكون ذلك ممكناً. تتمثل إحدى طرق تحديد ملف PDF القائم على الصور في محاولة تحديد نص معين في المستند. إذا كان بإمكانك تحديد الصورة الكاملة للنص فقط، فإن المستند يستند إلى صورة وليس مستندا إلى نص.

  • يمكنك تنظيم مستندات التدريب باستخدام مجلد فرعي لكل تنسيق (JPEG/JPG، أو PNG، أو BMP، أو PDF، أو TIFF).

  • استخدم النماذج التي تحتوي على جميع الحقول المتوفرة المكتملة.

  • استخدم النماذج ذات القيم المختلفة في كل حقل.

  • إذا كانت صورك منخفضة الجودة، فاستخدم مجموعة بيانات أكبر (أكثر من خمسة مستندات تدريبية).

تعرف على المزيد حول إنشاء مجموعة بيانات تدريب.

ما هي أفضل الممارسات لتدريب نموذج مخصص عالي الدقة؟

يعتمد مستوى الدقة لنموذجك على جودة مواد التدريب الخاصة بك. إليك بعض النصائح:

  • حدد ما إذا كنت بحاجة إلى استخدام نموذج واحد أو نماذج متعددة مكونة في نموذج واحد.

  • يمكن أن تنخفض دقة النموذج عندما تكون لديك تنسيقات مختلفة تم تحليلها باستخدام نموذج واحد. خطط لتقسيم مجموعة البيانات إلى مجلدات، حيث يكون كل مجلد قالباً فريداً. تدريب نموذج واحد لكل مجلد، وإنشاء النماذج الناتجة في نقطة نهاية واحدة.

  • تعتمد النماذج المخصصة على قالب مرئي متناسق. إذا كان النموذج يحتوي على تباينات ذات تنسيقات وفواصل صفحات، ففكر في تقسيم مجموعة البيانات لتدريب نماذج متعددة.

  • تأكد من أن لديك مجموعة بيانات متوازنة عن طريق محاسبة التنسيقات وأنواع المستندات والبنية.

تعرف على المزيد بشأن النماذج المركبة.

هل يمكنني إعادة تدريب نموذج مخصص؟

لا يحتوي تحليل معلومات المستند على عملية إعادة تدريب صريحة. تنشئ كل عملية تدريب نموذجاً جديداً.

إذا وجدت أن نموذجك يحتاج إلى إعادة التدريب، أضف المزيد من العينات إلى مجموعة بيانات التدريب الخاصة بك وقم بتدريب نموذج جديد.

كم عدد النماذج المخصصة التي يمكنني إنشاؤها في نموذج مخصص واحد؟

باستخدام عملية إنشاء النموذج، يمكنك تعيين ما يصل إلى 200 نموذج إلى معرف نموذج واحد. عند إجراء Analyze Document الطلب باستخدام معرف نموذج مكون، يقوم Document Intelligence بتصنيف النموذج المرسل واختيار أفضل نموذج وإرجاع النتائج. تتوفر خدمة Model Compose حالياً فقط للنماذج المخصصة المدربة باستخدام التسميات.

يعد تحليل مستند باستخدام نماذج مكونة مماثلا لتحليل مستند باستخدام نموذج واحد. ترجع Analyze DocumentdocType النتيجة خاصية تشير إلى أي من نماذج المكونات التي حددتها لتحليل المستند. لا يوجد تغيير في التسعير لتحليل مستند باستخدام نموذج مخصص فردي أو نموذج مخصص مكون.

تعرف على المزيد بشأن النماذج المركبة.

إذا تجاوز عدد النماذج التي أريد إنشاءها الحد الأعلى للنموذج المكون، فما هي البدائل؟

يمكنك استخدام أحد هذه البدائل:

  • قم بتصنيف المستندات قبل استدعاء النموذج المخصص. يمكنك استخدام نموذج القراءة وإنشاء تصنيف استنادا إلى النص المستخرج من المستندات وعبارات معينة باستخدام مصادر مثل التعليمات البرمجية أو التعبيرات العادية أو البحث.

  • إذا كنت ترغب في استخراج نفس الحقول من مختلف المستندات المنظمة وشبه المنظمة وغير المنظمة، ففكر في استخدام النموذج العصبي المخصص للتعلم العميق. تعرف على المزيد حول الاختلافات بين نموذج القالب المخصص والنموذج العصبي المخصص.

كيف أقوم بتحسين نموذج يتجاوز التدريب الأول؟

تنشئ كل عملية تدريب نموذجا جديدا.

  1. إنشاء مجموعة بيانات للقالب الجديد.

  2. تسمية نموذج جديد وتدريبه.

  3. تحقق من أن النموذج الجديد يعمل بشكل جيد بالنسبة إلى أنواع المستندات المحددة.

  4. قم بإنشاء النموذج الجديد الخاص بك مع النموذج الموجود في نقطة نهاية واحدة. يمكن ل Document Intelligence بعد ذلك تحديد أفضل نموذج لكل مستند ليتم تحليله.

تعرف على المزيد بشأن النماذج المركبة.

أنا أقوم ببناء نموذج مخصص. ما الذي ترجعه تسمية الكشف عن التوقيع؟

يبحث الكشف عن التوقيع عن وجود توقيع، وليس هوية الشخص الذي يوقع على المستند.

إذا قام النموذج بإرجاع غير موقع للكشف عن التوقيع، فلن يعثر النموذج على توقيع في الحقل المحدد.

ما الذي يجب مراعاته وما هي أفضل الممارسات لاستخراج الجداول من المستندات؟

يمكنك البدء بنموذج تخطيط Document Intelligence لاستخراج النصوص والجداول وعلامات التحديد ومعلومات البنية من المستندات والصور. يمكنك أيضاً مراعاة العوامل التالية:

  • هل البيانات التي تريد استخراجها مقدمة كجدول، هل بنية الجدول ذات معنى؟

  • إذا لم تكن البيانات بتنسيق جدول، هل يمكن احتواء البيانات في شبكة ثنائية الأبعاد؟

  • هل تمتد الجداول على صفحات متعددة؟ إذا كان الأمر كذلك، لتجنب الاضطرار إلى تسمية جميع الصفحات، قم بتقسيم ملف PDF إلى صفحات قبل إرساله إلى Document Intelligence. بعد التحليل، قم بمعالجة الصفحات إلى جدول واحد بعد ذلك.

  • إذا كنت تقوم بإنشاء نماذج مخصصة، فراجع التسمية كجداول. تحتوي الجداول الديناميكية على عدد متغير من الصفوف لكل عمود. تحتوي الجداول الثابتة على عدد ثابت من الصفوف لكل عمود.

كيف يمكنني نقل نماذجي المدربة من بيئة (مثل بيتا) إلى أخرى (مثل الإنتاج)؟

يمكنك استخدام Copy API لنسخ نماذج مخصصة من حساب Document Intelligence واحد إلى حسابات أخرى موجودة في أي منطقة جغرافية مدعومة. للحصول على إرشادات مفصلة، راجع التعافي من الكوارث.

تقتصر عملية النسخ على نسخ النماذج داخل بيئة سحابية معينة حيث قمت بتدريب النموذج. على سبيل المثال، نسخ النماذج من السحابة العامة إلى سحابة Azure Government غير مدعوم.

لماذا تم تحصيل رسوم مني مقابل التخطيط عند تشغيل التدريب المخصص؟

التخطيط مطلوب لإنشاء تسميات لمجموعة البيانات الخاصة بك. إذا لم تتوفر ملفات تسمية لمجموعة البيانات التي تستخدمها للتدريب المخصص، فإن الخدمة تنشئها لك.

حساب التخزين

تمكنت من الوصول إلى حساب التخزين الخاص بي قبل بضعة أيام. لماذا أواجه الآن مشكلة في إعادة الاتصال؟

عند إنشاء توقيع وصول مشترك، تكون المدة الافتراضية 48 ساعة. بعد 48 ساعة، تحتاج إلى إنشاء رمز مميز جديد.

ضع في اعتبارك تعيين فترة مدة أطول للوقت الذي تستخدم فيه حساب التخزين الخاص بك مع Document Intelligence.

إذا كان حساب التخزين الخاص بي خلف شبكة ظاهرية أو جدار حماية، فكيف يمكنني منح Document Intelligence حق الوصول إلى البيانات؟

إذا كان لديك حساب تخزين Azure محمي بواسطة شبكة ظاهرية أو جدار حماية، فلا يمكن ل Document Intelligence الوصول مباشرة إلى حساب التخزين الخاص بك. ومع ذلك، يدعم الوصول إلى حساب تخزين Azure الخاص والمصادقة الهويات المدارة لموارد Azure. عند استخدام هوية مدارة، يمكن لخدمة Document Intelligence الوصول إلى حساب التخزين الخاص بك باستخدام بيانات اعتماد معينة.

إذا كنت تنوي تحليل بيانات حساب التخزين الخاص بك باستخدام FOTT، يجب نشر الأداة خلف الشبكة الظاهرية أو جدار الحماية.

تعرف على كيفية إنشاء هوية مدارة واستخدامها لمورد Document Intelligence.

الحاويات

هل أحتاج إلى اتصال بالإنترنت لاستخدام حاويات Document Intelligence؟

نعم. تتطلب حاويات معلومات المستند اتصالا بالإنترنت لإرسال معلومات الفوترة إلى Azure. تعرف على المزيد بشأن Azure Container Registry.

ما الفرق بين الحاويات غير المتصلة وغير المتصلة؟

ترسل الحاويات الاتصال معلومات الفوترة إلى Azure باستخدام مورد Document Intelligence على حساب Azure الخاص بك. مع الحاويات المتصلة، يلزم الاتصال بالإنترنت لإرسال معلومات الفوترة إلى Azure.

تمكنك الحاويات غير المتصلة من استخدام واجهات برمجة التطبيقات غير المتصلة بالإنترنت. لا يتم إرسال معلومات الفوترة عبر الإنترنت. بدلا من ذلك، يتم تحصيل رسوم منك استنادا إلى مستوى التزام تم شراؤه. حاليا، يتوفر استخدام الحاوية غير المتصلة لنماذج الفاتورة المخصصة ونموذج تحليل معلومات المستند.

قدرات النموذج المتوفرة في الحاويات المتصلة وغير المتصلة هي نفسها ويتم دعمها بواسطة Document Intelligence v2.1.

ما هي البيانات التي ترسلها الحاويات المتصلة إلى السحابة؟

ترسل الحاويات المتصلة ب Document Intelligence معلومات الفوترة إلى Azure باستخدام مورد Document Intelligence على حساب Azure الخاص بك. لا ترسل الحاويات المتصلة بيانات العملاء، مثل الصورة أو النص الذي يتم تحليله، إلى Microsoft.

للحصول على مثال على المعلومات التي ترسلها الحاويات المتصلة إلى Microsoft للفوترة، راجع الأسئلة المتداولة حول حاوية Azure الذكاء الاصطناعي.

لماذا أتلقى الخطأ "الحاوية ليست في حالة صالحة. فشل التحقق من صحة الاشتراك مع أن مفتاح واجهة برمجة تطبيقات الحالة 'OutOfQuota' خارج الحصة النسبية"؟

ترسل الحاويات المتصلة ب Document Intelligence معلومات الفوترة إلى Azure باستخدام مورد Document Intelligence على حساب Azure الخاص بك. يمكنك الحصول على هذه الرسالة إذا تعذر على الحاويات الاتصال بنقطة نهاية الفوترة.

هل يمكنني استخدام التخزين المحلي لحاوية Document Intelligence Sample Labeling Tool (FOTT)؟

يحتوي نموذج أداة اختبار التعرف البصري على الحروف على إصدار يستخدم التخزين المحلي. يجب تثبيت الإصدار على جهاز ويندوز. يمكنك تثبيته من هذا الموقع.

في صفحة المشروع، حدد مجلد التسمية URI ك /shared أو /shared/sub-dir إذا كانت ملفات التسمية الخاصة بك في دليل فرعي. جميع سلوك أداة تسمية نموذج معلومات المستند الأخرى هو نفس الخدمة المستضافة.

ما هي أفضل الممارسات لتوسيع النطاق؟

بالنسبة للمكالمات غير المتزامنة، يمكنك تشغيل حاويات متعددة مع تخزين مشترك. تخزن الحاوية POST التي تعالج استدعاء التحليل الإخراج في التخزين. بعد ذلك، يمكن لأي حاوية أخرى إحضار النتائج من التخزين وخدمة GET المكالمات. معرف الطلب غير مرتبط بحاوية.

بالنسبة للمكالمات المتزامنة، يمكنك تشغيل حاويات متعددة، ولكن حاوية واحدة فقط تخدم طلبا. نظرا لأنه استدعاء حظر، يمكن لأي حاوية من التجمع تقديم الطلب وإرسال الاستجابة. هنا، ترتبط حاوية واحدة فقط بطلب في كل مرة، ولا يلزم إجراء أي استقصاء.

كيف يمكنني إعداد حاويات مع تخزين مشترك؟

تستخدم الحاويات الخاصية Mounts:Shared أثناء البدء لتحديد التخزين المشترك لتخزين ملفات المعالجة. لمشاهدة استخدام هذه الخاصية، راجع وثائق الحاويات.

الأمان والخصوصية

ما هي أساليب ومتطلبات مصادقة الطلبات إلى خدمات Azure الذكاء الاصطناعي؟

يجب أن يتضمن كل طلب إلى خدمة Azure عنوان مصادقة. يمكنك مصادقة طلب باستخدام عدة طرق:

هل يخزن Document Intelligence بياناتي؟

بالنسبة لجميع الميزات، يخزن Document Intelligence البيانات مؤقتا وينتج عن ذلك تخزين Azure في نفس المنطقة مثل الطلب. ثم يتم حذف بياناتك في غضون 24 ساعة من الوقت الذي ترسل فيه طلب تحليل.

تعرف على المزيد حول البيانات والخصوصية والأمان ل Document Intelligence.

كيف يتم تخزين نماذجي المخصصة المدربة واستخدامها في Document Intelligence؟

يتم تخزين المخرجات المؤقتة بعد التحليل والتسمية في نفس موقع تخزين Azure حيث تقوم بتخزين بيانات التدريب الخاصة بك. يتم تخزين النماذج المخصصة المدربة في Azure Storage في نفس المنطقة، ويتم عزلها منطقيا مع اشتراك Azure وبيانات اعتماد واجهة برمجة التطبيقات.

مزيد من المساعدة والدعم

أين يمكنني العثور على مزيد من الحلول لأسئلة Azure الذكاء الاصطناعي Document Intelligence؟

Microsoft Q&A هو الصفحة الرئيسية للأسئلة والأجوبة التقنية في Microsoft. يمكنك تصفية الاستعلامات الخاصة ب Document Intelligence.

ماذا يجب أن أفعل إذا لم تتعرف الخدمة على نص معين، أو تتعرف عليه بشكل غير صحيح، عندما أقوم بتسمية المستندات؟

نقوم باستمرار بتحديث نموذج التعرف البصري على الحروف للمعلومات المستندية وتحسينه. يمكنك إرسال بريد إلكتروني إلى فريق Document Intelligence. إذا كان ذلك ممكناً، فشارك مستنداً نموذجياً مع تمييز المشكلة.