إمكانات الوظيفة الإضافية "تحليل معلومات المستند"
هام
- توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
- قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
- إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
- يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
- شرق الولايات المتحدة
- غرب الولايات المتحدة 2
- غرب أوروبا
ينطبق هذا المحتوى على:v4.0 (معاينة) | الإصدارات السابقة:v3.1 (GA)
ينطبق هذا المحتوى على:v3.1 (GA) | أحدث إصدار:v4.0 (معاينة)
إشعار
تتوفر قدرات الوظيفة الإضافية داخل جميع النماذج باستثناء نموذج بطاقة العمل.
القدرات
يدعم Document Intelligence قدرات تحليل أكثر تعقيدا ونمطية. استخدم ميزات الوظيفة الإضافية لتوسيع النتائج لتضمين المزيد من الميزات المستخرجة من مستنداتك. تتحمل بعض ميزات الوظيفة الإضافية تكلفة إضافية. يمكن تمكين هذه الميزات الاختيارية وتعطيلها استنادا إلى سيناريو استخراج المستند. لتمكين ميزة، أضف اسم الميزة المقترنة features
إلى خاصية سلسلة الاستعلام. يمكنك تمكين أكثر من ميزة إضافية واحدة على طلب من خلال توفير قائمة ميزات مفصولة بفواصل. تتوفر إمكانيات الوظيفة الإضافية التالية للإصدارات 2023-07-31 (GA)
اللاحقة.
إشعار
لا تدعم جميع النماذج جميع قدرات الوظائف الإضافية. لمزيد من المعلومات، راجعاستخراج بيانات النموذج.
تتوفر إمكانات الوظيفة الإضافية التالية للإصدارات2024-02-29-preview
2024-02-29-preview
اللاحقة و و:
إشعار
يختلف تنفيذ حقول الاستعلام في واجهة برمجة التطبيقات 2023-10-30-preview عن إصدار المعاينة الأخير. والتنفيذ الجديد أقل تكلفة ويعمل بشكل جيد مع الوثائق المنظمة.
توفر الإصدار
إمكانية الوظيفة الإضافية | وظيفة إضافية/مجانية | معاينة 2024-02-29 | 2023-07-31 (GA) |
2022-08-31 (GA) |
الإصدار 2.1 (GA) |
---|---|---|---|---|---|
استخراج خاصية الخط | الوظيفة الإضافية | ✔️ | ✔️ | غير متوفر | غير متوفر |
استخراج الصيغة | الوظيفة الإضافية | ✔️ | ✔️ | غير متوفر | غير متوفر |
استخراج عالي الدقة | الوظيفة الإضافية | ✔️ | ✔️ | غير متوفر | غير متوفر |
استخراج الرمز الشريطي | مجاني | ✔️ | ✔️ | غير متوفر | غير متوفر |
اكتشاف اللغات | مجاني | ✔️ | ✔️ | غير متوفر | غير متوفر |
أزواج القيمة الرئيسية | مجاني | ✔️ | غير متوفر | غير متوفر | غير متوفر |
حقول الاستعلام | الوظيفة الإضافية* | ✔️ | غير متوفر | غير متوفر | غير متوفر |
✱ الوظيفة الإضافية - يتم تسعير حقول الاستعلام بشكل مختلف عن ميزات الوظيفة الإضافية الأخرى. للحصول على تفاصيل؛ تأكد من مراجعة الأسعار.
تنسيقات الملفات المعتمدة
PDF
الصور:
JPEG
/JPG
،PNG
،BMP
، ،TIFF
HEIF
✱ ملفات Microsoft Office غير مدعومة حاليا.
استخراج عالي الدقة
تمثل مهمة التعرف على النص الصغير من مستندات كبيرة الحجم، مثل الرسومات الهندسية، تحديا. غالبا ما يكون النص مختلطا بعناصر رسومية أخرى ويحتوي على خطوط وأحجام واتجاهات مختلفة. علاوة على ذلك، يمكن تقسيم النص إلى أجزاء منفصلة أو توصيله بالرموز الأخرى. يدعم Document Intelligence الآن استخراج المحتوى من هذه الأنواع من المستندات بالقدرة ocr.highResolution
. يمكنك الحصول على جودة محسنة لاستخراج المحتوى من مستندات A1/A2/A3 عن طريق تمكين إمكانية الوظيفة الإضافية هذه.
واجهة برمجة تطبيقات REST
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=ocrHighResolution
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=ocrHighResolution
استخراج الصيغة
تستخرج ocr.formula
القدرة كافة الصيغ المحددة، مثل المعادلات الرياضية، في formulas
المجموعة ككائن المستوى الأعلى ضمن content
. داخل content
، يتم تمثيل الصيغ المكتشفة ك :formula:
. يمثل كل إدخال في هذه المجموعة صيغة تتضمن نوع الصيغة ك inline
أو display
، وتمثيل LaTeX الخاص بها جنبا value
إلى جنب مع إحداثياتها polygon
. في البداية، تظهر الصيغ في نهاية كل صفحة.
إشعار
confidence
النتيجة مضمنة.
"content": ":formula:",
"pages": [
{
"pageNumber": 1,
"formulas": [
{
"kind": "inline",
"value": "\\frac { \\partial a } { \\partial b }",
"polygon": [...],
"span": {...},
"confidence": 0.99
},
{
"kind": "display",
"value": "y = a \\times b + a \\times c",
"polygon": [...],
"span": {...},
"confidence": 0.99
}
]
}
]
واجهة برمجة تطبيقات REST
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=formulas
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=formulas
استخراج خاصية الخط
تستخرج ocr.font
الإمكانية كافة خصائص الخط للنص المستخرج في styles
المجموعة ككائن من المستوى الأعلى ضمن content
. يحدد كل كائن نمط خاصية خط واحد، والنص الذي ينطبق عليه، ودرجة الثقة المقابلة له. يتم توسيع خاصية النمط الموجودة مع المزيد من خصائص الخط مثل similarFontFamily
خط النص، fontStyle
للأنماط مثل المائل والعادي، fontWeight
للغامق أو العادي، color
ولون النص، ولون backgroundColor
مربع إحاطة النص.
"content": "Foo bar",
"styles": [
{
"similarFontFamily": "Arial, sans-serif",
"spans": [ { "offset": 0, "length": 3 } ],
"confidence": 0.98
},
{
"similarFontFamily": "Times New Roman, serif",
"spans": [ { "offset": 4, "length": 3 } ],
"confidence": 0.98
},
{
"fontStyle": "italic",
"spans": [ { "offset": 1, "length": 2 } ],
"confidence": 0.98
},
{
"fontWeight": "bold",
"spans": [ { "offset": 2, "length": 3 } ],
"confidence": 0.98
},
{
"color": "#FF0000",
"spans": [ { "offset": 4, "length": 2 } ],
"confidence": 0.98
},
{
"backgroundColor": "#00FF00",
"spans": [ { "offset": 5, "length": 2 } ],
"confidence": 0.98
}
]
واجهة برمجة تطبيقات REST
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=styleFont
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=styleFont
استخراج خاصية الرمز الشريطي
تستخرج ocr.barcode
القدرة جميع الرموز الشريطية المحددة في barcodes
المجموعة ككائن المستوى الأعلى ضمن content
. content
داخل ، يتم تمثيل الرموز الشريطية المكتشفة ك :barcode:
. يمثل كل إدخال في هذه المجموعة رمزا شريطيا ويتضمن نوع الرمز الشريطي ك kind
ومحتوى الرمز الشريطي المضمن جنبا value
إلى جنب مع إحداثياته polygon
. في البداية، تظهر الرموز الشريطية في نهاية كل صفحة. هو confidence
تعليمات برمجية مضمنة ل ك 1.
أنواع الرموز الشريطية المدعومة
نوع الرمز الشريطي | مثال |
---|---|
QR Code |
|
Code 39 |
|
Code 93 |
|
Code 128 |
|
UPC (UPC-A & UPC-E) |
|
PDF417 |
|
EAN-8 |
|
EAN-13 |
|
Codabar |
|
Databar |
|
Databar توسيع |
|
ITF |
|
Data Matrix |
واجهة برمجة تطبيقات REST
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=barcodes
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=barcodes
اكتشاف اللغات
تؤدي إضافة الميزة languages
إلى الطلب إلى analyzeResult
توقع اللغة الأساسية المكتشفة لكل سطر نص مع confidence
في languages
المجموعة ضمن analyzeResult
.
"languages": [
{
"spans": [
{
"offset": 0,
"length": 131
}
],
"locale": "en",
"confidence": 0.7
},
]
واجهة برمجة تطبيقات REST
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=languages
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=languages
أزواج قيم المفاتيح
في إصدارات واجهة برمجة التطبيقات السابقة، استخرج نموذج المستند الذي تم إنشاؤه مسبقا أزواج قيم المفاتيح من النماذج والمستندات. مع إضافة الميزة keyValuePairs
إلى تخطيط مسبق الإنشاء، ينتج الآن نموذج التخطيط نفس النتائج.
أزواج قيم المفتاح هي امتدادات محددة داخل المستند تحدد التسمية أو المفتاح والاستجابة أو القيمة المرتبطة به. في شكل منظم، يمكن أن تكون هذه الأزواج هي التسمية والقيمة التي أدخلها المستخدم لهذا الحقل. في مستند غير منظم، يمكن أن يكون هذا هو التاريخ الذي تم فيه تنفيذ العقد بناءً على النص الموجود في فقرة. يتم تدريب نموذج الذكاء الاصطناعي على استخراج مفاتيح وقيم قابلة للتعريف استنادًا إلى مجموعة متنوعة من أنواع المستندات والتنسيقات والهياكل.
يمكن أيضًا أن توجد المفاتيح بشكل منفصل عندما يكتشف النموذج وجود مفتاح، بدون قيمة مرتبطة أو عند معالجة الحقول الاختيارية. على سبيل المثال، يمكن ترك حقل الاسم الأوسط فارغا في نموذج في بعض الحالات. تكون أزواج قيم المفاتيح عبارة عن امتداد للنص الموجود في المستند. بالنسبة للمستندات التي يتم وصف نفس القيمة فيها بطرق مختلفة، على سبيل المثال، العميل/المستخدم، يكون المفتاح المقترن إما عميلا أو مستخدما (استنادا إلى السياق).
واجهة برمجة تطبيقات REST
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=keyValuePairs
حقول الاستعلام
حقول الاستعلام هي إمكانية إضافية لتوسيع المخطط المستخرج من أي نموذج تم إنشاؤه مسبقا أو تحديد اسم مفتاح معين عندما يكون اسم المفتاح متغيرا. لاستخدام حقول الاستعلام، قم بتعيين الميزات إلى queryFields
وتوفير قائمة مفصولة بفواصل بأسماء الحقول في الخاصية queryFields
.
يدعم Document Intelligence الآن عمليات استخراج حقل الاستعلام. باستخدام استخراج حقل الاستعلام، يمكنك إضافة حقول إلى عملية الاستخراج باستخدام طلب استعلام دون الحاجة إلى تدريب إضافي.
استخدم حقول الاستعلام عندما تحتاج إلى توسيع مخطط نموذج تم إنشاؤه مسبقا أو مخصص أو تحتاج إلى استخراج بعض الحقول باستخدام إخراج التخطيط.
حقول الاستعلام هي إمكانية إضافية متميزة. للحصول على أفضل النتائج، حدد الحقول التي تريد استخراجها باستخدام حالة الجمل أو أسماء حقول حالة باسكال لأسماء الحقول متعددة الكلمات.
تدعم حقول الاستعلام 20 حقلا كحد أقصى لكل طلب. إذا احتوى المستند على قيمة للحقل، فسيتم إرجاع الحقل والقيمة.
يحتوي هذا الإصدار على تنفيذ جديد لقدرة حقول الاستعلام التي يتم تسعيرها أقل من التنفيذ السابق ويجب التحقق من صحتها.
إشعار
يتوفر استخراج حقل استعلام Document Intelligence Studio حاليا مع واجهة برمجة تطبيقات التخطيط والنماذج 2024-02-29-preview
2023-10-31-preview
التي تم إنشاؤها مسبقا والإصدارات الأحدث باستثناء US tax
النماذج (نماذج W2 و1098s و1099s).
استخراج حقل الاستعلام
لاستخراج حقل الاستعلام، حدد الحقول التي تريد استخراجها وتحلل ذكاء المستند المستند وفقا لذلك. إليك مثال:
إذا كنت تعالج عقدا في Document Intelligence Studio، فاستخدم
2024-02-29-preview
الإصدارين أو2023-10-31-preview
:يمكنك تمرير قائمة تسميات الحقول مثل
Party1
وPaymentTerms
TermsOfUse
PaymentDate
Party2
TermEndDate
كجزء منanalyze document
الطلب.يمكن ل Document Intelligence تحليل بيانات الحقل واستخراجها وإرجاع القيم في إخراج JSON منظم.
بالإضافة إلى حقول الاستعلام، تتضمن الاستجابة النص والجداول وعلامات التحديد والبيانات الأخرى ذات الصلة.
واجهة برمجة تطبيقات REST
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=queryFields&queryFields=TERMS
الخطوات التالية
تعرف على المزيد: قراءة نموذج تخطيط النموذج
عينات SDK: python