كيفية استخدام تلخيص النص (معاينة)

هام

ميزة التلخيص الاستخراجي هي إمكانية معاينة مقدمة "كما هي" و "مع جميع الأخطاء". على هذا النحو ، لا ينبغي تنفيذ التلخيص الاستخراجي (المعاينة) أو نشره في أي استخدام إنتاجي. العميل هو المسؤول الوحيد عن أي استخدام للتلخيص الاستخراجي.

بشكل عام ، هناك طريقتان للتلخيص التلقائي للنص: الاستخراجية والتجريدية. توفر واجهة برمجة التطبيقات هذه تلخيصا استخراجيا.

التلخيص الاستخراجي هو ميزة تنتج ملخصا عن طريق استخراج الجمل التي تمثل بشكل جماعي أهم المعلومات أو ذات الصلة داخل المحتوى الأصلي.

تم تصميم هذه الميزة لتقصير المحتوى الذي يعتبره المستخدمون وقتا طويلا جدا للقراءة. التلخيص الاستخراجي يكثف المقالات أو الأوراق أو المستندات إلى جمل رئيسية.

يتم توفير نماذج الذكاء الاصطناعي التي تستخدمها API بواسطة الخدمة، ما عليك سوى إرسال المحتوى للتحليل.

الميزات

تلميح

إذا كنت ترغب في الشروع في استخدام هذه الميزة، يمكنك متابعة مقال التشغيل السريع للبدء. كما يمكنك أيضاً تقديم طلبات المثال باستخدام Language Studio دون الحاجة إلى كتابة التعليمات البرمجية.

تستخدم واجهة برمجة تطبيقات التلخيص الاستخراجي تقنيات معالجة اللغة الطبيعية لتحديد موقع الجمل الرئيسية في مستند نصي غير منظم. تنقل هذه الجمل بشكل جماعي الفكرة الرئيسية للوثيقة.

يقوم التلخيص الاستخراجي بإرجاع درجة الرتبة كجزء من استجابة النظام إلى جانب الجمل المستخرجة وموقعها في المستندات الأصلية. درجة الرتبة هي مؤشر على مدى أهمية الجملة ، للفكرة الرئيسية للوثيقة. يعطي النموذج درجة تتراوح بين 0 و 1 (شاملة) لكل جملة وإرجاع أعلى الجمل الحاصلة على أعلى درجة لكل طلب. على سبيل المثال، إذا طلبت ملخصا من ثلاث جمل، فستعرض الخدمة الجمل الثلاث الأعلى درجة.

هناك ميزة أخرى في Azure Cognitive Service for Language ، وهي استخراج العبارات الرئيسية ، والتي يمكنها استخراج المعلومات الأساسية. عند اتخاذ قرار بين استخراج العبارة الرئيسية والتلخيص الاستخراجي ، ضع في اعتبارك ما يلي:

  • يؤدي استخراج العبارة الرئيسية إلى إرجاع العبارات بينما يقوم التلخيص الاستخراجي بإرجاع الجمل
  • يقوم التلخيص الاستخراجي بإرجاع الجمل مع درجة الرتبة، و. سيتم إرجاع الجمل الأعلى مرتبة لكل طلب
  • يقوم التلخيص الاستخراجي أيضا بإرجاع المعلومات الموضعية التالية:
    • الإزاحة: موضع البداية لكل جملة مستخرجة، و
    • الطول: هو طول كل جملة مستخرجة.

تحديد كيفية معالجة البيانات (اختياري)

تحديد نموذج تلخيص النص

بشكل افتراضي، سيستخدم ملخص النص أحدث طراز الذكاء الاصطناعي متاح على النص. يمكنك أيضا تكوين طلبات واجهة برمجة التطبيقات لاستخدام إصدار طراز معين.

لغات الإدخال

عند إرسال المستندات لتتم معالجتها عن طريق استخراج العبارة الرئيسية، يمكنك تحديد أي من اللغات المدعومة المكتوبة بها. قد ترجع API الإزاحات في الاستجابة لدعم ترميزات متعددة اللغات وذات رموز تعبيريةمختلفة.

إرسال البيانات

يمكنك إرسال المستندات إلى واجهة برمجة التطبيقات كسلاسل من النص. يتم إجراء التحليل عند استلام الطلب. نظرا لأن واجهة برمجة التطبيقات غير متزامنة، فقد يكون هناك تأخير بين إرسال طلب واجهة برمجة تطبيقات وتلقي النتائج.

عند استخدام هذه الميزة، تتوفر نتائج واجهة برمجة التطبيقات لمدة 24 ساعة من وقت تناول الطلب، ويشار إليها في الاستجابة. بعد هذه الفترة الزمنية، تُزال النتائج ولا تصبح متاحة للاسترجاع.

يمكنك استخدام المعلمة لتحديد عدد الجمل التي سيتم إرجاعها ، مع 3 كونها الافتراضيةsentenceCount. النطاق من 1 إلى 20.

يمكنك أيضا استخدام المعلمة sortby لتحديد الترتيب الذي سيتم به إرجاع الجمل المستخرجة - إما Offset أو Rank، مع Offset كونها الافتراضية.

قيمة المعلمة الوصف
الرتبة ترتيب الجمل وفقا لصلتها بوثيقة الإدخال ، على النحو الذي تقرره الخدمة.
الإزاحة يحافظ على الترتيب الأصلي الذي تظهر به الجمل في مستند الإدخال.

الحصول على نتائج تلخيص النص

عندما تحصل على نتائج من "Language Detection"، يمكنك دفق النتائج إلى تطبيق ما أو حفظ المخرج في ملف على النظام المحلي.

فيما يلي مثال على المحتوى الذي قد ترسله للتلخيص ، والذي يتم استخراجه باستخدام مقالة مدونة Microsoft تمثيل شامل نحو الذكاء الاصطناعي التكاملية. هذه المقالة ليست سوى مثال ، يمكن لواجهة برمجة التطبيقات قبول نص إدخال أطول بكثير. راجع قسم حدود البيانات لمزيد من المعلومات.

"في Microsoft ، كنا نسعى إلى تطوير الذكاء الاصطناعي يتجاوز التقنيات الحالية ، من خلال اتباع نهج أكثر شمولية وتركيزا على الإنسان للتعلم والفهم. بصفتي الرئيس التنفيذي للتكنولوجيا في Azure الذكاء الاصطناعي Cognitive Services ، كنت أعمل مع فريق من العلماء والمهندسين المذهلين لتحويل هذا المسعى إلى حقيقة واقعة. في دوري ، أستمتع بمنظور فريد في عرض العلاقة بين ثلاث سمات للإدراك البشري: النص أحادي اللغة (X) ، والإشارات الحسية الصوتية أو البصرية ، (Y) ومتعدد اللغات (Z). عند تقاطع الثلاثة ، هناك سحر - ما نسميه رمز XYZ كما هو موضح في الشكل 1 - تمثيل مشترك لإنشاء الذكاء الاصطناعي أكثر قوة يمكنها التحدث والاستماع والرؤية وفهم البشر بشكل أفضل. نعتقد أن XYZ-code سيمكننا من تحقيق رؤيتنا طويلة الأجل: التعلم عبر النقل عبر المجالات ، وتمتد عبر الطرائق واللغات. والهدف من ذلك هو الحصول على نماذج مدربة مسبقا يمكنها أن تتعلم بشكل مشترك التمثيلات لدعم مجموعة واسعة من المهام الذكاء الاصطناعي في المراحل النهائية ، تماما كما يفعل البشر اليوم. على مدى السنوات الخمس الماضية، حققنا أداء بشريا على معايير في التعرف على الكلام التحادثي، والترجمة الآلية، والإجابة على الأسئلة التحادثية، وفهم القراءة الآلية، والتعليق على الصور. وقد زودتنا هذه الإنجازات الخمسة بإشارات قوية نحو طموحنا الأكثر طموحا لتحقيق قفزة في قدرات الذكاء الاصطناعي، وتحقيق تعلم متعدد الحواس واللغات يتماشى بشكل أوثق مع كيفية تعلم البشر وفهمهم. أعتقد أن رمز XYZ المشترك هو عنصر أساسي في هذا الطموح ، إذا كان يستند إلى مصادر المعرفة الخارجية في مهام الذكاء الاصطناعي المصب ".

يتم تنفيذ واجهة برمجة تطبيقات التلخيص الاستخراجي عند استلام الطلب عن طريق إنشاء وظيفة للواجهة الخلفية لواجهة برمجة التطبيقات. إذا نجحت المهمة ، إرجاع إخراج واجهة برمجة التطبيقات. سيكون الناتج متاحا للاسترجاع لمدة 24 ساعة. بعد هذا الوقت ، يتم تطهير الإخراج. نظرًا لدعم تعدد اللغات والرموز التعبيرية، قد تحتوي الاستجابة على إزاحات نصية. راجع كيفية معالجة التعويضات لمزيد من المعلومات.

باستخدام المثال أعلاه، قد تعرض واجهة برمجة التطبيقات الجمل الموجزة التالية:

"في Microsoft ، كنا نسعى إلى تطوير الذكاء الاصطناعي يتجاوز التقنيات الحالية ، من خلال اتباع نهج أكثر شمولية وتركيزا على الإنسان للتعلم والفهم."

"في دوري ، أستمتع بمنظور فريد في رؤية العلاقة بين ثلاث سمات للإدراك البشري: النص أحادي اللغة (X) ، والإشارات الحسية الصوتية أو البصرية ، (Y) ومتعددة اللغات (Z)."

"عند تقاطع الثلاثة ، هناك سحر - ما نسميه XYZ-code كما هو موضح في الشكل 1 - تمثيل مشترك لإنشاء الذكاء الاصطناعي أكثر قوة يمكنها التحدث والاستماع والرؤية وفهم البشر بشكل أفضل."

حدود الخدمة والبيانات

للحصول على معلومات حول حجم وعدد الطلبات التي يمكنك إرسالها في الدقيقة والثانية، راجع مقالة حدود الخدمة .

راجع أيضًا