كيفية استخدام التعرف على الكيان المسمى (NER)

يمكن لميزة NER تقييم النص غير المهيكل، واستخراج الكيانات المسماة من النص في عدة فئات محددة مسبقا، على سبيل المثال: الشخص والموقع والحدث والمنتج والمؤسسة.

خيارات التطوير

لاستخدام التعرف على الكيان المسمى، يمكنك إرسال نص أولي غير منظم للتحليل ومعالجة إخراج واجهة برمجة التطبيقات في التطبيق الخاص بك. يتم إجراء التحليل كما هو، بدون تخصيص إضافي للنموذج المستخدم في البيانات الخاصة بك. هناك طريقتان لاستخدام التعرف على الكيان المسمى:

خيار التطوير ‏‏الوصف
استوديو اللغة Language Studio هو نظام أساسي مستند إلى الويب يتيح لك محاولة ربط الكيان بأمثلة نصية بدون حساب Azure، وبياناتك الخاصة عند التسجيل. لمزيد من المعلومات، راجع موقع ويب Language Studio أو التشغيل السريع لاستوديو اللغة.
واجهة برمجة تطبيقات REST أو مكتبة العميل (Azure SDK) دمج التعرف على الكيان المسمى في تطبيقاتك باستخدام واجهة برمجة تطبيقات REST، أو مكتبة العميل المتوفرة في مجموعة متنوعة من اللغات. لمزيد من المعلومات، راجع التشغيل السريع للتعرف على الكيان المسمى.

تحديد كيفية معالجة البيانات (اختياري)

لغات الإدخال

عند إرسال المستندات التي ستتم معالجتها، يمكنك تحديد أي من اللغات المدعومة التي تتم كتابتها بها. إذا لم تحدد لغة، فسيتم تعيين استخراج العبارة الرئيسية افتراضيا إلى اللغة الإنجليزية. قد ترجع API الإزاحات في الاستجابة لدعم ترميزات متعددة اللغات وذات رموز تعبيريةمختلفة.

إرسال البيانات

يتم إجراء التحليل عند استلام الطلب. استخدام ميزة NER بشكل متزامن هو عديم الحالة. لا يتم تخزين أي بيانات في حسابك، ويتم إرجاع النتائج على الفور في الرد.

عند استخدام هذه الميزة بشكل غير متزامن، تتوفر نتائج واجهة برمجة التطبيقات لمدة 24 ساعة من وقت إدخال الطلب، ويشار إليها في الرد. بعد هذه الفترة الزمنية، تُزال النتائج ولا تصبح متاحة للاسترجاع.

تحاول واجهة برمجة التطبيقات الكشف عن فئات الكيان المعرفة للغة مستند معينة.

الحصول على النتائج الخاصة بـ NER

عندما تحصل على نتائج من NER، يمكنك دفق النتائج إلى تطبيق أو حفظ الإخراج في ملف على النظام المحلي. ستتضمن استجابة واجهة برمجة التطبيقات كيانات معترف بها، بما في ذلك فئاتها وفئاتها الفرعية ودرجات الثقة.

حدد الكيانات التي سيتم إرجاعها (معاينة واجهة برمجة التطبيقات فقط)

بدءا من إصدار واجهة برمجة التطبيقات 2023-04-15-preview، تحاول واجهة برمجة التطبيقات اكتشاف أنواع الكيانات المعرفة وعلاماتها للغة مستند معينة. تحل أنواع الكيانات وعلاماتها محل الفئات والفئات الفرعية التي تستخدمها النماذج القديمة لتحديد الكيانات لمزيد من المرونة. يمكنك أيضا تحديد الكيانات التي يتم الكشف عنها وإرجاعها، واستخدام المعلمات الاختيارية includeList والمعلمات excludeList مع أنواع الكيانات المناسبة. سيكتشف المثال التالي فقط Location. يمكنك تحديد نوع كيان واحد أو أكثر لإرجاعه. نظرا لأنواع وعلامات التسلسل الهرمي المقدم لهذا الإصدار، لديك المرونة للتصفية على مستويات دقة مختلفة على النحو التالي:

الإدخال:

إشعار

في هذا المثال، يقوم بإرجاع نوع كيان الموقع فقط.

{
    "kind": "EntityRecognition",
    "parameters": 
    {
        "includeList" :
        [
            "Location"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

قد ترجع الأمثلة أعلاه الكيانات التي تقع ضمن Location نوع الكيان مثل StructuralGPEالكيانات الموسومة و و Geological كما هو موضح بواسطة أنواع الكيانات وعلاماتها. يمكننا أيضا تصفية الكيانات التي تم إرجاعها عن طريق التصفية باستخدام إحدى علامات Location الكيان لنوع الكيان مثل التصفية عبر GPE العلامة فقط كما هو موضح:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ]
    }
    

يقوم هذا الأسلوب بإرجاع كافة Location الكيانات التي تقع تحت العلامة GPE فقط وتجاهل أي كيان آخر يقع ضمن Location النوع الذي تم وضع علامة عليه مع أي علامة كيان أخرى مثل Structural أو Geological الكيانات ذات Location العلامات. يمكننا أيضا إجراء المزيد من التعمق في نتائجنا باستخدام المعلمة excludeList . GPEيمكن وضع علامة على الكيانات ذات العلامات التالية: City، State، ، CountryRegion. Continent يمكننا، على سبيل المثال، استبعاد Continent وعلامات CountryRegion لمثالنا:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ],
        "excludeList": :
        [
            "Continent",
            "CountryRegion"
        ]
    }
    

باستخدام هذه المعلمات يمكننا التصفية بنجاح على أنواع الكيانات فقط Location ، نظرا لأن GPE علامة الكيان المضمنة في المعلمة includeListLocation ، تقع ضمن النوع . ثم نقوم بالتصفية على الكيانات الجيوسياسية فقط واستبعاد أي كيانات تم وضع علامة عليها Continent أو CountryRegion العلامات.

حدد نموذج NER

بشكل افتراضي، تستخدم هذه الميزة أحدث نموذج الذكاء الاصطناعي متوفر على النص. يمكنك أيضًا تكوين طلبات واجهة برمجة التطبيقات لاستخدام إصدار نموذج معين.

حدود الخدمة والبيانات

للحصول على معلومات حول حجم الطلبات التي يمكنك إرسالها في الدقيقة والثانية وعددها، راجع مقال حدود البيانات.

الخطوات التالية

نظرة عامة على التعرف على الكيانات المسماة