كيفية استخدام التعرف على الكيان المسمى (NER)
يمكن لميزة NER تقييم النص غير المهيكل، واستخراج الكيانات المسماة من النص في عدة فئات محددة مسبقا، على سبيل المثال: الشخص والموقع والحدث والمنتج والمؤسسة.
خيارات التطوير
لاستخدام التعرف على الكيان المسمى، يمكنك إرسال نص أولي غير منظم للتحليل ومعالجة إخراج واجهة برمجة التطبيقات في التطبيق الخاص بك. يتم إجراء التحليل كما هو، بدون تخصيص إضافي للنموذج المستخدم في البيانات الخاصة بك. هناك طريقتان لاستخدام التعرف على الكيان المسمى:
خيار التطوير | الوصف |
---|---|
استوديو اللغة | Language Studio هو نظام أساسي مستند إلى الويب يتيح لك محاولة ربط الكيان بأمثلة نصية بدون حساب Azure، وبياناتك الخاصة عند التسجيل. لمزيد من المعلومات، راجع موقع ويب Language Studio أو التشغيل السريع لاستوديو اللغة. |
واجهة برمجة تطبيقات REST أو مكتبة العميل (Azure SDK) | دمج التعرف على الكيان المسمى في تطبيقاتك باستخدام واجهة برمجة تطبيقات REST، أو مكتبة العميل المتوفرة في مجموعة متنوعة من اللغات. لمزيد من المعلومات، راجع التشغيل السريع للتعرف على الكيان المسمى. |
تحديد كيفية معالجة البيانات (اختياري)
لغات الإدخال
عند إرسال المستندات التي ستتم معالجتها، يمكنك تحديد أي من اللغات المدعومة التي تتم كتابتها بها. إذا لم تحدد لغة، فسيتم تعيين استخراج العبارة الرئيسية افتراضيا إلى اللغة الإنجليزية. قد ترجع API الإزاحات في الاستجابة لدعم ترميزات متعددة اللغات وذات رموز تعبيريةمختلفة.
إرسال البيانات
يتم إجراء التحليل عند استلام الطلب. استخدام ميزة NER بشكل متزامن هو عديم الحالة. لا يتم تخزين أي بيانات في حسابك، ويتم إرجاع النتائج على الفور في الرد.
عند استخدام هذه الميزة بشكل غير متزامن، تتوفر نتائج واجهة برمجة التطبيقات لمدة 24 ساعة من وقت إدخال الطلب، ويشار إليها في الرد. بعد هذه الفترة الزمنية، تُزال النتائج ولا تصبح متاحة للاسترجاع.
تحاول واجهة برمجة التطبيقات الكشف عن فئات الكيان المعرفة للغة مستند معينة.
الحصول على النتائج الخاصة بـ NER
عندما تحصل على نتائج من NER، يمكنك دفق النتائج إلى تطبيق أو حفظ الإخراج في ملف على النظام المحلي. ستتضمن استجابة واجهة برمجة التطبيقات كيانات معترف بها، بما في ذلك فئاتها وفئاتها الفرعية ودرجات الثقة.
حدد الكيانات التي سيتم إرجاعها (معاينة واجهة برمجة التطبيقات فقط)
بدءا من إصدار واجهة برمجة التطبيقات 2023-04-15-preview، تحاول واجهة برمجة التطبيقات اكتشاف أنواع الكيانات المعرفة وعلاماتها للغة مستند معينة. تحل أنواع الكيانات وعلاماتها محل الفئات والفئات الفرعية التي تستخدمها النماذج القديمة لتحديد الكيانات لمزيد من المرونة. يمكنك أيضا تحديد الكيانات التي يتم الكشف عنها وإرجاعها، واستخدام المعلمات الاختيارية includeList
والمعلمات excludeList
مع أنواع الكيانات المناسبة. سيكتشف المثال التالي فقط Location
. يمكنك تحديد نوع كيان واحد أو أكثر لإرجاعه. نظرا لأنواع وعلامات التسلسل الهرمي المقدم لهذا الإصدار، لديك المرونة للتصفية على مستويات دقة مختلفة على النحو التالي:
الإدخال:
إشعار
في هذا المثال، يقوم بإرجاع نوع كيان الموقع فقط.
{
"kind": "EntityRecognition",
"parameters":
{
"includeList" :
[
"Location"
]
},
"analysisInput":
{
"documents":
[
{
"id":"1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
قد ترجع الأمثلة أعلاه الكيانات التي تقع ضمن Location
نوع الكيان مثل Structural
GPE
الكيانات الموسومة و و Geological
كما هو موضح بواسطة أنواع الكيانات وعلاماتها. يمكننا أيضا تصفية الكيانات التي تم إرجاعها عن طريق التصفية باستخدام إحدى علامات Location
الكيان لنوع الكيان مثل التصفية عبر GPE
العلامة فقط كما هو موضح:
"parameters":
{
"includeList" :
[
"GPE"
]
}
يقوم هذا الأسلوب بإرجاع كافة Location
الكيانات التي تقع تحت العلامة GPE
فقط وتجاهل أي كيان آخر يقع ضمن Location
النوع الذي تم وضع علامة عليه مع أي علامة كيان أخرى مثل Structural
أو Geological
الكيانات ذات Location
العلامات. يمكننا أيضا إجراء المزيد من التعمق في نتائجنا باستخدام المعلمة excludeList
. GPE
يمكن وضع علامة على الكيانات ذات العلامات التالية: City
، State
، ، CountryRegion
. Continent
يمكننا، على سبيل المثال، استبعاد Continent
وعلامات CountryRegion
لمثالنا:
"parameters":
{
"includeList" :
[
"GPE"
],
"excludeList": :
[
"Continent",
"CountryRegion"
]
}
باستخدام هذه المعلمات يمكننا التصفية بنجاح على أنواع الكيانات فقط Location
، نظرا لأن GPE
علامة الكيان المضمنة في المعلمة includeList
Location
، تقع ضمن النوع . ثم نقوم بالتصفية على الكيانات الجيوسياسية فقط واستبعاد أي كيانات تم وضع علامة عليها Continent
أو CountryRegion
العلامات.
حدد نموذج NER
بشكل افتراضي، تستخدم هذه الميزة أحدث نموذج الذكاء الاصطناعي متوفر على النص. يمكنك أيضًا تكوين طلبات واجهة برمجة التطبيقات لاستخدام إصدار نموذج معين.
حدود الخدمة والبيانات
للحصول على معلومات حول حجم الطلبات التي يمكنك إرسالها في الدقيقة والثانية وعددها، راجع مقال حدود البيانات.