تعرف على مفاهيم الإشراف على النص

استخدم نماذج الإشراف نص مشرف المحتوى لتحليل محتوى النص، مثل غرف المحادثة ومنصات المناقشة والدردشة الآلية وكتالوجات التجارة الإلكترونية والمستندات.

تتضمن استجابة الخدمة المعلومات التالية:

  • الألفاظ النابية: المطابقة المستندة إلى المصطلح مع قائمة مضمنة من المصطلحات النابية بلغات مختلفة
  • التصنيف: التصنيف بمساعدة الجهاز في ثلاث فئات
  • البيانات الشخصية
  • نص تم تصحيحه تلقائيا
  • النص الأصلي
  • اللغة

عبارات نابية

إذا اكتشفت واجهة برمجة التطبيقات أي مصطلحات نابية بأي من اللغات المدعومة، يتم تضمين هذه المصطلحات في الاستجابة. تحتوي الاستجابة أيضا على موقعها (Index) في النص الأصلي. ListId يشير في نموذج JSON التالي إلى المصطلحات الموجودة في قوائم المصطلحات المخصصة إذا كانت متوفرة.

"Terms": [
    {
        "Index": 118,
        "OriginalIndex": 118,
        "ListId": 0,
        "Term": "<offensive word>"
    }

إشعار

بالنسبة إلى معلمة language، قم بتعيين eng أو اتركها فارغة لمشاهدة استجابة التصنيف بمساعدة الآلة (ميزة المعاينة). هذه الميزة تدعم اللغة الإنجليزية فقط.

للكشف عن مصطلحات الألفاظ النابية، استخدم تعليمة برمجية ISO 639-3 للغات المدعومة المدرجة في هذه المقالة، أو اتركه فارغاً.

تصنيف

تدعم ميزة تصنيف النص بمساعدة الجهاز في مشرف المحتوى اللغة الإنجليزية فقط، وتساعد على اكتشاف المحتوى غير المرغوب فيه. قد يتم تقييم المحتوى الذي تم وضع علامة عليه على أنه غير مناسب اعتمادا على السياق. كما أنه يزيد من احتمالية كل فئة. تستخدم الميزة نموذجا مدربا لتحديد اللغة المسيئة أو المهينة أو التمييزية المحتملة. وهذا يتضمن كلمات عامية واختصارية ومتناهية والكلمات غير المفوتنة عن عمد.

يظهر الاستخراج التالي في استخراج JSON مثالا على الإخراج:

"Classification": {
    "ReviewRecommended": true,
    "Category1": {
        "Score": 1.5113095059859916E-06
    },
    "Category2": {
        "Score": 0.12747249007225037
    },
    "Category3": {
        "Score": 0.98799997568130493
    }
}

الشرح

  • Category1 يشير إلى احتمال وجود اللغة التي يمكن اعتبارها جنسية صريحة أو للكبار في بعض الحالات.
  • Category2 يشير إلى احتمال وجود اللغة التي يمكن اعتبارها موحية جنسيا أو ناضجة في بعض الحالات.
  • Category3 يشير إلى احتمال وجود لغة قد تعتبر مسيئة في حالات معينة.
  • Score بين 0 و 1. كلما ارتفعت الدرجة، كان توقع النموذج أعلى بأن الفئة قد تكون قابلة للتطبيق. تعتمد هذه الميزة على نموذج إحصائي بدلا من النتائج المشفرة يدويا. نوصي باختبار المحتوى الخاص بك لتحديد كيفية توافق كل فئة مع متطلباتك.
  • ReviewRecommended إما صحيحة أو خاطئة اعتماداً على حدود الدرجة الداخلية. يجب على العملاء تقييم ما إذا كانوا سيستخدمون هذه القيمة أو يقررون حدود مخصصة بناءً على نُهج المحتوى الخاصة بهم.

البيانات الشخصية

تكشف ميزة البيانات الشخصية عن الوجود المحتمل لهذه المعلومات:

  • عنوان البريد الإلكتروني
  • عنوان بريدي أمريكي
  • عنوان IP
  • رقم هاتف أمريكي

يوضح المثال التالي نموذج استجابة:

"pii":{
  "email":[
      {
        "detected":"abcdef@abcd.com",
        "sub_type":"Regular",
        "text":"abcdef@abcd.com",
        "index":32
      }
  ],
  "ssn":[

  ],
  "ipa":[
      {
        "sub_type":"IPV4",
        "text":"255.255.255.255",
        "index":72
      }
  ],
  "phone":[
      {
        "country_code":"US",
        "text":"6657789887",
        "index":56
      }
  ],
  "address":[
      {
        "text":"1 Microsoft Way, Redmond, WA 98052",
        "index":89
      }
  ]
}

تصحيح تلقائي

يمكن لاستجابة الإشراف على النص إرجاع النص اختياريًا مع تطبيق التصحيح التلقائي الأساسي.

على سبيل المثال، يحتوي نص الإدخال التالي على خطأ إملائي.

الثعلب البني السريع يقفز فوق الكلب الكسول.

إذا حددت تصحيحًا تلقائيًا، فستحتوي الاستجابة على الإصدار المصحح من النص:

الثعلب البني السريع يقفز فوق الكلب الكسول.

إنشاء قوائم المصطلحات المخصصة وإدارتها

في حين أن القائمة الافتراضية العمومية للمصطلحات تعمل بشكل رائع لمعظم الحالات، فقد ترغب في إجراء شاشة مقابل المصطلحات الخاصة باحتياجات عملك. على سبيل المثال، قد ترغب في تصفية أي أسماء علامات تجارية تنافسية من المنشورات بواسطة المستخدمين.

إشعار

هناك حد أقصى يبلغ قوائم المصطلحات المكونة من 5 مصطلحات بحيث لا تتجاوز كل قائمة 10000 مصطلح .

يوضح المثال التالي معرف القائمة المطابق:

"Terms": [
    {
        "Index": 118,
        "OriginalIndex": 118,
        "ListId": 231.
        "Term": "<offensive word>"
    }

يوفر مشرف المحتوى واجهة برمجة تطبيقات قائمة المصطلحات مع عمليات لإدارة قوائم المصطلحات المخصصة. تحقق من البدء السريع لقوائم المصطلحات .NET إذا كنت على دراية ب Visual Studio وC#.

الخطوات التالية

اختبر واجهات برمجة التطبيقات باستخدام التشغيل السريع.