وضع علامة على البيانات النصية لتدريب النموذج الخاص بك
قبل إنشاء نموذج تصنيف نص مخصص، يجب أن تكون قد وضعت علامة على البيانات أولا. إذا لم تتم الإشارة إلى بياناتك بالفعل، يمكنك وضع علامة عليها في استوديو اللغة. وتعلم البيانات الموسومة النموذج بكيفية تفسير النص، وتستخدم للتدريب والتقييم.
المتطلبات الأساسية
قبل أن تتمكن من وضع علامة على البيانات، تحتاج إلى:
- مشروع تم إنشاؤه بنجاح باستخدام حساب تخزين Azure blob تم تكوينه،
- البيانات النصية التي تم تحميلها إلى حساب التخزين الخاص بك.
راجع دورة حياة تطوير التطبيقات لمزيد من المعلومات.
وضع علامة على بياناتك
بعد تحميل بيانات التدريب إلى حساب تخزين Azure الخاص بك، ستحتاج إلى وضع علامة عليها، حتى يعرف نموذجك الكلمات التي سيتم ربطها بالفصول الدراسية التي تحتاجها. عند وضع علامة على البيانات في Language Studio (أو وضع علامة على بياناتك يدويا)، سيتم تخزين هذه العلامات بتنسيق JSON الذي سيستخدمه نموذجك أثناء التدريب.
عند وضع علامة على بياناتك، ضع في اعتبارك ما يلي:
بشكل عام ، تؤدي البيانات ذات العلامات الأكثر إلى نتائج أفضل ، شريطة أن يتم وضع علامة على البيانات بدقة.
على الرغم من أننا أوصينا بوجود حوالي 50 ملفا موسوما لكل فئة، إلا أنه لا يوجد رقم ثابت يمكن أن يضمن أداء النموذج الخاص بك بشكل أفضل، لأن أداء النموذج يعتمد أيضا على الغموض المحتمل في المخطط وجودة البيانات التي تم وضع علامة عليها.
اتبع الخطوات التالية لوضع علامة على بياناتك
انتقل إلى صفحة المشروع في Language Studio.
من القائمة على الجانب الأيمن، اختر وضع علامة على البيانات
يمكنك العثور على قائمة بجميع ملفات .txt المتوفرة في مشاريعك على اليسار. يمكنك تحديد الملف الذي تريد بدء وضع علامة عليه أو يمكنك استخدام الزر " رجوع " و "التالي " من أسفل الصفحة للتنقل.
يمكنك إما عرض كافة الملفات أو الملفات ذات العلامات فقط عن طريق تغيير طريقة العرض من القائمة المنسدلة عرض .
ملاحظة
إذا قمت بتمكين لغات متعددة لمشروعك، فستجد قائمة منسدلة لغة إضافية. حدد لغة كل مستند.
قبل البدء في وضع العلامات، أضف فصولا إلى مشروعك من الزاوية العلوية اليسرى
ابدأ في وضع علامات على ملفاتك. في الصور أدناه:
القسم 1: هو المكان الذي يتم فيه عرض محتوى الملف النصي.
القسم 2: يتضمن فئات مشروعك وتوزيعه عبر ملفاتك وعلاماتك.
القسم 3 هو تبديل بيانات المشروع المقسمة. يمكنك اختيار إضافة الملف النصي المحدد إلى مجموعة التدريب أو مجموعة الاختبار. بشكل افتراضي، يتم إيقاف تشغيل مفتاح التبديل، وتتم إضافة جميع الملفات النصية إلى مجموعة التدريب الخاصة بك.
تصنيف تسمية واحدة: لا يمكن وضع علامة على ملفك إلا بفئة واحدة ؛ يمكنك القيام بذلك عن طريق تحديد أحد الأزرار الموجودة بجوار الفصل الدراسي الذي تريد وضع علامة على هذا الملف به.
تصنيف التسميات المتعددة: يمكن تمييز ملفك بفئات متعددة، ويمكنك القيام بذلك عن طريق تحديد جميع خانات الاختيار القابلة للتطبيق بجوار الفئات التي تريد وضع علامة على هذا الملف بها.
بالنسبة إلى قسم التوزيع، يمكنك عرض توزيع الفصل الدراسي عبر مجموعات التدريب والاختبار.
لإضافة ملف نصي إلى مجموعة تدريب أو اختبار، استخدم الأزرار اختر المجموعة التي ينتمي إليها.
تلميح
يوصى بتحديد مجموعة الاختبار الخاصة بك.
سيتم حفظ التغييرات التي أجريتها بشكل دوري عند إضافة العلامات. إذا لم يتم حفظها بعد ، فستجد تحذيرا في أعلى صفحتك. إذا كنت تريد الحفظ يدويا، فحدد حفظ العلامات في أعلى الصفحة.
إزالة العلامات
إذا كنت تريد إزالة علامة، فألغ تحديد الزر المجاور للفصل.
حذف أو فصول دراسية
لحذف/إعادة تسمية فئة،
- حدد الفصل الذي تريد تحريره من القائمة الجانبية اليمنى
- انقر على النقاط الثلاث وحدد الخيار الذي تريده من القائمة المنسدلة.
الخطوات التالية
بعد وضع علامة على بياناتك، يمكنك البدء في تدريب نموذج سيتعلم استنادا إلى بياناتك.



